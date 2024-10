Por Nate Cohn

En el último mes, una decisión metodológica parece haber producido dos universos paralelos de encuestas políticas.

En un universo, Kamala Harris lidera por solo un poco en el voto popular nacional contra Donald Trump, incluso cuando mantiene una ventaja discernible en los campos de batalla del norte. Las cifras son sorprendentemente similares a las de las elecciones de 2022.

En la otra, Harris tiene una clara ventaja en el voto nacional, pero los campos de batalla están muy apretados. Es esencialmente una repetición de las elecciones de 2020.

Esta división se explica casi en su totalidad al considerar si un encuestador utiliza la “ponderación del voto retrospectivo”, lo que significa tratar de tener en cuenta cómo dicen los votantes que votaron en las últimas elecciones.

Así es como funciona. En primer lugar, el encuestador pregunta a los encuestados si votaron por Joe Biden o por Trump en las últimas elecciones. Luego se utiliza una técnica estadística llamada ponderación, en la que los encuestadores dan más o menos “peso” a los encuestados de diferentes grupos demográficos, de manera que cada grupo represente a su porcentaje real de la población. En este caso, el encuestador pondera el número de votantes de Biden ’20 o Trump ’20 para que coincida con el resultado de las últimas elecciones.

Durante mucho tiempo se consideró que este enfoque era un error. Por razones que explicaremos, los encuestadores lo han evitado a lo largo de los años. Pero hoy lo usan cada vez más, en parte como forma de asegurarse de que tienen suficientes partidarios de Trump tras los sondeos fallidos de 2016 y 2020. La elección se ha convertido en una importante línea divisoria entre los encuestadores en esta elección, y ayuda a explicar el latigazo que los observadores de encuestas están experimentando día a día.

En el último mes, alrededor de dos tercios de las encuestas han ponderado el voto retrospectivo.

Una consecuencia importante —y quizás obvia— de la ponderación por voto retrospectivo es que hace que los resultados de los sondeos se parezcan más a los resultados de las elecciones de 2020. Las encuestas que no lo hacen, incluidas las del New York Times/Siena College, tienen más probabilidades de mostrar cambios claros con respecto a hace cuatro años.

Aunque las diferencias entre los dos grupos de encuestas son relativamente pequeñas, se suman a dos historias diferentes de las elecciones. Las encuestas que no tienen en cuenta el voto anterior tienden a mostrar resultados que se ajustan más al resultado de las elecciones de mitad de mandato de 2022 que al de las últimas elecciones presidenciales. También muestran que la ventaja de Trump en el Colegio Electoral, con respecto al voto popular, ha disminuido en los últimos cuatro años. Las encuestas ponderadas en función del voto pasado, por otra parte, muestran poco más que una repetición de 2020.

Gráfica 2024 sondeos promedio y resultados de 2020

[El gráfico superior muestra las encuestas ponderadas por voto retrospectivo contra aquellas sin ponderar, y los resultados de la elección en 2020]

Como veremos, se trata de una decisión delicada para los encuestadores. Por un lado, la ponderación del voto retrospectivo habría producido peores resultados en todas las elecciones presidenciales desde 2004 hasta 2020. Por otro lado, es la opción que podría salvar a los encuestadores de subestimar a Trump una vez más.

Por qué este tipo de ponderación es controvertido

Cuando empecé a seguir los debates sobre metodología de sondeos hace 20 años, la ponderación del voto retrospectivo se consideraba una muy mala idea. Un número sorprendente de encuestados no recuerdan cómo votaron; parece más probable que recuerden haber votado por el ganador; y a veces declaran haber votado cuando los registros de votación muestran que no lo hicieron.

Este patrón ha persistido desde la primera vez que leí sobre el voto retrospectivo hasta la actualidad, según los datos archivados en el Roper Center y los datos de 2021-24 del Pew Research Center y Times/Siena. El mismo patrón aparece en las encuestas a pie de urna en todos los años de elecciones presidenciales en los que se preguntó (2004, 2008, 2020).

La tendencia del voto retrospectivo a sobrevalorar al ganador de las últimas elecciones significa que la ponderación del voto retrospectivo tiene un efecto predecible: aumenta el apoyo al partido que perdió las últimas elecciones.

Aunque los sondeos tienen muchos problemas, subestimar al partido que perdió las últimas elecciones no resulta ser uno de ellos. Como consecuencia, la ponderación del voto retrospectivo habría hecho que las encuestas fueran menos precisas en todas las elecciones desde 2004 (la más lejana considerada), según un nuevo análisis de 70 encuestas archivadas en el Roper Center.

Gráfica Errores en sondeos de elecciones presidenciales

[El gráfico superior muestra cómo cambiaría el margen de error tomando en cuenta el voto retroactivo, en las encuestas de 2004 a 2020]

El efecto del voto retrospectivo en 2020 es especialmente revelador: las encuestas de ese año fueron tan erróneas que hay casos individuales en los que la ponderación del voto retrospectivo habría ayudado. Por ejemplo, habría reducido la ventaja de Biden en la infame encuesta de ABC/Washington Post, que le daba 17 puntos de ventaja en Wisconsin en octubre de 2020. Pero tampoco lo habría arreglado; según nuestra estimación, Biden seguiría ganando por 12 puntos si se hubiera utilizado el voto retrospectivo al producir el resultado. Y habría hecho la mayoría de las otras encuestas de 2020 menos exactas, en promedio, incluyendo las encuestas de Times/Siena y la mayoría de las otras encuestas de ABC/Post.

¿Qué significa que el voto retrospectivo no hubiera bastado para corregir las encuestas de hace cuatro años? La interpretación más directa: para que las encuestas de 2020 fueran correctas, los encuestadores necesitaban que el voto retrospectivo de 2016 pareciera “incorrecto”. Los sondeos necesitaban que Trump mantuviera una clara ventaja en el voto retrospectivo, exactamente lo que uno habría esperado históricamente, dada la tendencia del voto retrospectivo a sobrevalorar al ganador de la elección anterior.

Como resultado, el voto retrospectivo ni siquiera ayudó a las encuestas en el mayor error de sondeo en 40 años.

Por qué ahora los encuestadores dan importancia al voto retrospectivo

A pesar de estos antecedentes, muchos encuestadores han decidido tener en cuenta el voto retrospectivo por cuatro razones principales.

En primer lugar, muchos encuestadores creen que el voto retrospectivo es más fiable que antes. Si es lo suficientemente preciso es otra cuestión, pero es cierto que el voto retrospectivo se parece “más” al resultado de las últimas elecciones que en ciclos anteriores. Los últimos tres años de datos de Times/Siena y Pew Research NPORS muestran una diferencia de unos tres puntos entre el voto retrospectivo de 2020 y el resultado real de 2020, muy lejos de las diferencias de dos dígitos de hace una o dos décadas.

¿Por qué podría estar siendo más preciso el voto retrospectivo? Una posibilidad es que los encuestados sean más propensos a recordar por quién votaron en las últimas elecciones, gracias al aumento del compromiso político y la polarización. Otra posibilidad es que los datos recogidos en línea sean menos vulnerables a lo que sea que causa el “sesgo del ganador” (es importante notar que casi todas las encuestas reanalizadas —en las que produjimos estimaciones de cuál podría ser el resultado de una encuesta si hubiera utilizado la ponderación del voto retrospectivo— eran encuestas telefónicas).

Estas elecciones también presentan un caso novedoso: el perdedor de las últimas elecciones se presenta de nuevo (y la mayoría de los republicanos ni siquiera creen que perdió), y el ganador de las últimas elecciones acaba de perder la revancha, en cierto sentido, contra ese perdedor. Nadie sabe cómo afecta todo esto a la exactitud del voto retrospectivo, pero es fácil imaginar una mayor mitigación del tradicional “sesgo del ganador”.

En segundo lugar, algunos encuestadores utilizan paneles de encuestados recurrentes, lo que significa que tienen respuestas de ellos durante un periodo largo. Un encuestador puede haber preguntado a los panelistas en 2020 cómo votaron, en lugar de pedirles hoy que recuerden cómo votaron hace cuatro años. Esto cuenta como ponderación del voto pasado, pero no es exactamente lo mismo que el voto retrospectivo de alguien. Este planteamiento debería ser menos vulnerable a los sesgos de la ponderación del voto retrospectivo, aunque siga habiendo problemas, como qué hacer con los nuevos panelistas o los cambios en la composición del electorado desde 2020.

En tercer lugar, el voto retrospectivo puede utilizarse para forzar datos que evidentemente no son representativos y obtener un resultado más plausible. Esto es especialmente útil para diseños de encuestas que no tienen ninguna oportunidad de validez, como un sondeo entre personas de una única plataforma de redes sociales. Nadie espera que un enfoque de este tipo produzca una buena muestra, pero la ponderación de los votos retrospectivos puede hacer que se acerque rápidamente a ser plausible. De hecho, más del 80 por ciento de encuestas de panel en línea con participación voluntaria ponderan el voto retrospectivo, mientras que otros tipos de encuestas tienen menos probabilidades de hacerlo.

En cuarto lugar, el voto retrospectivo se está utilizando para ayudar a abordar la tendencia de las encuestas a subestimar la fuerza de Trump en los últimos ocho años.

Como se mencionó anteriormente, históricamente, la ponderación del voto revocatorio ayuda al candidato que perdió las últimas elecciones. Este año, ese es Trump. Puedes verlo con tus propios ojos en la última ronda de encuestas de Times/Siena sobre los estados disputados: casi todas ellas se habrían movido a la derecha si hubieran ponderado el voto retrospectivo:

Cómo habrían cambiado las últimas encuestas de Times/Siena

Pensilvania: Harris +4 (sin voto retrospectivo) -> Trump +1 (con voto retrospectivo)

Michigan: Harris +1 -> Trump +1

Wisconsin: Harris +2 -> Trump +1

Carolina del Norte: Trump +3 -> Trump +6

Arizona: Trump +5 -> Trump +3

Georgia: Trump +4 -> Trump +6

Por supuesto, los resultados de las encuestas que ponderan votos retrospectivos representan un resultado totalmente plausible. Si las encuestas subestiman a Trump, como ocurrió hace cuatro u ocho años, los resultados de noviembre podrían ser exactamente así. Pero históricamente, no es sorprendente que la ponderación del voto retrospectivo ayude a los republicanos: Trump perdió las últimas elecciones; como tal, se esperaría que la ponderación del voto retrospectivo diera más peso a los votantes de Trump ’20, y por lo tanto a Trump ahora.

Cuando los tradicionales encuestadores de renombre ponderan el voto retrospectivo, esta suele ser la razón. Algunos de estos encuestadores creen que es una medida perfectamente válida, pero muchos solo la utilizan a regañadientes. Siguen creyendo más o menos en los viejos argumentos contra el voto retrospectivo, pero deciden emplearlo de todos modos. No lo harían si confiaran en que sus datos producen resultados imparciales, y no lo harían si no inclinara sus encuestas hacia Trump.

Como dijo Patrick Murray, de la encuesta de Monmouth, al explicar su decisión de ponderar el voto retrospectivo: “El fenómeno Trump es sui generis, y tienes que elegir qué veneno quieres”.

¿El voto retrospectivo arregló los problemas del pasado?

Hay algunas buenas noticias en esta historia: es casi seguro que la ponderación del voto retrospectivo esté reduciendo el riesgo de que las encuestas subestimen sistemáticamente a Trump, como lo hicieron en 2016 o 2020. Como hemos demostrado, ha dado a muchos encuestadores una solución rápida y fácil para mover sus números hacia la derecha.

Parece poco probable que muchos de los peores resultados de las encuestas de las elecciones de 2020 se repitan esta vez. Por ejemplo, las encuestas estatales de The Washington Post y CNN/SSRS ahora ponderan por voto retrospectivo, lo que significa que no veremos resultados como Biden +17 en Wisconsin o Biden +16 en todo el país.

Pero hay una extraña contradicción entre las dos principales observaciones hasta ahora, y la contradicción apunta a verdaderas compensaciones en cuanto a la ponderación del voto retrospectivo.

Por un lado, muchos encuestadores ponderan el voto retrospectivo porque produce resultados más republicanos.

Por otro, los sondeos así ponderados no producen necesariamente resultados especialmente republicanos. Por ejemplo, no se parecen a las hipotéticas encuestas Times/Siena ponderadas por la retrospección. En cambio, están produciendo resultados claramente en línea con el resultado de las elecciones de 2020.

¿Cómo es posible? Hay dos posibilidades básicas.

Una es que las encuestas ponderadas en función del voto retrospectivo estén llenas de votantes muy comprometidos que no han cambiado desde 2020 y, por lo tanto, la ponderación en función del voto retrospectivo producirá una repetición de 2020.

Otra posibilidad: puede ser empleado selectivamente por los encuestadores preocupados de que sus datos estén demasiado a la izquierda. Las dos teorías podrían estar conectadas, ya que los votantes altamente comprometidos se han inclinado a la izquierda durante la era Trump. Entonces, ponderar el voto retrospectivo movería un grupo de muestras relativamente inclinadas hacia los demócratas para alinearlas claramente con el resultado de las elecciones de 2020.

Sea cual sea la explicación, esta tensión sugiere importantes compensaciones cuando los encuestadores ponderan el voto retrospectivo. La más obvia es que puede dificultar la identificación de cualquier cambio desde las últimas elecciones. Una de las razones es simplemente porque la ponderación del voto retrospectivo fuerza mecánicamente las encuestas hacia el resultado de las últimas elecciones. Pero más allá de eso, la técnica se utiliza, al menos en parte, porque los encuestadores no confían en los resultados de sus sondeos. Es una actitud que puede llevar a los encuestadores a tratar los datos sorprendentes e inusuales como sospechosos, en lugar de potencialmente noticiosos o reveladores. Esto es comprensible: sé que no siempre confío en los resultados de nuestras encuestas después de la última década de fracasos. Pero cuando la preocupación legítima por los sondeos se transforma en una ponderación de los resultados que, de otro modo, serían aislados, se corre el riesgo de silenciar cualquier indicio de algo que pudiera salirse de lo normal.

En cierto modo, el problema recuerda a algo llamado “pastoreo”, en el que los encuestadores ajustan sus sondeos para alinear sus resultados con la media de otros sondeos. Al igual que el pastoreo, la decisión de ponderar el voto pasado es a menudo un reflejo de cómo los encuestadores se sienten en relación con la calidad de sus datos subyacentes. En este caso, sin embargo, los encuestadores no están necesariamente arreando hacia lo que dicen otros encuestadores. Por el contrario, están guiándose esencialmente por el resultado de las últimas elecciones presidenciales.

Una repetición de las últimas elecciones presidenciales es ciertamente un resultado plausible. En la polarizada era actual, ¿a quién podría sorprenderle una repetición en la tercera carrera presidencial de Trump? Si es una repetición casi igual, las encuestas ponderadas por el voto retrospectivo no solo tendrán una noche excelente, sino que también podrían ahorrarle a toda la industria otros cuatro años de miseria.

Pero si esta elección es diferente, en cualquier dirección, las encuestas de este año podrían no verlo venir.

