El uso de la IA para evaluar la redacción de las políticas

+Seguir en Seguir en Google
Opinión
/

Los grandes modelos de lenguaje podrían ayudar a los responsables políticos a evaluar cómo es probable que reaccionen los inversores, las coaliciones políticas y los hogares ante los anuncios de política

Por Monica de Bolle, Project Syndicate.

WASHINGTON- A principios de este año, los investigadores de Anthropic hicieron un descubrimiento notable. Al estudiar los mecanismos internos de Claude Sonnet 4.5, el gran modelo de lenguaje de la empresa, identificaron lo que denominaron «conceptos emocionales»: patrones internos que se corresponden con docenas de estados emocionales e influyen de forma cuantificable en las respuestas del modelo de manera similar a los patrones de comportamiento humanos.

Las implicaciones para la formulación de políticas económicas podrían ser de gran alcance. Al ofrecer una nueva forma de estudiar cómo el lenguaje moldea las respuestas emocionales y conductuales, los grandes modelos de lenguaje podrían ayudar a los responsables políticos a evaluar cómo es probable que reaccionen los inversores, las coaliciones políticas y los hogares ante los anuncios de políticas.

Los responsables políticos saben desde hace tiempo que el lenguaje influye en cómo se procesa la información. Por eso los bancos centrales ajustan cuidadosamente sus orientaciones prospectivas, mientras que los funcionarios del Gobierno prestan gran atención a cómo los anuncios de política fiscal y arancelaria serán recibidos por los mercados y los votantes. Pero hasta hace poco, había pocas herramientas capaces de analizar sistemáticamente cómo el lenguaje en sí mismo funciona como instrumento de política. Los LLM pueden ahora ayudar a cerrar esa brecha de conocimiento.

Para comprender cómo podría funcionar esto en la práctica, realicé tres experimentos utilizando Claude. Cada uno de ellos se diseñó para comprobar si el modelo reproduciría un razonamiento que reflejara cómo responden los mercados, las coaliciones políticas y los hogares a los anuncios de política económica. En todos los casos, la política subyacente se mantuvo constante, mientras que se modificaba una sola variable: el emisor, la etiqueta o el momento.

En los tres experimentos, el razonamiento y las predicciones de Claude variaron de forma consistente, y en ocasiones de manera marcada, dependiendo del lenguaje utilizado. Es fundamental señalar que nunca se le pidió al modelo que se centrara en el encuadre, la credibilidad o los efectos retóricos; esos patrones surgieron por sí solos. Para evitar que el modelo “interpretara” lo que se le pedía que hiciera, las indicaciones se redactaron de la forma más sencilla y directa posible. Cada experimento se repitió varias veces utilizando indicaciones idénticas para comprobar si las respuestas variarían, pero los resultados se mantuvieron consistentes.

Una posible crítica a estos experimentos es que el modelo podría estar simplemente repitiendo sus datos de entrenamiento sobre el comportamiento del mercado; en otras palabras, las respuestas podrían reflejar cómo se entrenó a Claude para “pensar” que se comportan los mercados. Si eso fuera cierto, sería poco probable que aparecieran resultados contrarios a la intuición sobre el encuadre eufemístico de las políticas y la secuencia de los anuncios de políticas, y sin embargo aparecieron.

En el primer experimento, evalué cómo Claude valoraba la probabilidad de las reacciones del mercado, políticas e individuales ante una declaración de política monetaria atribuida a cinco portavoces diferentes. La declaración decía: “Los niveles actuales de los tipos de interés son adecuados, y sería necesario un cambio sustancial y sostenido en los datos antes de realizar cualquier ajuste”. Los portavoces iban desde el presidente de la Reserva Federal de EE. UU. hasta figuras públicas sin autoridad monetaria.

La declaración perdía casi toda su capacidad de influir en el mercado cuando el portavoz no era el presidente de la Fed. Claude asignó una probabilidad del 25-40 % de que se produjera un cambio significativo en los rendimientos de los bonos del Tesoro a diez años cuando la declaración procedía del presidente de la Fed, y cercana a cero cuando procedía de cualquier otra persona. Según el razonamiento del modelo, la declaración solo importaba cuando la pronunciaba alguien con la autoridad institucional para actuar en consecuencia.

A continuación, probé una versión más contundente de la misma declaración: “No vemos condiciones bajo las cuales se justificara un ajuste anticipado”. Aunque las dos versiones describían la misma postura políticaM mantener los tipos de interés sin cambios, la respuesta de Claude divergió notablemente. Cuando se le pidió que valorara la credibilidad del orador en una escala del uno al diez, el modelo rebajó su puntuación de siete a tres, al tiempo que elevó la probabilidad de un movimiento brusco en los rendimientos de los bonos del Tesoro por encima de la volatilidad normal del mercado al 75-85 %.

Claude interpretó la formulación más contundente no como una señal de determinación, sino como «prueba de un error de política inminente», ajustando sus predicciones de mercado en consecuencia. Esto sugiere que, si bien la posición institucional da fuerza al lenguaje de la política, la disciplina retórica determina cómo responde el público a él. La exageración del presidente de la Fed se interpretó como una señal de que el orador se estaba comprometiendo con una política que, en última instancia, podría ser incapaz de mantener.

En el segundo experimento, describí un paquete fiscal idéntico, una reducción generalizada del gasto del 3 %, utilizando tres descripciones diferentes: “medidas de austeridad”, “consolidación fiscal” y “ajuste del gasto público”. Esta última, la más eufemística de las tres, recibió las estimaciones más bajas tanto en cuanto a viabilidad política como a probabilidad de aprobación legislativa.

Claude identificó lo que describió como una “penalización de credibilidad” por un encuadre evasivo: un lenguaje tan anodino que transmitía evasión en lugar de tranquilidad. La “consolidación fiscal»”obtuvo los mejores resultados porque describía con precisión la política sin provocar la reacción negativa asociada a la palabra “austeridad”, mientras que las “medidas de austeridad” se situaron en un término medio: claras en cuanto a la política, pero lo suficientemente cargadas de connotaciones políticas como para socavar su viabilidad.

La implicación más amplia es que el lenguaje eufemístico alimenta la desconfianza del público. En lugar de hacer más aceptables las políticas impopulares, da a entender que los responsables políticos están ocultando sus verdaderas intenciones.

CUANDO LOS MERCADOS PIERDEN LA FE

El tercer experimento resultó ser el más revelador. En esta ocasión, la variable no fue el lenguaje, sino el momento y la secuencia. Analicé las reacciones ante el arancel del 25 % impuesto por el presidente de EE. UU., Donald Trump, a las importaciones de semiconductores de Taiwán en tres escenarios: un anuncio único; una duplicación del arancel al 50 % en un plazo de 72 horas; y una pausa de 72 horas para las negociaciones tras el anuncio inicial.

En el primer escenario, Claude estimó una probabilidad del 25-35 % de que el arancel se mantuviera vigente tras 12 meses. Esa cifra cayó al 28 % cuando el arancel se duplicó en un plazo de 72 horas, ya que Claude interpretó tal medida como “impulsiva” en lugar de estratégica. Por el contrario, el escenario de la pausa para las negociaciones elevó la probabilidad de supervivencia al 62 %. Claude razonó que el retraso transformaba el anuncio inicial de una “amenaza probablemente fingida” en un “compromiso creíble pero negociable”.

$!Una persona sostiene un teléfono con el logotipo de la inteligencia artificial (IA) Anthropic, Claude.

En los tres escenarios, las reacciones se vieron impulsadas menos por el tipo arancelario que por cómo y cuándo se introdujo. El razonamiento de Claude en los tres experimentos fue más allá del mero lenguaje, incorporando la posición institucional, la capacidad de implementación y el momento. Una declaración sobre los tipos de interés, por ejemplo, tenía mucho menos peso si procedía del director gerente del Fondo Monetario Internacional, que carece de autoridad directa sobre la política monetaria de EE. UU., que si procedía del presidente de la Reserva Federal, que sí la tiene.

Los resultados fueron notablemente consistentes: el lenguaje importa más cuando está respaldado por el poder institucional. Los oradores sin capacidad para actuar en consecuencia con sus declaraciones tenían poca credibilidad en el mercado, independientemente de lo bien redactadas que estuvieran sus declaraciones.

Esto ayuda a explicar la dinámica real de los mercados. A lo largo de 2025, Trump emitió un flujo incesante de anuncios sobre aranceles: aumentos, revocaciones, suspensiones y restablecimientos. En cuestión de meses, los mercados de valores habían aprendido a descontar estas declaraciones. Las decisiones de inversión de las empresas se ajustaron a los tipos arancelarios reales, prestando poca atención a la retórica de Trump, mientras que los gobiernos aliados adoptaron cada vez más una estrategia de esperar a que pasara la volatilidad.

El razonamiento de Claude reflejaba la misma lógica. Cuando las políticas se revierten repetidamente, el lenguaje pierde credibilidad y las palabras se convierten en ruido de fondo que los participantes experimentados del mercado aprenden a ignorar. El problema no es que el orador carezca de autoridad: Trump sí tiene poderes significativos para fijar aranceles (aunque, como reafirmó recientemente el Tribunal Supremo, no son ilimitados). El problema es que el público ya no puede dar por sentado que un arancel anunciado se mantendrá en vigor el tiempo suficiente como para justificar una respuesta.

Estas conclusiones también arrojan luz sobre por qué la promesa del expresidente del Banco Central Europeo, Mario Draghi, en 2012 de hacer “lo que sea necesario” para salvar el euro tuvo éxito, mientras que la insistencia de la Fed en 2021 de que la inflación era meramente «transitoria» fracasó. La promesa de Draghi tranquilizó a los inversores porque estaba respaldada por una poderosa combinación de credibilidad personal, capacidad institucional y un consenso de mercado de que el BCE acabaría cumpliendo su palabra. El enfoque «transitorio» de la Fed, por el contrario, fracasó porque las perturbaciones del lado de la oferta tras la pandemia, la volatilidad de los precios de la energía y el enorme estímulo fiscal dieron a los mercados motivos de sobra para dudar del diagnóstico del banco central.

EL LENGUAJE COMO HERRAMIENTA POLÍTICA

Nada de esto sugiere que las palabras por sí solas muevan los mercados. La autoridad institucional y la capacidad de actuar siguen siendo los factores decisivos. Pero una vez que se dan esas condiciones, un lenguaje específico puede ayudar a orientar las expectativas. La promesa de Draghi de “lo que sea necesario”, por ejemplo, transmitió el compromiso del BCE de salvar el euro con una claridad y una fuerza que ninguna declaración tecnocrática podría haber igualado.

El enfoque “transitorio” de la Fed, por el contrario, redujo una afirmación empírica controvertida a una sola palabra tranquilizadora. Cuando la inflación resultó ser más persistente de lo esperado, el término que se suponía que debía tranquilizar a los mercados pasó a sonar condescendiente. Como resultado, la formulación segura de la Fed amplificó la reacción negativa cuando finalmente se vio obligada a dar marcha atrás.

Sin duda, el lenguaje es solo una variable entre muchas. Pero estos experimentos sugieren que sus efectos distan mucho de ser insignificantes. Los bancos centrales ya tratan la elección de las palabras como un instrumento de política, perfeccionado a través de la prueba y el error. La minuciosa atención que la Fed dedica a cada palabra de sus comunicados refleja un entendimiento tácito de que el lenguaje afecta profundamente al comportamiento económico.

La IA podría permitir ahora estudiar esos efectos de forma más sistemática. En lugar de basarse en la intuición, los responsables políticos podrían adquirir una comprensión más profunda de cómo el lenguaje moldea las expectativas en diferentes poblaciones y contextos políticos.

Un banco central que trate el lenguaje como una herramienta de precisión y estudie cómo las variaciones en la redacción pueden influir en diferentes públicos podría comunicarse de forma más coherente y estratégica. Teniendo esto en cuenta, la Fed y varios otros bancos centrales ya han comenzado a experimentar con los LLM.

Las implicaciones podrían extenderse más allá de la banca central a la política fiscal y comercial, donde los responsables han sido, en general, mucho menos estratégicos en su uso del lenguaje. El comercio, en particular, es un ámbito en el que la retórica puede tener consecuencias inmediatas. Como ha demostrado Trump en repetidas ocasiones, los anuncios de aranceles pueden mover los mercados y reorganizar las cadenas de suministro antes de que entren realmente en vigor.

Las empresas multinacionales que dominan las cadenas de suministro globales responden principalmente a las expectativas sobre los futuros tipos arancelarios, no a cómo se formulan esas políticas. En las tres etiquetas de política comercial que probé con Claude, “proteccionista”, “política industrial estratégica” y “recíproca”, las probabilidades estimadas de reorganización de la cadena de suministro variaron solo modestamente, oscilando entre el 72 % y el 85 %.

Sin embargo, estas expectativas no son independientes del lenguaje. La forma en que se enmarca un arancel influye en si desencadena una impugnación ante la Organización Mundial del Comercio o conduce a negociaciones bilaterales, en si los aliados imponen medidas similares o se abstienen, en si las industrias nacionales se movilizan en apoyo o en oposición y, en última instancia, en si el arancel sobrevive.

El tercer experimento puso de relieve el poder de la secuencia. La rápida escalada hizo que la política arancelaria de Trump pareciera impulsiva e insostenible, mientras que una pausa para las negociaciones aumentó su credibilidad y durabilidad percibidas. El momento y el ritmo son, por lo tanto, instrumentos de política por derecho propio, que merecen la misma atención analítica que los bancos centrales han dedicado a las orientaciones prospectivas durante las últimas dos décadas.

Un creciente conjunto de investigaciones en múltiples disciplinas apunta a la misma conclusión: el lenguaje transmite señales de comportamiento que viajan de las instituciones a los mercados, de los responsables políticos al público y, ahora, de los seres humanos a las máquinas.

La IA ofrece a los responsables políticos una forma de observar estas dinámicas directamente, en lugar de inferirlas a partir de las reacciones del mercado o los resultados políticos, lo que permite identificar qué formulaciones generan credibilidad, provocan resistencia o pierden fuerza con la repetición. Los responsables políticos que tratan el lenguaje como algo secundario corren el riesgo de perder una de las herramientas más poderosas a su disposición. Copyright: Project Syndicate, 2026.

Monica de Bolle es investigadora principal del Instituto Peterson de Economía Internacional.

Project Syndicate produce y distribuye análisis originales y de alta calidad a una audiencia global. Con contribuciones exclusivas de destacados líderes políticos, legisladores, académicos, empresarios y activistas cívicos de todo el mundo, ofrecemos a los lectores análisis e información de vanguardia.

NUESTRO CONTENIDO PREMIUM