Existen muchos tipos de discursos políticos, algunos pueden ser realmente memorables, pero la mayoría son relativamente simples y solo repiten de forma sistemática ciertas ideas básicas. Ahora, un investigador ha conseguido crear un sistema de inteligencia artificial (IA) que es capaz de generar este tipo de discursos, dejando a muchos políticos en evidencia.
«Los discursos políticos por lo general tienen una estructura muy simple y el hecho de que ciertas frases se repitan muy a menudo es la razón por la que los resultados del generador son tan buenos», explica a eldiario.es el investigador de la Universidad de Massachusetts, Valentin Kassarnig. Ha utilizado una base de datos de casi 4.000 discursos políticos realizados en 53 debates del Congreso de EEUU para crear un algoritmo de aprendizaje que es capaz de crear discursos propios.
Muchos discursos políticos muestran las mismas estructuras y características independientemente del tema que se esté debatiendo. Algunas frases y argumentos aparecen una y otra vez para reforzar cierta filiación política o para remarcar una opinión. Kassarnig ha utilizado estos patrones para entrenar a un sistema que crea nuevos discursos. «El objetivo», señala este investigador, «es generar discursos en los que nadie pueda encontrar la diferencia con los que están escritos a mano».
Un modelo utilizado por Google
El sistema desarrollado por Kassarnig se basa en lo que se conoce como N-gramas,utilizado también por Google. Este tipo de modelos estadísticos permiten predecir cada parte de una secuencia de N elementos, siendo N, en este caso, el número de palabras o frases. Es decir, el modelo analiza los diferentes discursos de la base de datos y obtiene la probabilidad de que después de N palabras aparezca otra, lo que le permitirá crear sus propios discursos.
«Mi método analiza las frases que constan de 6 palabras, simplemente contando con qué frecuencia se producen esas frases en otros discursos», explica Kassaring. A partir de esta información, se crea un modelo probabilístico que permite predecir que palabra debería aparecer después de una secuencia de cinco palabras. «Por ejemplo, después de ver el 5-grama ‘en los Estados Unidos de’, la palabra ‘América’ tiene una probabilidad muy alta, mientras que cualquier palabra al azar como ‘unicornios’ tiene una probabilidad muy baja», explica Kassaring.
Para iniciar el discurso, el algoritmo escoge aleatoriamente uno de estos conjuntos de cinco palabras o 5-grama. A continuación, elige la siguiente palabra de forma que se puedan seguir formando 5-gramas a partir del primero. Sin embargo, esto solo ofrecería un discurso gramaticalmente correcto, pero no con tendencia política y el modelo también debe incluir el tipo de discurso, ya sea demócrata o republicano.
La IA separa los discursos por ideología
«Aunque mi análisis ha demostrado que no hay diferencias estructurales entre las dos partes [demócratas o republicanos], sí que hay grandes diferencias en su contenido», cuenta Kassaring. Para determinar el tipo de discurso al que se refiere, el modelo utiliza frases de 3 palabras que tienen un patrón diferenciado en ciertos discursos. «Las frases que aparecen con mucha frecuencia en los discursos de un partido, pero no en los del otro, nos indican los temas calientes», explica el investigador.
Así que el algoritmo, que es de código abierto, utiliza estos dos modelos para generar el discurso. Uno para determinar las palabras gramaticalmente correctas y otro para comprobar que las frases resultantes son coherentes con el partido correspondiente. Finalmente, la combinación de ambos modelos ofrece una distribución de probabilidad que indica cual es la siguiente palabra del discurso.
El propio Kassaring reconoce que a pesar de los buenos resultados obtenidos por su IA, «es muy poco probable que se utilice realmente para generar discursos para políticos». Sin embargo, el mismo enfoque se podría aplicar a escenarios «menos exigentes, como el de un deportista que da una entrevista». En este tipo de intervenciones normalmente se utilizan sólo un par de frases cortas y que, por lo general, contienen expresiones muy comunes. «Si utilizara una base de datos de entrevistas, probablemente los resultados serían bastante buenos», concluye Kassaring.