Por The New York Times | Jacob N. Shapiro and Chris Mattmann
No tenemos que imaginar un mundo en el que los ultrafalsos puedan imitar de manera tan creíble las voces de los políticos que puedan utilizarse para crear escándalos que influyan en las elecciones. Ese mundo ya está aquí. Por suerte, hay numerosas razones para ser optimistas sobre la capacidad de la sociedad para identificar a los medios falsos y mantener una comprensión compartida de los acontecimientos actuales.
Aunque tenemos razones para creer que el futuro puede ser seguro, nos preocupa que el pasado no lo sea.
La historia puede ser una herramienta poderosa para la manipulación y las actividades ilícitas. La inteligencia artificial generativa que puede falsear los acontecimientos actuales también puede falsear los pasados. Mientras que los nuevos contenidos pueden estar protegidos mediante sistemas integrados, hay un mundo de contenidos ahí afuera que no están protegidos con marcas de agua, lo que se hace añadiendo información imperceptible a un archivo digital para que pueda rastrearse su procedencia. Una vez que la marca de agua en el momento de la creación se generalice y la gente se adapte a desconfiar de los contenidos sin marca de agua, será mucho más fácil cuestionar todo lo que se haya producido antes de ese momento.
Y esto creará un sinfín de oportunidades para sostener afirmaciones falsas con documentos generados, desde fotos que coloquen a personajes históricos en situaciones comprometidas hasta la alteración de noticias individuales en periódicos históricos, pasando por el cambio de nombres en escrituras de propiedad. Aunque todas estas técnicas se han utilizado antes, es mucho más difícil contrarrestarlas cuando el costo de crear falsificaciones casi perfectas se ha reducido de manera radical.
Este pronóstico se basa en la historia. Existen muchos ejemplos de cómo los poderes económicos y políticos manipularon el registro histórico para sus propios fines. Stalin eliminó de la historia a los camaradas desleales ejecutándolos y alterando los registros fotográficos para que pareciera que nunca habían existido. Eslovenia, al convertirse en país independiente en 1992, borró del registro de residentes a más de 18.000 personas, sobre todo miembros de la minoría romaní y de otras etnias no eslovenas. En muchos casos, el gobierno destruyó sus registros físicos, con la consiguiente pérdida de sus hogares, pensiones y acceso a otros servicios, según un informe de 2003 del comisario de derechos humanos del Consejo de Europa.
Los documentos falsos son una parte fundamental de muchos intentos de reescribir la historia. Los tristemente célebres protocolos de los sabios de Sión, publicados por primera vez en un periódico ruso en 1903, pretendían ser actas de reuniones de una conspiración judía para controlar el mundo. Estos protocolos fueron desacreditados por primera vez en agosto de 1921, y entonces se dijo que eran una falsificación plagiada de múltiples fuentes no relacionadas, pero ocuparon un lugar destacado en la propaganda nazi y se han utilizado durante mucho tiempo para justificar la violencia antisemita, incluida una cita en el artículo 32 de la Carta Fundacional de Hamás de 1988.
En 1924, cuatro días antes de unas elecciones generales, The Daily Mail publicó la “Carta a Zinóviev”, de la que se decía que era un comunicado secreto del jefe de la Internacional Comunista en Moscú al Partido Comunista de Gran Bretaña para movilizar el apoyo a la normalización de las relaciones con la Unión Soviética. El escándalo resultante pudo costarles las elecciones a los laboristas. Nunca se ha demostrado el origen de la carta, pero su autenticidad se puso en duda en su momento y una investigación oficial realizada en la década de 1990 concluyó que lo más probable es que fuera obra de los Rusos Blancos, una facción política conservadora dirigida en aquel momento por inmigrantes rusos que se oponían al gobierno comunista.
Décadas después, la operación ‘Infektion’ —una campaña soviética de desinformación— utilizó documentos falsificados para difundir la idea de que Estados Unidos había inventado el VIH, el virus que causa el sida, como arma biológica. Y en 2004, CBS News retiró un polémico reportaje porque no pudo comprobar la autenticidad de los documentos, desacreditados posteriormente por ser falsos, que ponían en entredicho el servicio que había prestado George W. Bush, entonces presidente, en la Guardia Nacional Aérea de Texas. A medida que resulte más fácil generar desinformación histórica y se dispare el volumen de falsificaciones digitales, surgirá la oportunidad de remodelar la historia o, al menos, de poner en tela de juicio nuestra comprensión actual de la misma.
La posibilidad de que los actores políticos utilicen la inteligencia artificial generativa para reconfigurar la historia (por no hablar de los estafadores que crean documentos legales y registros de transacciones falsos) es aterradora. Por suerte, las mismas empresas que crearon el riesgo señalan ahora el camino a seguir.
Al indexar una gran parte de los medios digitales del mundo para entrenar sus modelos, las empresas de inteligencia artificial crearon sistemas y bases de datos que pronto contendrán todos los registros digitales de la humanidad o, al menos, una aproximación significativa de ellos. Podrían empezar a trabajar hoy mismo para registrar versiones con marcas de agua de estos documentos primarios, que incluyen archivos de periódicos y una amplia gama de otras fuentes, de modo que las falsificaciones posteriores se detecten de inmediato.
Dicho trabajo enfrenta algunos obstáculos. La iniciativa de las bibliotecas digitales de Google de escanear millones de libros de bibliotecas de todo el mundo y hacerlos de fácil acceso en línea se topó con límites de propiedad intelectual, lo que hizo inviable el archivo histórico para su propósito previsto de hacer que cualquier persona con una conexión a internet pudiera consultar estos textos. Esos mismos problemas de propiedad intelectual hacen que los creadores y las empresas se preocupen tanto por los datos de entrenamiento proporcionados a la inteligencia artificial generativa como por sus implicaciones cuando se utilizan para generar contenidos.
Teniendo en cuenta estos antecedentes, incluida la fallida inversión de Google en su proyecto de bibliotecas digitales, ¿quién dará el paso y pagará por una iniciativa masiva similar que crearía versiones inmutables de datos históricos? Tanto los gobiernos como la industria tienen grandes incentivos para hacerlo y muchos de los problemas de propiedad intelectual relacionados con la creación de un archivo en línea en el que se puedan realizar búsquedas no aplican a la creación de versiones de documentos con marcas de agua y marcas de tiempo, ya que no es necesario que esas versiones estén a disposición del público para cumplir su propósito. Se puede comparar un documento en cuestión con el archivo registrado mediante una transformación matemática del documento conocida como “hash” la misma técnica que utiliza el Foro Global de Internet para combatir el Terrorismo (GIFCT, por su sigla en inglés) para ayudar a las empresas a detectar contenidos terroristas conocidos.
Además de crear un bien público importante y proteger a los ciudadanos de los peligros que supone la manipulación de sus discursos históricos, la creación de registros verificados de documentos históricos puede ser valiosa para las grandes empresas de inteligencia artificial. Nuevas investigaciones sugieren que cuando los modelos de inteligencia artificial se entrenan con datos generados por ella, su desempeño se degrada con rapidez. Por tanto, puede que sea fundamental separar lo que de verdad es parte del registro histórico de los “hechos” de nueva creación.
Preservar el pasado también significa preservar los datos de entrenamiento, las herramientas asociadas que operan con ellos e incluso el entorno en el que se ejecutaron las herramientas. Vint Cerf, uno de los primeros pioneros de internet, ha llamado a este tipo de registro “vitela digital” y lo necesitamos para asegurar el entorno de la información.
Esta vitela será una herramienta poderosa. Puede ayudar a las empresas a crear mejores modelos al permitirles analizar qué datos incluir para obtener el mejor contenido y ayudar a los reguladores a auditar los sesgos y el contenido perjudicial de los modelos. Los gigantes tecnológicos ya están desarrollando iniciativas similares para registrar el nuevo contenido que crean sus modelos, en parte porque necesitan entrenar a sus modelos con texto generado por humanos y los datos producidos tras la adopción de grandes modelos lingüísticos que pueden estar contaminados con contenido generado.
Ha llegado el momento de hacer que estas iniciativas también abarquen el pasado, antes de que nuestra política también se vea distorsionada de manera seria por la historia generada.
Este artículo apareció originalmente en The New York Times.