Google publica para todos el código de su herramienta de marca de agua para texto generado por IA
La tecnología de Google para poner marcas de agua a textos generados por inteligencia artificial (IA) ya está al alcance de todos. SynthID es una herramienta desarrollada por Google Deepmind, el laboratorio de la firma dedicado a la IA, y acaba de convertirse en código abierto. Funciona introduciendo ligeras modificaciones en el texto generado "introduciendo una firma estadística en el texto generado", según un artículo de publicado en 'Nature'.
Estas firmas "son imperceptibles para los humanos", señalaba Google en un post del blog del gigante Big Tech dedicado a los desarrolladores. El proceso de marca de agua no ralentiza la generación y no necesita acceder al gran modelo de lenguaje (LLM), "que a menudo es propietario", señalaba el artículo de 'Nature'.
"Ahora, otros desarrolladores de IA [generativa] podrán utilizar esta tecnología para ayudarles a detectar si las salidas de texto proceden de sus propios [LLM], lo que facilitará que más desarrolladores construyan IA de forma responsable", declaró Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, a MIT Technology Review.
La empresa realizó una prueba de su herramienta de marcas de agua a través de su chatbot Gemini. Analizaron aproximadamente 20 millones de respuestas con y sin marca de agua del chat y no observaron diferencias estadísticamente significativas en las respuestas en cuanto a su calidad.
El algoritmo está actualmente desplegado en Gemini y Gemini Advanced porque "existe la preocupación de que pueda contribuir a problemas de desinformación y atribución errónea", señala la entrada del blog. "La marca de agua es una técnica para mitigar estos impactos potenciales".
Según los investigadores, ofrece "una detectabilidad superior a la de los métodos existentes", como analizar lo variado y heterogéneo que es un texto para determinar si ha sido generado por un modelo lingüístico o por un humano. Este es el método utilizado, por ejemplo, por GPTZero, pero puede dar lugar a falsos positivos y negativos.
Sin embargo, ni siquiera SynthID-text es un método infalible y la puntuación tiende a bajar si el texto "se reescribe a fondo o se traduce a otro idioma". Deepmind también ha desarrollado herramientas para marcar imágenes y vídeos generados por IA incrustando una marca de agua digital directamente en los píxeles de una imagen o en cada fotograma de un vídeo invisible al ojo humano. La marca de agua se hizo resistente a las manipulaciones habituales de imágenes y vídeos, como el recorte, el cambio de tamaño, la compresión y la adición de filtros.