La controversia entre la IA y el derecho de autor
La Inteligencia Artificial genera imágenes y contenidos virales que plantean dudas sobre los derechos de autor y la propiedad intelectual, generando un debate sobre el papel humano en la creatividad digital.
¿Será cierto que el Papa Francisco usa blancas camperas infladas de Balenciaga, que a Trump lo quisieron llevar preso y se resistió, que a Lali Espósito la persiguió un grupo de chicos de un barrio vulnerable? Esas y otras imágenes semejantes, que se volvieron virales, fueron, en realidad, realizadas con algún tipo de Inteligencia Artificial.
La irrupción de la inteligencia artificial (IA) en el ámbito creativo ha desencadenado un intenso debate sobre los límites del derecho de autor y la propiedad intelectual. A medida que las máquinas son capaces de generar obras artísticas, musicales y literarias cada vez más sofisticadas, surgen interrogantes fundamentales: ¿Quién es el autor de una obra creada por una IA? ¿Se pueden proteger legalmente estas creaciones? ¿Cómo se concilia la innovación tecnológica con los derechos de los creadores humanos?
Es más, este párrafo que acaba de leer fue escrito por una IA a pedido de quien suscribe. Y, en este caso, la pregunta sería: ¿quién fue el autor de este párrafo, la IA que lo escribió o su servidor, que le dio las indicaciones? Ésta, aquellas y muchas otras preguntas, surgen regularmente como la señal de que no todo (más bien casi nada) está dicho en la relación entre la Propiedad Intelectual (en adelante, la PI) y las AI (porque no hay una sola).
Pero para ordenar un poco este debate, separémoslo en dos: la PI de los datos que se usan (y usaron) para entrenar la IAs y la de los productos de esas IAs.
Los datos son míos, míos
La IA Generativa, esta nueva tecnología surgida con el nombre de GPT (Generative Pre-trained Transformer), está basada principalmente (pero no únicamente) en el Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés). Por supuesto, esta definición es una simplificación extrema —perdonen los tecnólogos y los puristas— pero para esta nota nos va a servir. Porque lo que queremos explicar es que para que GPT pudiera “crear” textos, sonidos, imágenes o videos, fue necesario entrenarla y, para eso, se la alimentó con decenas de millones (literalmente) de datos. Y la primera controversia surge aquí: ¿datos de qué origen? ¿cuáles de esos datos están protegidos por algún tipo de PI o copyright?
Escribe Nicole Willing en este artículo de Techopedia: “Las recientes demandas de los autores Sarah Silverman, Christopher Golden y Richard Kadrey contra OpenAI y Meta, así como de las artistas Sarah Andersen, Kelly McKernan y Karla Ortiz contra Stability AI, DeviantArt y Midjourney, alegan que utilizar sus obras para entrenar modelos de IA sin su consentimiento equivale a un robo de PI.
“El proveedor de fotografía de archivo Getty también ha presentado demandas en los Estados Unidos y el Reino Unido contra Stability AI, alegando que su generador de imágenes de IA Stable Diffusion viola sus derechos de autor y de marca al utilizar indebidamente fotografías con marca de agua de su colección.
“Sin embargo, el juez del caso de los artistas ha dicho que necesitan aportar pruebas más detalladas. De lo contrario, parece inverosímil que se trate de sus obras”, ya que los algoritmos se han entrenado con “cinco mil millones de imágenes comprimidas”.
Datos versus patrones
“Si vos me preguntás mi posición personal al respecto, lo que yo interpreto que hace el sistema en el momento de construir datos a partir de una obra, ya sea literaria, texto, fotografía, obra pictórica o música, no infringe copyright, porque lo que captura el sistema de aprendizaje son los patrones de la obra y esos no son elementos cubiertos por copyright. Esto es lo que planteo si a mí me preguntan mi opinión, con entendimiento de cómo funciona el copyright y cómo funcionan los sistemas de entrenamiento”. Quien opina de esa manera es Beatriz Busaniche, presidenta de la Fundación Vía Libre.
Diego Bassante, Líder de Asuntos Regulatorios y Gubernamentales para IBM América Latina, por su parte, opina que “el entrenamiento de un modelo fundacional implica o trae a colación las leyes de PI, cuando se reproduce material protegido por derechos de autor para crear estos conjuntos de datos. Pero el entrenamiento en sí, o sea, el proceso de tomar esos datos y entrenar un modelo de inteligencia artificial no supone necesariamente una infracción de derechos de autor. Podría ser considerado ‘uso legítimo’, lo que en inglés se conoce como el ‘fair use’, ¿verdad? Lo que nosotros hacemos en IBM es seleccionar los datos de entrenamiento para filtrar el contenido que pueda ser objetable y además evitamos utilizar datos de sitios web que, o sabemos que albergan contenido pirateado o que están detrás de muros de pago”.
Pero en algo coincide con Busaniche: “Te pongo un ejemplo concreto. Yo puedo entrenar un sistema con un texto que sea un poema, que tiene un autor y tiene los derechos protegidos. Yo no estoy entrenando al sistema para manipular el significado expresivo de un poema. Lo estoy entrenando para que reconozca y asimile que a menudo después de los artículos él y un aparece un sustantivo. Esto es un ejemplo de entrenamiento de un sistema de inteligencia artificial con contenido que tiene protecciones de derecho de autor, pero que en sí no constituye una infracción”.
Quizá lo que podríamos poner como un ejemplo más explícito es el siguiente. Sabemos que una característica de Pablo Picasso es poner los dos ojos al frente y la nariz de perfil (¡Perdón los pintores y expertos en Picasso!). Luego, lo que la IA interpreta, es el patrón: ojos al frente, nariz de perfil (ver imagen) y no la pintura y su significado.
Bassante, además, incorpora a la charla, un concepto técnico: “Por supuesto también respetamos los controles del protocolo robot.txt. Este protocolo es básico y se debe conocer cuando se está hablando de temas de propiedad intelectual, porque es lo que las páginas de internet ponen para indicar a los buscadores que no deben ser indexadas, que eso es contenido que no debe ser presentado”.
Pero en lo que Busaniche discrepa con Bassante es en la autorización. En teoría, si las empresas o los investigadores o las iniciativas diversas que entrenan no pidieron autorización para integrar la obra en el dataset de entrenamiento, habría una infracción. Para la ejecutiva hay lo que se llama una “reproducción efímera”: la obra existe mientras se está reproduciendo. “La obra no queda guardada en el modelo —explica la presidenta de Vía Libre—, el modelo toma los patrones y no necesita tener acceso a la obra permanentemente no la está copiando ni hay una reproducción permanente de la obra, o sea, no está la obra metida en el modelo. Están sólo los patrones que capturó”.
Quién crea a quién
El otro punto del debate es quién debería ser el propietario de los derechos de una obra producida por un sistema de IA.
Kris Kashtanova es una artista que creó un cómic llamado “Zarya of the Dawn” utilizando la inteligencia artificial Midjourney para generar las imágenes. Inicialmente, la Oficina de Derechos de Autor de Estados Unidos le otorgó protección, reconociendo su contribución creativa a la obra. Sin embargo, esta decisión fue revocada posteriormente. La oficina argumentó que las imágenes generadas por la IA no eran producto de la autoría humana y, por lo tanto, no podían ser protegidas por derechos de autor. (https://es.gizmodo.com/estados-unidos-no-reconoce-derechos-de-autor-de-las-ima-1850148854).
Este caso generó, en su momento, un intenso debate sobre la propiedad intelectual en la era de la inteligencia artificial, planteando preguntas sobre quién es el autor cuando una máquina contribuye a la creación de una obra y cómo se deben adaptar las leyes de derechos de autor a esta nueva realidad.
“La utilización de tecnologías de apoyo a la creatividad es un elemento propio de la modernidad —sostiene Busaniche—pero existe desde hace siglos. Desde que se creó el copyright, siempre existió el apoyo tecnológico a la creatividad, siempre existieron herramientas que sirvieron a la creatividad humana y los sistemas de IA no son una excepción. Ningún sistema de IA generativa trabaja de forma autónoma, siempre hay un humano que está poniendo su impronta”.
Bassante recuerda: “Cuando vemos sistemas que empiezan a crear texto y poemas y cuadros y música y demás, algunos en algún momento se preguntaron si esto es susceptible de protección de derechos de autor. Pero esa respuesta, en realidad, ya la teníamos desde hace algunos años, no sé si tú recuerdas el caso famoso de la selfie del mono (ver recuadro), que terminó básicamente con el reconocimiento de que algo no humano o un ser “no humano” no puede tener una protección de derechos de autor así como la tenemos los humanos. Este caso se aplicó para el mono, pero ese principio ha sido recogido y está presente hoy también, de alguna forma, en los proyectos de ley que se están presentando y lo que se sabe es que un sistema de inteligencia artificial generativo no puede tener una protección de derechos de autor”.
La pregunta que se hace Busaniche es: “¿sirve socialmente que [algo producido por IA] tenga derecho de copyright? Recordemos que la Constitución de los Estados Unidos establece que, con el fin de promover las Artes y las Ciencias útiles, el Congreso podrá otorgarles a autores e inventores monopolios limitados en el tiempo, es decir, la propiedad intelectual. Es una política pública que tiene como objetivo promover las Artes y las Ciencias útiles. En este contexto jurídico podemos preguntar si es necesario ofrecer este sistema de monopolio a alguien que está trabajando con un sistema de IA”.
Buena pregunta, pero para la que todavía no hay una respuesta firme.
La “selfie” del mono
En 2011 el fotógrafo británico David Slater, capturó una serie de “selfies” tomadas por un macaco en Indonesia. A pesar de que Slater vendió las fotos, surgieron disputas legales sobre quién poseía los derechos de autor: si el fotógrafo, quien proporcionó el equipo y la idea, o el mono, quien técnicamente presionó el botón de la cámara.
La polémica se intensificó cuando las imágenes fueron publicadas en Wikimedia Commons bajo una licencia de uso libre. Slater demandó, alegando pérdidas económicas, pero tanto en Estados Unidos como en el Reino Unido, las autoridades determinaron que los animales no pueden ser titulares de derechos de autor.
Este caso generó un debate global sobre los límites de la propiedad intelectual en la era digital y la capacidad de los animales de ser considerados autores. Finalmente, la Oficina de Derechos de Autor de Estados Unidos sentó un precedente al afirmar explícitamente que las obras creadas por no humanos no están protegidas por derechos de autor.