La inteligencia artificial amenaza a la propiedad intelectual

La Inteligencia artificial amenaza a la propiedad intelectual

Aunque los expertos sean capaces de dar una explicación de una hora sobre qué es la Inteligencia Artificial y cómo funciona, en realidad, traducida a términos sencillos la explicación es simple:

Se trata de una serie de instrucciones expresadas en lenguaje matemático (algoritmos), que una persona o grupo de personas, le da a un modelo computacional, para que éste genere resultados.

Esto desde luego no es nuevo. Por el contrario, es la forma de entenderse con las computadoras desde que éstas se crearon y hasta la fecha. Por supuesto, este entendimiento matemático ocurre tras bambalinas, fuera de la vista de los simples usuarios que solo abrimos nuestro equipo, usamos las herramientas que trae disponible y hacemos nuestro trabajo sin preguntar.

La novedad, la gran novedad que ha puesto de moda la IA es su modalidad “generativa”. Se trata de un modelo donde la persona crea un perfil en una plataforma (Open IA, Gemini o cualquiera otra de las disponibles en el mercado) y de forma gratuita accede a un servicio que francamente parece magia:

Simplemente, uno escribe una instrucción o una pregunta (los expertos le llaman “prompt”) y la máquina solita nos responde algo más o menos coherente, a partir de la información que tiene “cargada” la plataforma.

Es decir, estas plataformas han sido alimentadas con gigantescas cantidades de información proveniente de distintas fuentes para lograr esos resultados y conforme los usuarios (millones en el mundo), le va preguntando más y más cosas, el modelo se va alimentando, va creciendo y va mejorando, porque sabe más cosas de más temas y puede producir mejores resultados.

Sin embargo, no hay maravilla sin riesgo y esta tecnología que promete cambiar al mundo, tiene un riesgo serio: la información con la que cada usuario la alimenta, así como la respuesta que ésta produce, pasa inmediatamente a ser propiedad de la compañía que ofrece el servicio y ya no es del usuario.

Pero si esto no fuera lo bastante inquietante, he aquí que la propia tecnología está evolucionando y sus tentáculos son más grandes, fuertes, precisos y sutiles, que los del kraken.

Ahora, la propia herramienta ha sido alimentada con instrucciones específicas para “rascar” datos, o lo que en inglés se llama “data scraping”.

A esta técnica se le conoce en español como “extracción de datos”, y consiste en un sistema automatizado que se mete por la puerta de atrás a enormes bases de datos, por ejemplo de universidades y centros de investigación en cualquier parte del mundo y sustrae información de todos los trabajos que ahí se encuentren, que luego el “usuario” de estos sistemas utiliza para construir nuevos documentos, sin el menor respeto a la propiedad intelectual y las leyes de protección de información. Es decir, plagio.

Así que nadie está a salvo.

Digamos que usted forma parte de un grupo de investigación académica y ha producido un trabajo que registró con su debido Copyright y confía en que cualquiera que lo consulte, le dará el crédito correspondiente y actuará de acuerdo a las normas, solicitando el permiso para el uso de la información.

Al menos así funcionaba el mundo hasta hace poco e incluso, convenciones internacionales como la de Berna o la de París, así como el Acuerdo en aspectos relacionados con el comercio y los derechos de propiedad intelectual de la Organización Mundial de Comercio estaban ahí para regular el tema de manera global, con resultados más o menos razonables.

Incluso, si se producía un diferendo por algún abuso, en general era más o menos viable establecer un reclamo y obtener un resultado favorable, aunque llevara tiempo.

Pero la extracción de datos impulsada por Inteligencia Artificial generativa (IAGen) es tan poderosa y profunda, que es capaz de “chupar” la información de cualquier base de datos, por mejor protegida que se encuentre y llevarla a alimentar al modelo de IA que se quiera, sin que los dueños de la información siquiera se den cuenta.

Y para cuando es posible detectarlo, el daño está hecho y como no existe legislación nacional ni internacional en la materia, es prácticamente imposible reclamar nada.

El Cuaderno de Trabajo número 33 de la serie de Inteligencia Artificial de la Organización para la Cooperación y el Desarrollo Económico (OCDE), titulado “Cuestiones de propiedad intelectual en la inteligencia artificial entrenada con datos extraídos” lo deja perfectamente claro:

“La extracción de datos está muy extendida y evoluciona rápidamente. Las leyes de propiedad intelectual que existen actualmente y prevén algo respecto a la IA, difieren entre jurisdicciones, complicando la aplicación de la ley”.

Es decir, prácticamente es un hecho que habrá violaciones a la propiedad intelectual, porque estos monstruos actúan de manera subrepticia pero eficaz.

La “solución” que propone la OCDE es casi tierna en su ingenuidad:

Establecer un “Código de Conducta de Extracción de Datos” que se siga de manera voluntaria por quienes realizan estas prácticas; establecer un estándar de herramientas técnicas, para que nadie extraiga datos con un martillo, cuando se deba usar un desarmador, por decirlo de alguna forma; y crear contratos estandarizados de términos para que haya cierto orden.

La otra es sensibilizar sobre la extracción de datos y sus implicaciones jurídicas, utopía que podría dotar a las partes interesadas de información sobre cómo proteger y gestionar sus derechos.

Por supuesto, esto se basa en buenas intenciones, pero difícilmente pueda funcionar, cuando cualquier persona en el mundo con la capacidad técnica suficiente es capaz de hacerlo y donde inclusive hay aplicaciones gratuitas de IA que cualquiera