Not For Machines To Harvest': Data Revolts Break Out Against A.I.

Cita: 

Frenkel, Sheera y Stuart A. Thompson [2023], "'Not for Machines to Harvest': Data Revolts Break Out Against A.I.", The New York Times, New York, 15 de julio, https://www.nytimes.com/2023/07/15/technology/artificial-intelligence-mo...

Fuente: 
Otra
Fecha de publicación: 
Sábado, Julio 15, 2023
Tema: 
Inteligencia Artificial y producción de contenido creativo
Idea principal: 

    Sheera Frenkel es una reportera en The New York Times, especialista en temas de información y tecnología. Ha documentado diversos casos de la ciberguerra en Medio Oriente y colaboró en la redacción del libro An Ugly Truth: Inside Facebook’s Battle for Domination. Fue finalista en la categoría de “reportaje nacional” por el Premio Pulitzer.

    Stuart A. Thompson es un reportero en The New York Times, especialista en los temas de información y reportaje visual. Fue pionero en la creación de un equipo de opinión visual en la misma institución y Director Gráfico en The Wall Street Journal.


    El objetivo de los autores es exponer cuáles son los efectos de la Inteligencia Artificial (IA) en el trabajo creativo de artistas digitales, mediante el uso de datos libres en internet. Se utilizan conceptos como raspado de internet, que refiere a la recolección que empresas digitales hacen para la recopilación de información, así como Inteligencia Artificial Generativa, como un nuevo tipo de IA que es capaz producir imágenes, textos y música, entre otros tipos de contenido.

    El artículo enfatiza los efectos que el raspado de internet ha tenido en el trabajo creativo de los artistas y autores digitales, especialmente la violación al derecho a la información, a la protección de datos y a la propiedad intelectual. En consecuencia, la comunidad creativa ha manifestado sus inconformidades por el robo de información hecho por la IA, quien se ha organizado mediante boicots informáticos y a través de la vía legal.

    Los boicots consistieron en la escritura masiva de historias sin sentido, para que la información realizada por la IA, basada en el raspado de internet, fuera imprecisa. A la manifestación se unieron cientos de escritores y artistas digitales, en un intento por salvaguardar el trabajo humano, entre los que se encuentran personajes como Kit Loffstad, una escritora de fanfiction, o Nicholas Kole, un ilustrador que postea su trabajo en Instagram, Twitter y otras redes sociales.

    Al boicot se sumaron alrededor de 10 demandas legales contra OpenAI (dueño de ChatGPT), Microsoft y Stability AI, motivadas por el sistema de imitación y producción de contenido creativo de la Inteligencia Artificial Generativa, un nuevo tipo de IA. El contenido creativo ha cobrado especial relevancia para las empresas tecnológicas, pues funciona como entrada del uso de datos para fines publicitarios al uso de datos para la creación de información, violando los derechos de autor.

    Empresas como Open AI o Google han mencionado que sus sistemas de Inteligencia Artificial han sido entrenados para capturar sólo “contenido con licencias, publicidad disponible y contenido creado por entrenadores de IA”, respetando los derechos e intereses de los creadores y autores. No obstante, compañías como Reddit, Stack Overflow y The Times se han unido a las manifestaciones, amenazando con cobrar por el acceso a los datos disponibles en sus plataformas.

    Aunque la situación asemeja escenarios distópicos de ciencia ficción, se esperan más olas de manifestaciones contra la IA Generativa y el raspado de internet, que demanden el respeto al trabajo creativo, la propiedad intelectual y el derecho a la información: “La rebelión de datos que estamos viendo en todo el país es la forma en la que la sociedad rechaza esta idea de que BigTech simplemente tiene derecho a tomar la información de cualquier fuente y hacerla suya”.

Datos cruciales: 

    1. GPT-3, un sistema de Inteligencia Artificial lanzado en 2020 por OpenAI, abarca 500 mil millones de tokens, cada uno de los cuales representan partes de palabras que se encuentran en Internet. Algunos modelos de IA abarcan más de mil millones de tokens.

    2. En junio de 2023, el bufete de abogados Clarkson, ubicado en Los Ángeles, presentó una propuesta de demanda colectiva de 151 páginas contra OpenAI y Microsoft, en la que describía cómo OpenAI había recopilado datos de menores. La demanda mencionaba que el raspado de internet viola la ley de derechos de autor y constituye un “robo”.

    3. En junio de 2023, Stack Overflow, un sitio de preguntas y respuestas para programadores, menciono que pediría a compañías de IA pagar por los datos. El sitio tiene cerca de 60 millones de preguntas y respuestas.

    4. En Archive or Oue Own, una base de fan fiction con más de 11 millones de historias, los escritores han presionado para prohibir la extracción de datos y de historias generadas por IA.

Trabajo de Fuentes: 
Nexo con el tema que estudiamos: 

    La creación de sistemas de IA artificial cada vez más complejos plantea nuevos retos para entender la crisis, que ya no sólo se centra en lo ambiental o lo económico, sino que intersecciona con la gobernanza global y la posición de empresas privadas transnacionales para poseer y modificar los datos de sus usuarios. Frente a la disolución del Estado y una posible crisis civilizatoria, la importancia de los recursos económicos y políticos son menores frente al poder de los datos y su uso para la creación de información.