A.I. Is Learning What It Means to Be Alive

Cita: 

Zimmer, Carl [2024], "A.I. Is Learning What It Means to Be Alive", The New York Times, New York, 10 de marzo, https://www.nytimes.com/2024/03/10/science/ai-learning-biology.html

Fuente: 
Otra
Fecha de publicación: 
Domingo, Marzo 10, 2024
Tema: 
Alcances, limitaciones y riesgos de la inteligencia artificial en la biología
Idea principal: 
    Carl Zimmer cubre noticias sobre ciencia para The New York Times y escribe la columna Origins

    Otro de los ejemplos que muestran el potencial de la inteligencia artificial (IA) y los modelos fundacionales (que saltaron a la fama luego de la presentación del chatbot, ChatGPT), es el descubrimiento de células y decodificación de material genético en el campo de la biología. Tal es el caso del hallazgo que hizo un modelo fundacional desarrollado por un equipo de investigación de la Universidad de Stanford, en el que la IA encontró la célula Norn (localizada en el riñón), responsable del control de los niveles de oxígeno en el cuerpo humano. Lo interesante es que mientras que a los humanos les tomó 134 años descubrirla, a la IA solo le tomó seis semanas y solo con información en bruto; es decir, el modelo no tenía conocimientos específicos sobre los perfiles bioquímicos ni sobre el funcionamiento de cada célula. En este aspecto, los modelos fundacionales que se utilizan en la biología tienen la capacidad de ordenar, recolectar y descubrir información sobre células y genes (dato crucial 1). En la medida en que se acumula más información (lo cual es característico de los chatbots de IA) no se tiene certeza sobre los límites y alcances de tal tecnología, o mejor dicho, se desconoce si existe un umbral para que sigan “aprendiendo”. En esta entrega Zimmer evalúa el potencial y los riesgos de la IA en la biología.

    Células cardíacas y ratas topo

    Hablando sobre certezas, el equipo de investigación de la Universidad de Stanford tampoco puede asegurar que la célula descubierta por la IA sea una célula Norn.

    El modelo de IA responsable del hallazgo es conocido como Universal Cell Embedding (UCE). El equipo de Stanford entrenó su modelo fundacional con una base de datos –en la que colaboró para su creación– llamada CellXGene (dato crucial 2). En este aspecto, UCE se ha caracterizado por su alta capacidad para entender a las células y su material genético (dato crucial 3).

    Las células Norn que localizó UCE provienen no solo de los riñones sino también de otros órganos. Esto resulta crucial porque hasta ahora este tipo de células únicamente se habían encontrado en los riñones; específicamente en la hormona eritropoyetina. De esto solo hay dos explicaciones: o la célula no es exclusiva de tal órgano, o bien, se trata de una nueva célula con propiedades similares a la Norn.

    Un “Internet de células”

    Al igual que ChatGPT, los modelos fundacionales en biología también presentan errores. Es verdad que en la medida que compilen más información, sus resultados presentarán menos sesgos. Los expertos en la materia indican que para superar estos obstáculos, se requiere que la base de datos sobre las células y los genes sea más amplia, y se combinen sus resultados con los obtenidos por los científicos. Así, los modelos fundacionales en este campo lograrían equipararse a tecnologías como ChatGPT, que toman como fuente de entrenamiento la vasta base de datos de internet (dato crucial 4).

    Con modelos fundacionales cada vez más eficientes, el campo de la biología podría revolucionarse ya que implicaría cambios en la manera de interactuar con las células. Si antes se experimentaba en placas de Petri, con la ayuda de la IA se podría crear una representación matemática y virtual de la célula. Esto permitiría someter a dicha representación a diferentes condiciones y observar (o predecir) comportamientos, así como develar incógnitas sobre la vida.

    Nuevos riesgos

    Los modelos fundacionales en biología representan un arma de doble filo.

    Además de la creación de armas biológicas, la nota indica que también se corre el riesgo de atentar contra la privacidad de las personas. Se espera que estos modelos puedan construir el genoma único de cada individuo, lo que podría contribuir a revelar cómo las diferentes versiones de los genes afectan la forma en que funcionan las células. Por otro lado, con esta información también se estaría revelando información íntima sobre el ADN y las células de una persona.

    En última instancia, el potencial de la IA en la biología depende de la manera en la que los biólogos introducen la información; es decir, saber qué datos necesitan los modelos para lograr objetivos específicos. En tanto, esto hace que los expertos se cuestionen sobre la capacidad humana frente a la rapidez con la que la IA descubre algo que al ser humano le tomó años (dato crucial 5).

Datos cruciales: 

    1) Un antecedente sobre la inteligencia artificial (IA) en la biología refiere a la utilización de atlas celulares (su creación data de hace 10 años, en un intento de investigadores por extraer y recopilar fragmentos genéticos de células individuales). Más recientemente, la doctora Christina Theodoris, residente del Hospital Infantil de Boston, en donde coordinó un proyecto que pretendía emular a una IA de 2017 –propiedad de Google– especializada en idiomas. En este caso, Theodoris creó un modelo llamado GeneFormer que se apoyaba en los atlas celulares y que tomaba información de 106 estudios replicados en humanos; esto se traducía en información sobre 30 millones de células. Los resultados que mostraba el modelo indicaban que había desarrollado un tipo de compresión profunda sobre el comportamiento de los genes en las células. Un ejemplo puntual refiere a que GeneFormer recomendó reducir la actividad de cuatro genes que nunca se habían relacionado con enfermedades cardíacas, con resultados exitosos.

    2) En agosto de 2023, el equipo de investigación de la Universidad de Stanford entrenó al modelo fundacional Universal Cell Embedding (UCE) con información de 33 millones de células, centrándose en un tipo de información genética conocida como ARN mensajero. Del mismo modo, también se entrenó al modelo con estructuras tridimensionales de las proteínas (producto de los genes). Así, UCE calculó la similitud entre células y las agrupó en más de mil grupos de acuerdo con la forma que usaban los genes; grupos que representaban un breviario de descubrimientos de generaciones de biólogos.

    3) Entre los logros obtenidos por UCE se encuentra el reconocimiento del desarrollo de las células a partir de un solo óvulo fertilizado y la capacidad de mapear el perfil genético de las células de un animal desconocido por el modelo.

    4) Se realizaron pruebas en GeneFormer y scGPT (otro modelo fundacional en biología) por parte de la Universidad de Oxford, en donde se les pidió que realizaran tareas como la clasificación de células en tipos, a partir de atlas celulares nuevos (es decir, no habían entrenado con ellos antes). Los modelos se desempeñaron bien en algunas tareas, pero en otras obtuvieron resultados inferiores a los que se obtienen de programas informáticos simples.

    5) El 8 de marzo de 2024 más de 80 biólogos y expertos en IA firmaron un llamado para que la tecnología sea regulada y así no pueda ser utilizada para crear armas biológicas (https://www.nytimes.com/2024/03/08/technology/biologists-ai-agreement-bi...)

Nexo con el tema que estudiamos: 

    La nota cuestiona acerca de las capacidades del ser humano con respecto a la inteligencia artificial (IA); un tema que ha salido a relucir por los temores a que este tipo de tecnología termine desplazando al ser humano. Este desplazamiento es evidente en el caso de la clasificación celular, en que los modelos de IA son más veloces y precisos que las y los científicos.

    Sin embargo, esta predicción o temor, no es absoluta, puesto que la IA y los modelos fundacionales son productos generados por el ser humano, que requieren computadoras y cables alimentados por grandes cantidades de energía; en tanto productos de corporaciones y del sistema capitalista, los modelos de IA son dependientes de la organización humana. Tanto el potencial, los errores y los riesgos en los modelos fundacionales, están sujetos a la capacidad y albedrío del ser humano. Los datos provienen del conocimiento humano y por tanto la "generación de conocimiento" por parte de la IA es producto de la capacidad humana. Sobre esa línea, lo que si resulta tangible es el cada vez más presente capitalismo de la vigilancia, entretanto mercantilización de datos. Esto supone una subordinación más aguda, con el objetivo de seguir perpetuando el sistema capitalista.

    Con la información disponible, el escenario más probable es el de una repetición de los anteriores saltos tecnológicos, que en efecto implicaron el desplazamiento de importantes contingentes de trabajadorxs y de ciertas tareas (o fragmentos de tareas), que fueron incorporadas a los dispositivos automáticos. A la par, surgirán y se consolidarán tareas y puestos de trabajo indispensables para el funcionamiento de los modelos de IA, que no compensarán las pérdidas pero crearán demanda efectiva y mercados de trabajo.

    La posibilidad de innovaciones cruciales está ligada a un salto tecnológico que aún no está presente en las tecnologías de IA existentes. Sin descartar la posibilidad de que tal innovación se produzca, no se percibe que sea en un horizonte de corto plazo.