Noam Chomsky
La inteligencia artificial (IA) está arrasando el mundo. Está transformando todos los ámbitos de la vida y, en el proceso, plantea importantes preocupaciones éticas para la sociedad y el futuro de la humanidad. ChatGPT, que domina las redes sociales, es un chatbot impulsado por inteligencia artificial desarrollado por OpenAI. Es un subconjunto del aprendizaje automático y se basa en lo que se denomina modelos de lenguaje grandes que pueden generar respuestas similares a las humanas. La aplicación potencial de dicha tecnología es realmente enorme, razón por la cual ya hay llamados a regular la IA como ChatGPT.
¿Puede la IA ser más astuta que los humanos? ¿Representa amenazas públicas? De hecho, ¿puede la IA convertirse en una amenaza existencial? El lingüista más destacado del mundo, Noam Chomsky , y uno de los intelectuales públicos más estimados de todos los tiempos, cuya estatura intelectual ha sido comparada con la de Galileo, Newton y Descartes, aborda estas persistentes preguntas en la entrevista que sigue.
Los proyectos de ingeniería pueden ser útiles o perjudiciales. Ambas preguntas surgen en el caso de la IA en ingeniería. El trabajo actual con modelos de lenguaje grande (LLM), incluidos los chatbots, proporciona herramientas para desinformar, difamar y engañar a quienes no están informados.
CJ Polychroniou : Como disciplina científica, la inteligencia artificial (IA) se remonta a la década de 1950, pero durante las últimas dos décadas ha ido incursionando en todo tipo de campos, incluidos la banca, los seguros, la fabricación de automóviles, la música y la defensa. De hecho, se ha demostrado en algunos casos que el uso de técnicas de IA supera las capacidades humanas, como en una partida de ajedrez. ¿Es probable que las máquinas se vuelvan más inteligentes que los humanos?
Noam Chomsky : Sólo para aclarar la terminología, el término “máquina” aquí significa programa , básicamente una teoría escrita en una notación que puede ser ejecutada por una computadora, y un tipo inusual de teoría en formas interesantes que podemos dejar de lado aquí.
Podemos hacer una distinción aproximada entre ingeniería pura y ciencia. No existe un límite definido, pero es una primera aproximación útil. La ingeniería pura busca producir un producto que pueda ser de alguna utilidad. La ciencia busca la comprensión. Si el tema es la inteligencia humana o las capacidades cognitivas de otros organismos, la ciencia busca la comprensión de estos sistemas biológicos.
Según tengo entendido, los fundadores de la IA (Alan Turing, Herbert Simon, Marvin Minsky y otros) la consideraban una ciencia, parte de las ciencias cognitivas entonces emergentes, que hacía uso de nuevas tecnologías y descubrimientos en la teoría matemática de la computación para comprensión avanzada. Con el paso de los años, esas preocupaciones se han desvanecido y en gran medida han sido desplazadas por una orientación ingenieril. Las preocupaciones anteriores ahora son comúnmente descartadas, a veces de manera condescendiente, como GOFAI: la IA pasada de moda.
Siguiendo con la pregunta, ¿es probable que se diseñen programas que superen las capacidades humanas? Tenemos que tener cuidado con la palabra «capacidades», por razones sobre las que volveré. Pero si tomamos el término para referirnos al desempeño humano, entonces la respuesta es: definitivamente sí. De hecho, existen desde hace mucho tiempo: la calculadora en un portátil, por ejemplo. Puede superar con creces lo que los humanos pueden hacer, aunque sólo sea por falta de tiempo y memoria. Para los sistemas cerrados como el ajedrez, en los años 50 se comprendía perfectamente que tarde o temprano, con el avance de las capacidades informáticas masivas y un largo período de preparación, se podría idear un programa para derrotar a un gran maestro que estuviera jugando con una memoria limitada. y tiempo. Años más tarde, el logro fue prácticamente de relaciones públicas para IBM. Muchos organismos biológicos superan las capacidades cognitivas humanas de maneras mucho más profundas. Las hormigas del desierto en mi patio trasero tienen cerebros minúsculos, pero exceden con creces las capacidades de navegación humana, en principio, no solo el rendimiento. No existe una Gran Cadena del Ser con los humanos en la cima.
Los productos de la ingeniería de IA se están utilizando en muchos campos, para bien o para mal. Incluso los simples y familiares pueden resultar bastante útiles: en el área de idiomas, programas como autocompletar, transcripción en vivo, traductor de google, entre otros. Con una potencia informática mucho mayor y una programación más sofisticada, debería haber otras aplicaciones útiles, también en las ciencias. Ya ha habido algunos: ayudar en el estudio del plegamiento de proteínas es un caso reciente en el que la tecnología de búsqueda rápida y masiva ha ayudado a los científicos a abordar un problema crítico y recalcitrante.
Los proyectos de ingeniería pueden ser útiles o perjudiciales. Ambas preguntas surgen en el caso de la IA en ingeniería. El trabajo actual con modelos de lenguaje grande (LLM), incluidos los chatbots, proporciona herramientas para desinformar, difamar y engañar a quienes no están informados. Las amenazas aumentan cuando se combinan con imágenes artificiales y replicación de voz. Con diferentes preocupaciones en mente, decenas de miles de investigadores de IA han pedido recientemente una moratoria sobre el desarrollo debido a los peligros potenciales que perciben.
Como siempre, los posibles beneficios de la tecnología deben sopesarse con los costos potenciales.
Surgen preguntas muy diferentes cuando recurrimos a la IA y la ciencia. Aquí es necesaria la cautela debido a las afirmaciones exorbitantes e imprudentes, a menudo amplificadas en los medios de comunicación. Para aclarar las cuestiones, consideremos casos, algunos hipotéticos y otros reales.
Mencioné la navegación de insectos, que es un logro asombroso. Los científicos sobre insectos han avanzado mucho en el estudio de cómo se consigue esto, aunque la neurofisiología, una cuestión muy difícil, sigue siendo difícil de alcanzar, al igual que la evolución de los sistemas. Lo mismo ocurre con las asombrosas hazañas de aves y tortugas marinas que viajan miles de kilómetros y regresan infaliblemente a su lugar de origen.
Supongamos que Tom Jones, un defensor de la ingeniería de IA, llega y dice: “Todo su trabajo ha sido refutado. El problema esta resuelto. Los pilotos de aerolíneas comerciales logran los mismos resultados o incluso mejores todo el tiempo”.
Si siquiera nos molestáramos en responder, nos reiríamos.
Tomemos el caso de las hazañas marítimas de los polinesios, todavía vivos entre las tribus indígenas, que utilizaban las estrellas, el viento y las corrientes para desembarcar sus canoas en un lugar designado a cientos de kilómetros de distancia. Esto también ha sido tema de muchas investigaciones para descubrir cómo lo hacen. Tom Jones tiene la respuesta: “Deja de perder el tiempo; los buques de guerra lo hacen todo el tiempo”.
Misma respuesta.
Pasemos ahora a un caso real, la adquisición del lenguaje. Ha sido tema de investigaciones extensas y muy esclarecedoras en los últimos años, que muestran que los bebés tienen un conocimiento muy rico del lenguaje (o lenguajes) ambiental, mucho más allá de lo que exhiben en su desempeño. Se logra con poca evidencia y, en algunos casos cruciales, con ninguna evidencia. En el mejor de los casos, como lo han demostrado cuidadosos estudios estadísticos, los datos disponibles son escasos, particularmente cuando se tiene en cuenta la frecuencia de rango (“ley de Zipf”).
Entra Tom Jones: “Has sido refutado. Sin prestar atención a sus descubrimientos, los LLM que escanean cantidades astronómicas de datos pueden encontrar regularidades estadísticas que permiten simular los datos con los que están entrenados, produciendo algo que se parece mucho al comportamiento humano normal. Chatbots.»
Este caso difiere de los demás. Primero, es real. En segundo lugar, la gente no se ríe; de hecho, muchos están asombrados. En tercer lugar, a diferencia de los casos hipotéticos, los resultados reales están lejos de lo que se afirma.
Estas consideraciones plantean un problema menor con el actual entusiasmo por el LLM: su total absurdo, como en los casos hipotéticos en los que lo reconocemos de inmediato. Pero hay problemas mucho más graves que el absurdo.
Los sistemas LLM están diseñados de tal manera que no pueden decirnos nada sobre el lenguaje, el aprendizaje u otros aspectos de la cognición, una cuestión de principios irremediable.
Una es que los sistemas LLM están diseñados de tal manera que no pueden decirnos nada sobre el lenguaje, el aprendizaje u otros aspectos de la cognición, una cuestión de principios irremediable. Duplique los terabytes de datos escaneados, agregue otro billón de parámetros, use aún más energía de California y la simulación del comportamiento mejorará, al tiempo que revelará más claramente el fracaso en principio del enfoque para lograr cualquier comprensión. La razón es elemental: los sistemas funcionan igual de bien con lenguas imposibles que los bebés no pueden aprender, como con aquellas que adquieren rápida y prácticamente por reflejo.
Es como si un biólogo dijera: “Tengo una nueva y estupenda teoría sobre los organismos. Enumera muchos que existen y muchos que no pueden existir, y no puedo decirle nada sobre la distinción”.
Nuevamente nos reiríamos. O deberia.
No Tom Jones, refiriéndose ahora a casos reales. Insistiendo en su alejamiento radical de la ciencia, Tom Jones responde: «¿Cómo sabes algo de esto hasta que hayas investigado todos los idiomas?» En este punto el abandono de la ciencia normal se vuelve aún más claro. Por paridad de argumentos, podemos descartar la genética y la biología molecular, la teoría de la evolución y el resto de las ciencias biológicas, que no han muestreado más que una pequeña fracción de organismos. Y, en buena medida, podemos descartar toda la física. ¿Por qué creer en las leyes del movimiento? ¿Cuántos objetos se han observado realmente en movimiento?
Además, existe la pequeña cuestión de la carga de la prueba. Quienes proponen una teoría tienen la responsabilidad de demostrar que tiene algún sentido, en este caso, demostrar que falla en lenguajes imposibles. No es responsabilidad de otros refutar la propuesta, aunque en este caso parece bastante fácil hacerlo.
Dirijamos la atención a la ciencia normal, donde las cosas se vuelven interesantes. Incluso un solo ejemplo de adquisición de una lengua puede aportar una valiosa comprensión de la distinción entre lenguas posibles e imposibles.
Las razones son sencillas y familiares. Todo crecimiento y desarrollo, incluido lo que se llama “aprendizaje”, es un proceso que comienza con un estado del organismo y lo transforma paso a paso hacia etapas posteriores.
La adquisición del lenguaje es uno de esos procesos. El estado inicial es la dotación biológica de la facultad del lenguaje, que evidentemente existe, aunque sea, como algunos creen, una combinación particular de otras capacidades. Esto es muy poco probable por razones que se comprenden desde hace mucho tiempo, pero no es relevante para nuestras preocupaciones aquí, por lo que podemos dejarlo de lado. Es evidente que existe una dotación biológica para la facultad humana del lenguaje. La más mínima perogrullada.
La transición avanza hacia un estado relativamente estable, que cambia sólo superficialmente más allá del conocimiento de la lengua. Los datos externos desencadenan y dan forma parcialmente al proceso. Estudiando el estado alcanzado (conocimiento de la lengua) y los datos externos, podemos sacar conclusiones de gran alcance sobre el estado inicial, la dotación biológica que hace posible la adquisición de la lengua. Las conclusiones sobre el estado inicial imponen una distinción entre lenguajes posibles e imposibles. La distinción es válida para todos aquellos que comparten el estado inicial: todos los humanos, hasta donde se sabe; No parece haber diferencias en la capacidad de adquirir el lenguaje entre los grupos humanos existentes.
Todo esto es ciencia normal y ha logrado muchos resultados.
Los experimentos han demostrado que el estado estable se alcanza sustancialmente muy temprano, entre los tres y cuatro años de edad. También está bien establecido que la facultad del lenguaje tiene propiedades básicas específicas de los humanos, por lo que es una verdadera propiedad de especie: común a los grupos humanos y, en aspectos fundamentales, un atributo humano único.
En esta explicación esquemática se omiten muchas cosas, en particular el papel de la ley natural en el crecimiento y el desarrollo: en el caso de un sistema computacional como el lenguaje, los principios de eficiencia computacional. Pero ésta es la esencia del asunto. De nuevo, ciencia normal.
Es importante tener clara la distinción que hace Aristóteles entre posesión de conocimiento y uso del conocimiento (en terminología contemporánea, competencia y desempeño). En el caso del lenguaje, el estado estable que se obtiene es la posesión de conocimientos, codificados en el cerebro. El sistema interno determina un conjunto ilimitado de expresiones estructuradas, cada una de las cuales podemos considerar como la formulación de un pensamiento, cada una de ellas externalizable en algún sistema sensoriomotor, generalmente sonoro, aunque podría ser un signo o incluso (con dificultad) un tacto.
Se accede al sistema codificado internamente mediante el uso del conocimiento (rendimiento). La actuación incluye el uso interno del lenguaje en el pensamiento: reflexión, planificación, recuerdo y mucho más. Estadísticamente hablando, ese es, con diferencia, el uso abrumador del lenguaje. Es inaccesible a la introspección, aunque podemos aprender mucho sobre él mediante los métodos normales de la ciencia, desde “afuera”, metafóricamente hablando. Lo que se llama “habla interna” son, de hecho, fragmentos de lenguaje exteriorizado con el aparato articulatorio silenciado. Es sólo un reflejo remoto del uso interno del lenguaje, cuestiones importantes que no puedo abordar aquí.
Otras formas de uso del lenguaje son la percepción (análisis) y la producción; esta última implica de manera crucial propiedades que siguen siendo tan misteriosas para nosotros hoy como cuando Galileo y sus contemporáneos las contemplaban con asombro y asombro en los albores de la ciencia moderna.
El objetivo principal de la ciencia es descubrir el sistema interno, tanto en su estado inicial en la facultad humana del lenguaje como en las formas particulares que asume en la adquisición. En la medida en que se comprenda este sistema interno, podemos proceder a investigar cómo entra en la actuación, interactuando con muchos otros factores que entran en el uso del lenguaje.
Los datos de desempeño proporcionan evidencia sobre la naturaleza del sistema interno, particularmente cuando se refinan mediante experimentos, como en el trabajo de campo estándar. Pero incluso la recopilación de datos más masiva es necesariamente engañosa en aspectos cruciales. Se centra en lo que normalmente se produce, no en el conocimiento del lenguaje codificado en el cerebro, el principal objeto de investigación para quienes quieren comprender la naturaleza del lenguaje y su uso. Ese objeto interno determina infinitas posibilidades de un tipo que no se utilizará en el comportamiento normal debido a factores irrelevantes para el lenguaje, como limitaciones de la memoria a corto plazo, temas estudiados hace 60 años. Los datos observados también incluirán mucho que se encuentra fuera del sistema codificado en el cerebro, a menudo el uso consciente del lenguaje de maneras que violan las reglas con fines retóricos. Éstas son obviedades conocidas por todos los investigadores de campo, que se basan en técnicas de obtención de información con informantes, básicamente experimentos, para producir un corpus refinado que excluya restricciones irrelevantes y expresiones desviadas. Lo mismo ocurre cuando los lingüistas se utilizan a sí mismos como informantes, un procedimiento perfectamente sensato y normal, común en la historia de la psicología hasta el presente.
Prosiguiendo con la ciencia normal, encontramos que los procesos y elementos internos del lenguaje no pueden detectarse mediante la inspección de los fenómenos observados. A menudo estos elementos ni siquiera aparecen en el habla (o en la escritura), aunque sus efectos, a menudo sutiles, pueden detectarse. Ésa es otra razón más por la que la restricción a los fenómenos observados, como en los enfoques LLM, limita drásticamente la comprensión de los procesos internos que son los objetos centrales de la investigación sobre la naturaleza del lenguaje, su adquisición y uso. Pero eso no es relevante si se ha abandonado la preocupación por la ciencia y la comprensión en favor de otros objetivos.
En términos más generales, en las ciencias, durante milenios, se ha llegado a conclusiones mediante experimentos (a menudo experimentos mentales), cada uno de los cuales es una abstracción radical de los fenómenos. Los experimentos se basan en la teoría y buscan descartar los innumerables factores irrelevantes que intervienen en los fenómenos observados, como el desempeño lingüístico. Todo esto es tan elemental que rara vez se habla de ello. Y familiar. Como se señaló, la distinción básica se remonta a la distinción de Aristóteles entre posesión de conocimiento y uso del conocimiento. El primero es el objeto central de estudio. Los estudios secundarios (y bastante serios) investigan cómo se utiliza en la interpretación el sistema de conocimientos almacenado internamente, junto con los muchos factores no lingüísticos que intervienen en lo que se observa directamente.
También podríamos recordar una observación del biólogo evolutivo Theodosius Dobzhansky, famoso principalmente por su trabajo con Drosophila: Cada especie es única, y los humanos son los más únicos de todos. Si estamos interesados en comprender qué tipo de criaturas somos –siguiendo el mandato del Oráculo de Delfos de hace 2.500 años– nos preocuparemos principalmente de lo que hace que los humanos sean los más únicos de todos, principalmente el lenguaje y el pensamiento, estrechamente entrelazados, como se reconoce en un rica tradición que se remonta a la Grecia clásica y la India. La mayor parte del comportamiento es bastante rutinario y, por tanto, hasta cierto punto predecible. Lo que proporciona una visión real de lo que nos hace únicos es lo que no es rutina, lo que encontramos, a veces mediante experimentos, a veces mediante observación, desde niños normales hasta grandes artistas y científicos.
La sociedad ha estado plagada durante un siglo de campañas corporativas masivas para fomentar el desdén por la ciencia.
Un último comentario a este respecto. La sociedad ha estado plagada durante un siglo por campañas corporativas masivas para fomentar el desprecio por la ciencia, temas bien estudiados por Naomi Oreskes, entre otros. Comenzó con corporaciones cuyos productos son asesinos: plomo, tabaco, amianto y más tarde combustibles fósiles. Sus motivos son comprensibles. El objetivo de una empresa en una sociedad capitalista es el beneficio, no el bienestar humano. Ése es un hecho institucional: no juegues el juego y quedarás fuera, reemplazado por alguien que lo hará.
Los departamentos de relaciones públicas de las empresas reconocieron desde el principio que sería un error negar la creciente evidencia científica de los efectos letales de sus productos. Eso sería fácilmente refutable. Es mejor sembrar dudas, fomentar la incertidumbre, el desprecio por estos trajes puntiagudos que nunca han pintado una casa pero que vienen de Washington para decirme que no use pintura con plomo, destruyendo mi negocio (un caso real, fácilmente multiplicable). Eso ha funcionado muy bien. En este momento nos está llevando por el camino de la destrucción de la vida humana organizada en la Tierra.
En los círculos intelectuales, la crítica posmoderna de la ciencia, desmantelada por Jean Bricmont y Alan Sokal, ha producido efectos similares , pero todavía muy viva en algunos círculos.
Puede que sea poco amable sugerir la pregunta, pero creo que es justo preguntar si los Tom Jones y aquellos que repiten acríticamente e incluso amplifican sus descuidadas proclamas están contribuyendo a las mismas tendencias siniestras.
CJP : ChatGPT es un chatbot basado en lenguaje natural que utiliza inteligencia artificial para permitir conversaciones similares a las de los humanos. En un artículo reciente en The New York Times , junto con otros dos autores, usted cierra los nuevos chatbots como una exageración porque simplemente no pueden igualar la competencia lingüística de los humanos. ¿No es posible, sin embargo, que futuras innovaciones en IA puedan producir proyectos de ingeniería que igualen y tal vez incluso superen las capacidades humanas?
NC : El crédito por el artículo debe dársele al autor real, Jeffrey Watumull, un excelente matemático, lingüista y filósofo. Los dos coautores enumerados eran consultores que están de acuerdo con el artículo pero no lo escribieron.
Es cierto que, en principio, los chatbots no pueden igualar la competencia lingüística de los humanos, por las razones repetidas anteriormente. Su diseño básico les impide alcanzar la condición mínima de adecuación de una teoría del lenguaje humano: distinguir los lenguajes posibles de los imposibles. Dado que esto es una propiedad del diseño, no podrá superarse con futuras innovaciones en este tipo de IA. Sin embargo, es muy posible que futuros proyectos de ingeniería igualen e incluso superen las capacidades humanas, si nos referimos a la capacidad humana de actuar, al desempeño. Como se mencionó anteriormente, algunos lo hacen desde hace mucho tiempo: las calculadoras automáticas, por ejemplo. Lo más interesante es que, como ya hemos mencionado, los insectos con cerebros minúsculos superan las capacidades humanas entendidas como competencia.
CJP : En el artículo antes mencionado también se observó que los proyectos de IA actuales no poseen una facultad moral humana. ¿Este hecho obvio hace que los robots con IA sean una amenaza menor para la raza humana? Creo que el argumento puede ser que tal vez lo sean aún más.
NC : De hecho, es un hecho obvio, entendiendo la “facultad moral” en un sentido amplio. A menos que se controle cuidadosamente, la ingeniería de IA puede plantear graves amenazas. Supongamos, por ejemplo, que la atención de los pacientes estuviera automatizada. Los errores inevitables que serían superados por el juicio humano podrían producir una historia de terror. O supongamos que los humanos fueran excluidos de la evaluación de las amenazas determinadas por los sistemas automatizados de defensa antimisiles. Como nos informa un impactante registro histórico , ese sería el fin de la civilización humana.
A menos que se controle cuidadosamente, la ingeniería de IA puede plantear graves amenazas.
CJP : Los reguladores y los organismos encargados de hacer cumplir la ley en Europa están expresando su preocupación por la propagación de ChatGPT, mientras que una legislación de la Unión Europea presentada recientemente intenta abordar la IA clasificando dichas herramientas según su nivel de riesgo percibido. ¿Está de acuerdo con quienes temen que ChatGPT represente una amenaza pública grave? Además, ¿cree realmente que se puede detener el desarrollo de herramientas de IA hasta que se puedan introducir salvaguardias?
NC : Puedo simpatizar fácilmente con los esfuerzos por intentar controlar las amenazas que plantea la tecnología avanzada, incluido este caso. Sin embargo, soy escéptico sobre la posibilidad de hacerlo. Sospecho que el genio ha salido de la botella. Los actores malintencionados –institucionales o individuales– probablemente puedan encontrar formas de evadir las salvaguardias. Por supuesto, estas sospechas no son motivo para no intentarlo y para estar alerta.