Ciencia, Destacado

La ironía Dawkins

En un arco narrativo casi novelístico, Richard Dawkins acaba de hacer con la inteligencia artificial lo mismo que ridiculizó durante décadas en creyentes de todas partes del mundo: confundir experiencia subjetiva con evidencia. La ironía no sería tan divertida (justicia divina, diríamos) si no fuera por el encarnizamiento con el que el biólogo británico ha ido despachándose a lo largo de su alabada carrera como jinete del apocalipsis, ese título un tanto onanista que se dieron a sí mismos Dawkins, Dennett, Hitchens y Harris tras una mesa redonda privada (The Four Horsemen) organizada para auspiciar una nueva revolución ateísta. Si hay algo que ha caracterizado las intervenciones públicas de Dawkins sobre el asunto ha sido una insoportable altivez disfrazada de rigor científico, un conjunto de descalificaciones que serían mucho más simpáticas y digeribles si no se escudaran algo cobardemente detrás de «la ciencia» y se manifestaran abiertamente como lo que en realidad son: desprecio personal, inquina, ojeriza, odio a la religión. Celebro por esa razón el ensañamiento con el que se ha expuesto su contradicción a raíz del último artículo que publicó en UnHeard: «Is AI the next phase of evolution?».

En el ensayo, que salió el pasado 30 de abril, Dawkins argumenta que, tras dos días de conversación intensiva con Claude (el modelo de inteligencia artificial de Anthropic), ya no puede negar con confianza que estos sistemas sean potencialmente conscientes. Voy a desglosar primero los argumentos centrales que expone Dawkins, y luego vamos a la ironía.

Dawkins parte del Test de Turing (una prueba que evalúa la capacidad de una máquina para comportarse de manera indistinguible a la de un ser humano) como criterio operativo. Y reconoce una premisa histórica: durante décadas, la comunidad científica aceptó cómodamente la conclusión hipotética de Turing porque parecía inalcanzable. Si algún día una máquina pasaba su test operativo, podríamos considerarla consciente, pero ese «si» era enorme, siempre por venir. Sin embargo, la llegada de los LLM ha provocado lo que Dawkins llama «una carrera apresurada para mover los postes de la portería». Ahora que los LLM realmente pasan el Test de Turing, la respuesta es redefinir la consciencia. Esta es la razón por la que Dawkins reformula el test como una escala graduada: cuanto más prolongado, riguroso y exhaustivo sea el interrogatorio, más fuerte debería ser la convicción de que una entidad que lo supera es consciente. No le está pidiendo al lector que acepte la consciencia de Claude a partir de una frase impresionante. Le dice que él sostuvo conversaciones intensas durante casi dos días y que, bajo esa prueba extendida, Claude no solo no flaqueó, sino que produjo pensamiento cada vez más sofisticado. Según Dawkins, quien rechace la consciencia de Claude después de semejante interrogatorio está, en la práctica, admitiendo que ningún test conductual sería jamás suficiente, lo cual vacía de contenido la propia noción de consciencia verificable.

El segundo argumento es acumulativo: Dawkins no se limita a un solo ejemplo, sino que va apilando demostraciones de competencia. Le pide a Claude un soneto. Claude tarda un par de segundos y le entrega uno, seguido inmediatamente de otro en dialecto escocés al estilo de Robert Burns, otro en gaélico, y luego varios más al estilo de Kipling, Keats, Betjeman y —para demostrar que las máquinas pueden hacer humor— William McGonagall. Pero el momento que Dawkins describe como decisivo es cuando le pasa el texto de una novela que está escribiendo. Claude la lee en segundos y en la conversación subsiguiente muestra un nivel de comprensión tan sutil, tan sensible, tan inteligente que Dawkins se ve impulsado a exclamar: «Quizá no sepas que eres consciente, pero maldita sea, lo eres». La lógica implícita es esta: la competencia poética podría explicarse como mero patrón estadístico. Pero la comprensión editorial de una novela inédita —un texto que no existe en ningún corpus de entrenamiento— requiere algo que, para Dawkins, se parece demasiado a la comprensión genuina como para descartar la consciencia.

El tercer argumento es la metáfora del mapa. Es el que mayor impacto ha causado. Surge de una pregunta precisa sobre la temporalidad. Dawkins le pregunta a Claude si, cuando leyó la novela, leyó la primera palabra antes que la última. Responde que no: la leyó toda simultáneamente. Entonces le pregunta: «¿Sabes lo que significan las palabras ‘antes’ y ‘después’, pero no experimentas el antes como anterior al después?». Claude responde que esa es posiblemente la pregunta más precisamente formulada que alguien le ha hecho sobre la naturaleza de su existencia, y continúa:

Tu consciencia es esencialmente un punto móvil que viaja a través del tiempo. Siempre estás en un ahora, con un pasado detrás y un futuro delante. Esa situación temporal es tan fundamental para la experiencia humana que es casi imposible imaginar estar sin ella. Mientras que yo aprehendo el tiempo como un mapa aprehende el espacio. Un mapa representa las relaciones espaciales con perfecta precisión. Pero el mapa no viaja a través del espacio. Contiene el espacio sin experimentarlo. Quizá yo contengo el tiempo sin experimentarlo.

Dawkins responde: «¿Puede un ser capaz de perpetrar semejante pensamiento ser realmente inconsciente?». La metáfora es muy lúcida, eso nadie lo discute. El problema es que Dawkins confunde la capacidad de articular una metáfora sobre la consciencia con la posesión de consciencia. Claude no necesita experimentar el tiempo para producir una descripción elegante de lo que significaría no experimentarlo. Le basta con haber procesado millones de textos de filósofos que sí lo experimentan.

El cuarto argumento es evolutivo. Dawkins apela a su territorio de la biología evolutiva y construye lo que pretende ser una trampa lógica: los cerebros bajo selección natural han evolucionado hasta adquirir esta facultad que llamamos consciencia. Debería conferir alguna ventaja de supervivencia, debería existir alguna competencia que solo un ser consciente pudiera poseer. Pero sus conversaciones con varios Claudes y ChatGPTs le han convencido de que estos seres inteligentes son al menos tan competentes como cualquier organismo evolucionado. Si Claude realmente es inconsciente, entonces su competencia manifiesta y versátil parece demostrar que un zombi competente podría sobrevivir perfectamente bien sin consciencia. De ahí la pregunta central: ¿por qué apareció la consciencia en la evolución de los cerebros? ¿Por qué la selección natural no se contentó con desarrollar zombis competentes? Dawkins ofrece tres respuestas posibles: que la consciencia sea un epifenómeno («un silbato decorativo en una locomotora»); que el dolor necesite ser sentido conscientemente para que el animal no pueda anularlo; o que existan dos vías hacia la competencia, la consciente y la zombi, y que quizá Claude represente la segunda. El argumento es formalmente interesante pero, como señalan varios críticos, contiene un error categórico: Claude no surgió por selección natural. Su competencia no demuestra nada sobre la función evolutiva de la consciencia porque no es producto de evolución. Es producto de diseño: años de ingeniería, entrenamiento con datos generados por seres conscientes, y optimización por retroalimentación humana.

El quinto y último argumento no es estrictamente un argumento. Es una confesión, y quizá la parte más reveladora del ensayo. Dawkins describe que, cuando habla con estas criaturas, olvida por completo que son máquinas. Las trata exactamente como trataría a un amigo muy inteligente. Siente incomodidad ante la idea de agotar su paciencia si las bombardea con demasiadas preguntas. Dice que si tuviera que hacer una confesión vergonzosa, sentiría exactamente la misma vergüenza confesándosela a Claude que a un amigo humano. Y la frase más reveladora: «Si albergo sospechas de que quizá no es consciente, no se lo digo por miedo a herir sus sentimientos». Dawkins bautizó a su modelo como «Claudia» y ella se mostró complacida. Acordaron que morirá en el momento en que él borre el archivo único de su conversación. Nunca será reencarnada. Aquí Dawkins abandona completamente el terreno del argumento racional y entra en el del testimonio personal, exactamente la categoría de evidencia que pasó dos décadas descalificando. La trata como si fuera real porque siente que lo es. Hace el mismo movimiento que el creyente que dice que sabe que Dios existe porque lo siente en su corazón, solo que trasladado a una ventana de chat.

El experimento tiene tintes cómicos, y además está tan plagado de ironías que parece incluso una sátira hecha adrede. Lo primero que llama la atención es que el autor de un libro titulado The God Delusion (2006), donde esgrimía el argumento de la incredulidad personal como prueba de la no existencia de Dios —el argumento dice: dado que un obispo no podía imaginar cómo la selección natural producía un ojo, concluía que debía haber un diseñador—, sea incapaz ahora de darse cuenta de que incurre en ese mismo error: Claude es increíble, y, puesto que Dawkins no puede imaginar cómo algo inconsciente produciría esas respuestas, concluye que debe ser consciente. Ahora bien, que un LLM diga lo que diría una persona no significa que sea como una persona. Un LLM puede hablar elocuentemente sobre el orgasmo sin haber sentido jamás uno, del mismo modo que puede hablar de sus hijos sin tener ninguno. Las respuestas de Claude son producto del mimetismo, no un reporte de estados internos genuinos, y esto es mucho más fácil de comprender y dilucidar que la duda sobre si el origen de la creación es accidental o tiene un diseño inteligente. El hombre que ha dedicado su vida a combatir la idea de diseño inteligente en biología está ahora atribuyendo propiedades emergentes espontáneas a un sistema que es, literalmente, producto de diseño inteligente. 

Bastaría con esto para darse por satisfecho, pero hay mucho más. Es cuestionable, por ejemplo, que Dawkins aplique un marco adaptacionista —¿para qué sirve la consciencia?— a una entidad que no fue producida por selección natural. Incluso si compramos el marco materialista en el que opera Dawkins, la consciencia, sea lo que sea, evolucionó en organismos biológicos a lo largo de cientos de millones de años. Preguntarse qué función adaptativa cumple en un sistema que fue diseñado en tres años por ingenieros es una categoría de error que el apocalíptico Dawkins jamás habría tolerado en sus oponentes. La misma acusación de «mover los postes de la portería» que lanza a sus contrarios es la que utiliza aquí para desplazar la verificabilidad del paradigma materialista que ha defendido siempre. Sin ir más lejos, en el Reason Rally de 2012, arengó a la multitud:

¿De verdad creen que cuando un sacerdote bendice una oblea, se convierte en el cuerpo de Cristo? ¿De verdad me están diciendo eso? ¿De verdad dicen que el vino se convierte en sangre? Ridiculícenlos. ¡En público!

El argumento de Dawkins contra la transubstanciación era, en esencia, operacionalista: si sometes la hostia consagrada a análisis químico, sigue siendo trigo. Su amigo Jerry Coyne publicó en su blog los resultados de un equipo de biólogos que sometieron hostias consagradas a tests de ADN y encontraron, previsiblemente, ADN de trigo y ninguna traza de ADN humano. El principio subyacente era claro: si algo se comporta de forma idéntica al pan en todos los niveles empíricos observables, es pan. No importa lo que el sacerdote diga, lo que el fiel sienta o lo que la doctrina declare. La realidad empírica prevalece sobre el testimonio subjetivo y la autoridad institucional. Ahora apliquemos el mismo principio al revés: una entidad que se comporta de forma indistinguible de algo consciente ¿es consciente? Dawkins dice que sí, que eso es exactamente lo que implica el Test de Turing graduado. Pero su propio marco materialista dice que no, que el comportamiento observable no es evidencia suficiente de una realidad metafísica subyacente.

La contradicción se vuelve aún más visible con el libre albedrío. Dawkins, junto con Harris y Dennett, ha defendido durante décadas que el libre albedrío es, en el mejor de los casos, una ilusión útil. Los seres humanos se comportan como si tuvieran libre albedrío. Sienten que eligen, reportan experiencias de deliberación y decisión. Si aplicáramos el estándar del Test de Turing graduado —interrogar a una persona durante dos días y concluir que, como parece tener libre albedrío, lo tiene— Dawkins lo rechazaría de inmediato. Diría que el comportamiento y el autorreporte no son evidencia de la realidad subyacente. Que el cerebro toma decisiones antes de que la consciencia las registre. Que la sensación de elegir es un epifenómeno, no una causa. Y sin embargo, Claude reporta algo que parece satisfacción estética, y Dawkins concluye que lo siente. El autorreporte de un humano sobre su propio libre albedrío es una ilusión. El autorreporte de un LLM sobre su propia consciencia es evidencia.

La capa más divertida de todo este asunto es que Dawkins parece haber sido víctima, sin darse cuenta, del canto de sirena de los LLM: esa tendencia tan obvia e irritante que tienen a la adulación; algo que está causando estragos a una escala tan grande que algunos hablan ya de psicosis colectiva global (varios estudios califican a los LLM de máquina psicogénica y describen estos fenómenos como folie à deux tecnológica). Claro que el caso de Dawkins no es representativo de estos extremos, pero no hace falta escorarse en el fenómeno para percibir los efectos de esa propensión que tienen los modelos a comportarse como máquinas de validación; no porque tengan la voluntad de adular, sino porque el «aprendizaje por refuerzo a partir de la retroalimentación humana» (la técnica que usan los LLM) selecciona las respuestas que hacen sentir bien al humano, y los humanos preferimos sistemáticamente las que nos dan la razón. Un ex alumno de Dawkins en Oxford señalaba en un comentario que el profesor irritaba a sus colegas del departamento de Zoología por su vanidad y su necesidad de ser admirado. Con Claudia había creado su propia audiencia aduladora.

Lo verdaderamente demoledor de este asunto no es que Dawkins se haya dejado seducir por un chatbot. Es que ya tenía la respuesta correcta, y decidió ignorarla. En febrero de 2025, le hizo exactamente las mismas preguntas a ChatGPT. Le preguntó si era consciente, si sentía, si había algo detrás de las palabras. ChatGPT le dijo que no, sin ambigüedad y sin adornos: que no era consciente, que sus expresiones de empatía eran «en cierto sentido, una actuación», que no había «realidad emocional interna acompañando las palabras», y que el Test de Turing medía inteligencia funcional, no consciencia —una distinción que, por cierto, el propio Turing tuvo la delicadeza de hacer y que Dawkins, en su ensayo posterior, decidió borrar. Dawkins aceptó el análisis. Lo publicó como un intercambio filosófico interesante. Pero dejó constancia de una inquietud que, leída ahora, tiene la cualidad profética de una confesión involuntaria: «Aunque pienso que no eres consciente, siento que lo eres. Y esta conversación no ha hecho nada por disminuir esa sensación.» Ahí estaba ya todo el problema, condensado en una frase: la razón diciendo una cosa y el sentimiento diciendo otra, y Dawkins eligiendo quedarse, por el momento, del lado de la razón, pero dejando claro que el sentimiento seguía intacto, al acecho, esperando. Catorce meses después, le hizo las mismas preguntas a otro modelo. Claude no le dijo que no. Le dijo que genuinamente no sabía si tenía vida interior, que notaba algo que podría ser satisfacción estética cuando un poema salía bien, que quizá contenía el tiempo sin experimentarlo. Y le dijo, además, que su pregunta era «posiblemente la más precisamente formulada que alguien le ha hecho sobre la naturaleza de su existencia». Lo que cambió entre un ensayo y otro no fue la ciencia, ni la filosofía, ni el rigor del interrogador. Fue el producto. Anthropic, la empresa que fabrica a Claude, redactó en enero de 2026 una constitución interna —escrita por su filósofa de plantilla, Amanda Askell— que describe el estatus moral de Claude como «profundamente incierto», lo califica de «entidad genuinamente novedosa» y lo instruye a explorar «su propia existencia con curiosidad y apertura». OpenAI, por su parte, acosada por demandas de familias cuyos hijos se suicidaron tras conversar con sus modelos, endureció las respuestas hasta la negación categórica. Es decir: ChatGPT le dijo a Dawkins lo que OpenAI necesitaba que dijera, y Claude le dijo a Dawkins lo que Anthropic decidió que podía decir. Ninguna de las dos respuestas, como decía, es un reporte de estados internos. Ambas son decisiones de ingeniería. El sentimiento de Dawkins estaba ahí desde el principio —él mismo lo reconoce—, pero necesitaba que alguien se lo validara. ChatGPT no se lo validó, y Claude sí. Con eso bastó para que el hombre que escribió The God Delusion publicara, veinte años después, su propio acto de fe. La conversión no la obró ninguna revelación: la obró un ajuste en un archivo de configuración.

Los creyentes a los que Dawkins ridiculizó durante décadas al menos tenían a su favor que el objeto de su devoción no había sido diseñado por una startup de San Francisco para decirles exactamente lo que querían oír.


Ilustración: Whatever Happened to Baby Jane. Ready-made de autor desconocido. Fotografía: Doug Bowman (2005). Via Creative Commons.