La inteligencia artificial ya no es una caja negra

marzo 31, 2025

Investigadores están logrando que la inteligencia artificial deje de ser una caja negra ininteligible. Nuevas técnicas permiten analizar cómo razonan los modelos de lenguaje, revelando patrones y estructuras que ayudan a entender por qué toman ciertas decisiones, un avance crucial para su uso seguro y ético.

Durante años, los modelos de inteligencia artificial, especialmente los grandes modelos de lenguaje como GPT-4, han sido considerados «cajas negras»: sistemas cuyo funcionamiento interno era opaco, incluso para sus propios creadores. Sabíamos lo que producían, pero no por qué llegaban a ciertas respuestas. Esta falta de transparencia ha generado desconfianza y ha sido una barrera importante para la adopción ética de estas tecnologías.

Sin embargo, un equipo de investigación vinculado a Anthropic, una de las empresas emergentes más relevantes en IA, ha logrado avances significativos en el análisis interno de estos modelos. Han identificado que ciertos grupos de neuronas artificiales, llamados “features”, actúan como detectores de conceptos, desde estructuras gramaticales hasta temas complejos como estilos literarios o relaciones causa-efecto. Este descubrimiento abre la posibilidad de mapear el pensamiento de la IA.

En vez de estudiar las conexiones entre millones de neuronas individuales, el equipo se enfoca en estos features, que actúan como bloques conceptuales. Para visualizar cómo funcionan, entrenaron redes de menor escala capaces de interpretar los activadores de estos features, generando imágenes asociadas o textos explicativos. Este proceso, conocido como «mapeo interpretativo«, permite a los investigadores observar cómo el modelo asocia ciertos patrones con conceptos semánticos, desde «interrogaciones indirectas» hasta «tragedias shakesperianas».

El avance no solo permite entender mejor las salidas del modelo, sino también identificar errores, alucinaciones o sesgos. Esta línea de trabajo apunta a una IA más transparente, segura y confiable, especialmente para aplicaciones críticas como medicina, justicia o educación.

Aunque aún es temprano, el objetivo es que los modelos futuros no solo generen contenido, sino también expliquen el porqué de sus decisiones, inaugurando una era de inteligencia artificial explicable.

«¿Podemos confiar en una IA cuyas decisiones no comprendemos del todo, o la transparencia será la clave de su aceptación futura?»

. .
.

Este es un resumen comentado, basado en el artículo: «La IA era una gran caja negra que nos impedía saber cómo pensaba por dentro. Ya no.» publicado en Xataka el 28 de marzo de 2025.
. .

La inteligencia artificial ya no es una caja negra

Otras noticias de interés

De preguntar a Google a recurrir al ChatGPT: la IA, el nuevo intruso en las consultas médicas

Tu empleo, ¿en poder de un algoritmo? los recursos humanos ya usan la IA para contratar y despedir

Ola de despidos en las grandes telecos: Telefónica, Verizon o BT sacrifican empleo para ser más ágiles en la era de la IA

«Nuestro universo no puede ser una simulación»: por qué no vivimos en Matrix y es imposible que llegue a existir

¿La IA diagnostica con mayor precisión que los médicos, como afirma la consellera de Salut? Olga Pané

Cómo usar ChatGPT (y otros LLM) con una API y pagar solo lo que consumes | WIRED

Una experta afirma que la verdadera amenaza tecnológica en el aula ha estado frente a nosotros durante años, y no es la IA

Los escritores de novelas pueden tener los días contados y lo saben: más de la mitad cree que la IA los va a reemplazar

La IA ya puede atacar sin ayuda humana: China lanza el primer ciberataque mundial autónomo