Razonamiento causal en IA: por qué las máquinas confunden correlación con causa

Si los datos muestran que las personas que llevan paraguas tienen más probabilidad de mojarse, ¿significa que el paraguas causa la lluvia? Por absurdo que parezca, este tipo de confusión entre correlación y causa es precisamente la limitación más fundamental de los sistemas de inteligencia artificial actuales. El razonamiento causal en IA es uno de los problemas más profundos y menos resueltos del campo.

Qué es el razonamiento causal y por qué la IA actual lo hace mal

El razonamiento causal es la capacidad de entender relaciones de causa y efecto entre eventos, no solo identificar que dos cosas ocurren juntas con frecuencia, sino entender por qué ocurren juntas y qué pasaría si una de ellas cambiara.

Los modelos de machine learning actuales, incluidos los grandes modelos de lenguaje, son extraordinariamente buenos identificando correlaciones estadísticas en datos masivos, pero el razonamiento causal en IA sigue siendo una limitación fundamental: estos sistemas pueden identificar que A y B ocurren juntos frecuentemente sin entender genuinamente si A causa B, si B causa A, o si ambos son causados por un tercer factor C que no está siendo considerado.

Por qué esta limitación es tan importante

El problema de las correlaciones espurias

Los sistemas de IA entrenados con grandes cantidades de datos pueden identificar correlaciones que son estadísticamente reales pero causalmente irrelevantes o incluso engañosas. Un modelo entrenado para predecir resultados médicos podría aprender que cierto tratamiento se correlaciona con peores resultados, no porque el tratamiento sea perjudicial sino porque se administra preferentemente a los pacientes más graves, una confusión causal con consecuencias potencialmente graves si se usa para tomar decisiones médicas.

La diferencia entre predicción y comprensión

Un sistema de IA puede predecir con precisión que ocurrirá un evento basándose en patrones correlacionales, sin entender el mecanismo causal subyacente. Esto es suficiente para muchas aplicaciones predictivas, pero resulta insuficiente para preguntas que requieren entender qué pasaría si se interviniera en el sistema, qué los investigadores llaman preguntas contrafactuales.

Los enfoques que intentan resolver el razonamiento causal en IA

Modelos causales estructurales

Los investigadores en este campo, liderados por figuras como Judea Pearl, han desarrollado marcos matemáticos formales para representar relaciones causales explícitamente, en lugar de depender exclusivamente de correlaciones estadísticas aprendidas de los datos. Estos modelos causales estructurales permiten a los sistemas razonar sobre intervenciones hipotéticas: qué pasaría si cambiáramos deliberadamente una variable específica.

Experimentos controlados a escala

Cuando es posible, los investigadores complementan los datos observacionales con experimentos controlados aleatorizados, el estándar de oro para establecer causalidad en ciencia, para validar si las relaciones identificadas por modelos de IA son genuinamente causales o simplemente correlacionales. Puedes explorar la investigación de Judea Pearl sobre inferencia causal en causality.cs.ucla.edu.

Integrar conocimiento causal previo

Algunos enfoques combinan el aprendizaje automático tradicional con conocimiento causal previo proporcionado por expertos humanos, creando sistemas híbridos que pueden aprovechar tanto la capacidad de los datos masivos como la comprensión causal estructurada que los humanos ya tienen sobre ciertos dominios.

Las implicaciones prácticas de esta limitación

El razonamiento causal en IA limitado tiene consecuencias prácticas importantes en medicina, donde confundir correlación con causa puede llevar a tratamientos inefectivos o perjudiciales; en política económica, donde intervenciones basadas en correlaciones espurias pueden no producir los resultados esperados; y en cualquier aplicación de IA usada para tomar decisiones sobre intervenciones, no solo para hacer predicciones pasivas.

Conclusión

El razonamiento causal en IA sigue siendo una de las fronteras más importantes y menos resueltas de la inteligencia artificial actual. Mientras los sistemas de IA sean fundamentalmente sistemas de reconocimiento de patrones estadísticos, en lugar de sistemas que comprenden genuinamente mecanismos causales, su capacidad de razonar sobre intervenciones y contrafactuales seguirá siendo limitada.

En ExplicaIA seguimos explorando las fronteras técnicas y filosóficas de lo que la inteligencia artificial puede y no puede hacer genuinamente.