En este episodio, conversamos con Arantxa Urrea, estadística de formación y doctoranda en el Instituto DaSCI, sobre un tema crucial pero poco conocido en el desarrollo de sistemas de inteligencia artificial: los datos fuera de distribución (OOD, por sus siglas en inglés).Durante la charla, Arantxa explicó:
- 🧠 Qué son los datos OOD: Se trata de datos que no se parecen a los que el modelo ha visto durante su entrenamiento. Pueden surgir en situaciones reales donde el entorno cambia o aparecen casos inesperados.
- 🚨 Por qué son un problema: Los modelos de IA suelen asumir que los datos que reciben en producción son similares a los de entrenamiento. Cuando esto no ocurre, pueden tomar decisiones erróneas con alta confianza.
- 🛠️ Cómo detectarlos y gestionarlos: Arantxa compartió enfoques actuales para identificar estos datos y estrategias para que los modelos sean más robustos y conscientes de su incertidumbre.
Con un enfoque divulgativo y claro, el episodio pone sobre la mesa la importancia de diseñar sistemas de IA que no solo sean precisos, sino también conscientes de sus límites.