FeliniAI: un triple pipeline (visión + clínico + LLM) para detectar alergias felinas con F1 0.97
Una sola red neuronal no basta para un diagnóstico fiable. Combiné visión (MobileNetV2), un clasificador clínico XGBoost con criterios ICADA y un LLM en un sistema de tres etapas con F1 macro de 0.9675.
Cuando el objetivo es algo tan delicado como un diagnóstico asistido, confiar en un único modelo es arriesgado. FeliniAI usa tres pipelines complementarios que se refuerzan entre sí, igual que un veterinario combina lo que ve, lo que mide y lo que sabe.
Pipeline 1 — Visión: MobileNetV2
Una CNN MobileNetV2 (PyTorch, transfer learning) clasifica imágenes de la piel/pelaje del gato en categorías visuales. Elegí MobileNetV2 por su equilibrio entre precisión y ligereza: corre rápido en CPU, lo que mantiene la inferencia por debajo de 1 segundo. Alcanza un 93,4% de accuracy visual.
Pipeline 2 — Clínico: XGBoost + ICADA
El núcleo del sistema es un clasificador XGBoost que trabaja sobre 33 features clínicas derivadas de los criterios ICADA (los criterios estandarizados de dermatitis atópica felina): estacionalidad, distribución de las lesiones, prurito, respuesta a tratamientos previos. Sobre un dataset de 8.000 casos, este módulo logra un F1 macro de 0.9675 en validación cruzada 5-fold. La búsqueda de hiperparámetros se hizo con Optuna y la explicabilidad con SHAP.
Pipeline 3 — LLM: la síntesis
Finalmente, un LLM (Llama 3.3 70B vía Groq) integra las salidas de los dos modelos anteriores y las traduce en una recomendación legible: qué tipo de alergia es más probable, con qué confianza y qué pasos sugerir. El LLM no diagnostica solo: orquesta y comunica lo que han calculado los modelos especializados.
Por qué tres pipelines y no uno
Porque cada uno cubre el punto ciego del otro. La visión capta lo que una foto muestra pero un cuestionario no; el modelo clínico capta el historial que una foto no puede mostrar; el LLM convierte ambos en algo accionable. Es un patrón de ensemble heterogéneo aplicado a datos de naturaleza distinta.
Resultados
- F1 macro (clínico): 0.9675, accuracy 0.9909.
- Accuracy visual: 93,4%.
- 4 tipos de alergia, 33 features clínicas, <1s de inferencia.
Qué aprendí
Que en dominios sensibles, la arquitectura correcta no es "el modelo más grande", sino varios modelos especializados orquestados, cada uno haciendo aquello en lo que es bueno.
Sobre este proyecto
FeliniAI — Detector de Alergias Felinas
Sistema de diagnóstico asistido de alergias en gatos mediante triple pipeline de IA: visión computacional con MobileNetV2, clasificador clínico XGBoost con criterios ICADA, y recom...