07 de April de 2026 · 2 min de lectura

FeliniAI: un triple pipeline (visión + clínico + LLM) para detectar alergias felinas con F1 0.97

Una sola red neuronal no basta para un diagnóstico fiable. Combiné visión (MobileNetV2), un clasificador clínico XGBoost con criterios ICADA y un LLM en un sistema de tres etapas con F1 macro de 0.9675.

#Deep Learning#Visión por computador#XGBoost#Salud#LLM

FeliniAI: un triple pipeline (visión + clínico + LLM) para detectar alergias felinas con F1 0.97

Cuando el objetivo es algo tan delicado como un diagnóstico asistido, confiar en un único modelo es arriesgado. FeliniAI usa tres pipelines complementarios que se refuerzan entre sí, igual que un veterinario combina lo que ve, lo que mide y lo que sabe.

Pipeline 1 — Visión: MobileNetV2

Una CNN MobileNetV2 (PyTorch, transfer learning) clasifica imágenes de la piel/pelaje del gato en categorías visuales. Elegí MobileNetV2 por su equilibrio entre precisión y ligereza: corre rápido en CPU, lo que mantiene la inferencia por debajo de 1 segundo. Alcanza un 93,4% de accuracy visual.

Pipeline 2 — Clínico: XGBoost + ICADA

El núcleo del sistema es un clasificador XGBoost que trabaja sobre 33 features clínicas derivadas de los criterios ICADA (los criterios estandarizados de dermatitis atópica felina): estacionalidad, distribución de las lesiones, prurito, respuesta a tratamientos previos. Sobre un dataset de 8.000 casos, este módulo logra un F1 macro de 0.9675 en validación cruzada 5-fold. La búsqueda de hiperparámetros se hizo con Optuna y la explicabilidad con SHAP.

Pipeline 3 — LLM: la síntesis

Finalmente, un LLM (Llama 3.3 70B vía Groq) integra las salidas de los dos modelos anteriores y las traduce en una recomendación legible: qué tipo de alergia es más probable, con qué confianza y qué pasos sugerir. El LLM no diagnostica solo: orquesta y comunica lo que han calculado los modelos especializados.

Por qué tres pipelines y no uno

Porque cada uno cubre el punto ciego del otro. La visión capta lo que una foto muestra pero un cuestionario no; el modelo clínico capta el historial que una foto no puede mostrar; el LLM convierte ambos en algo accionable. Es un patrón de ensemble heterogéneo aplicado a datos de naturaleza distinta.

Resultados

F1 macro (clínico): 0.9675, accuracy 0.9909.
Accuracy visual: 93,4%.
4 tipos de alergia, 33 features clínicas, <1s de inferencia.

Qué aprendí

Que en dominios sensibles, la arquitectura correcta no es "el modelo más grande", sino varios modelos especializados orquestados, cada uno haciendo aquello en lo que es bueno.

Sobre este proyecto

FeliniAI — Detector de Alergias Felinas

Sistema de diagnóstico asistido de alergias en gatos mediante triple pipeline de IA: visión computacional con MobileNetV2, clasificador clínico XGBoost con criterios ICADA, y recom...

Probar la demo en vivo Ver el proyecto Código en GitHub ↗

Sigue leyendo

Detección de fraude con LightGBM: cómo llegué a un AUC-ROC d... 3 min Predecir la calidad del aire a 24 horas con una red neuronal... 3 min Detectar volatilidad anómala en los mercados con un Temporal... 2 min