Estadística y probabilidad en los Sistemas de Información en Salud: «Cuando los datos se organizan y dicen…»

/Fuente: Federación Bioquímica de la Provincia de Buenos Aires – FABA Informa/


A modo de prólogo Por Horacio Micucci 1

En la primera frase del epígrafe, Pearson destaca que la gramática no es el contenido de lo que decimos, sino el sistema de reglas que hace que el lenguaje tenga sentido y coherencia. La gramática permite la claridad y la congruencia en la comunicación.

Así como todas las lenguas tienen gramática, todas las ciencias necesitan la estadística para organizar sus observaciones. No es patrimonio de una disciplina, es transversal. Sin estadística, los datos no “dicen” nada: un conjunto de números sin análisis estadístico es como una lista de palabras sin sintaxis. La estadística impone rigor y corrección; un análisis mal aplicado produce conclusiones erróneas, como hablar con mala gramática.

En la segunda frase del epígrafe, Laplace afirma que la teoría de la probabilidad no inventó una forma nueva de pensar: tomó algo que los seres humanos ya hacían intuitivamente y lo convirtió en un sistema riguroso, coherente y calculable. La incertidumbre no es ignorancia total: es imprecisión medible. En los Sistemas de Información en Salud (SIS), la probabilística cuantifica esa imprecisión, en lugar de ocultarla, para tomar decisiones transparentes. Un médico que ve 100 pacientes con fiebre, tos y dificultad respiratoria, y 80 tienen neumonía, aprende intuitivamente que: “cuando veo estos síntomas, probablemente sea neumonía”. La probabilidad lo formaliza:

Probabilidad de neumonía en pacientes con fiebre + tos + dificultad respiratoria = 0,80.

Una pregunta que no puede esperar

Cuando en 2020 el mundo sufrió la pandemia, las preguntas que los gobiernos y los equipos de salud se formulaban no eran solamente las del tipo “¿cómo se transmite el virus?” o “¿cuál es su estructura molecular?”, aunque ambas eran cruciales.

Las que determinaban si se cerraban escuelas, se modificaban las restricciones o se construían hospitales de emergencia eran, precisamente, preguntas estadísticas: “¿cuántos enfermos graves habrá mañana? ¿En qué barrio se está gestando el próximo foco? ¿El sistema sanitario colapsará en diez días o en treinta?”

Sólo podían responderse —aunque con márgenes de error— con estadística y cálculo de probabilidades. Con números procesados con método.

La pandemia confirmó lo que los especialistas en Sistemas de Información en Salud (SIS) sostienen desde hace décadas: no hay política sanitaria efectiva sin información oportuna y estadísticamente procesada. El cálculo de probabilidades no es un lujo académico, sino el instrumento que permite actuar antes de que el daño sea irreparable.

El dato en bruto no es información

Un SIS genera volúmenes extraordinarios de registros: historias clínicas electrónicas, resultados de laboratorio, notificaciones epidemiológicas, certificados de defunción, registros de vacunación, partes hospitalarios. Ese cúmulo de cifras es valioso, pero en sí mismo no constituye información sanitaria en sentido técnico. Es materia prima. El dato en bruto no orienta ninguna decisión sanitaria relevante.

La estadística descriptiva permite calcular tasas de incidencia y prevalencia o identificar grupos en riesgo: es, en términos epistemológicos, la fotografía del estado sanitario de una población en un momento dado. Pero describir no es suficiente: la gestión sanitaria requiere anticipar, y para eso es necesario pasar de la descripción a la inferencia. Ahí entra la estadística inferencial —pruebas de hipótesis, análisis de regresión, etc.— que permite afirmar, con grados de certeza, si un factor de riesgo está genuinamente asociado a una enfermedad o si las diferencias observadas son atribuibles a alguna otra razón.

La probabilidad: poner número a la incertidumbre

Quien toma decisiones sanitarias —sea en el consultorio, en la secretaría de salud municipal o en la planificación de la capacidad hospitalaria— opera siempre sobre información incompleta. Pero incertidumbre no es ignorancia total. El cálculo de probabilidades es el instrumento que permite trabajar con ella de manera sistemática, en lugar de rendirse ante ella.

El Teorema de Bayes —del siglo XVIII, pero plenamente vigente en el siglo XXI— permite actualizar la probabilidad de una enfermedad a medida que se incorporan nuevos datos: laboratorio, examen físico, historia epidemiológica. Este enfoque ha influido en el diseño de los sistemas de apoyo a la decisión clínica, aunque los sistemas actualmente en uso combinan reglas lógicas, modelos probabilísticos y, recientemente, algoritmos de aprendizaje automático, no siempre de base bayesiana explícita. La lógica subyacente, sin embargo, es la misma: incorporar nueva evidencia para actualizar la estimación de riesgo o diagnóstico.

En el plano epidemiológico, los modelos de tipo SIR (Susceptibles-Infectados-Recuperados) permiten analizar la evolución de una epidemia y estimar el número reproductivo básico (R0). El R0 es un indicador clave que mide la capacidad de propagación de una infección en una población totalmente susceptible (sin inmunidad previa ni vacunas). Representa a cuántas personas contagia, en promedio, un individuo infectado: si es mayor a 1, la enfermedad se propaga; si es menor a 1, la epidemia remite; y si es igual a 1, se hace endémica. Las medidas de control buscan reducir este impacto mediante el aislamiento y la prevención. En las cepas iniciales de COVID-19, el R0 se estimó entre 2 y 3, aunque las variantes posteriores elevaron este valor significativamente.

Estos modelos no predicen el futuro: estiman su probabilidad condicionada a determinados supuestos. Esa distinción es crucial para comunicar los resultados sin generar pánico injustificado ni falsa tranquilidad.

El ciclo de la información sanitaria

El ciclo del SIS moderno tiene cuatro momentos: recolección, procesamiento, análisis y uso para la toma de decisiones. En la recolección, los diseños muestrales son aplicaciones del cálculo de probabilidades; un dato recolectado con diseño deficiente contamina todo lo que viene después. En el procesamiento, la estadística opera como control de calidad: detecta valores atípicos y corrige sesgos. El principio GIGO —Garbage In, Garbage Out (“basura entra, basura sale”), formulado en los albores de la informática— se aplica a los SIS: ningún procesamiento estadístico puede compensar la mala calidad del dato de origen. En el análisis, la estadística descriptiva organiza y sintetiza; la inferencial contrasta hipótesis; la probabilidad construye modelos predictivos. La incertidumbre no desaparece: se cuantifica. Y eso es lo que permite actuar.

En los Sistemas de Información en Salud (SIS), la probabilística cuantifica la imprecisión, en lugar de ocultarla, para tomar decisiones transparentes

Nuestra insistencia en la recolección de datos y la forma en que se informa a OBIOS-OBA se debe al intento de prevenir errores de recolección. Las dificultades en la construcción de las historias clínicas es un aspecto a resolver. El procesamiento trata de subsanar lo mal recolectado.

Una deuda pendiente con la Argentina

En Argentina ciertos déficits estadísticos en salud han costado vidas. El caso del Chagas es emblemático: durante décadas, parte de las estimaciones de prevalencia se construyeron a partir de estudios en conscriptos varones del servicio militar obligatorio —una población joven, masculina y ruralmente seleccionada—, lo que introducía sesgos sistemáticos en la literatura epidemiológica. Esa carencia estadística no fue inocente; permitió “embellecer” —o directamente ignorar— una realidad epidemiológica gravísima. La pandemia de COVID-19, en el mundo, volvió a exponer esa fragilidad: subregistro de casos, demoras en la notificación, heterogeneidad diagnóstica entre jurisdicciones. Cada falla tiene un nombre estadístico preciso —sesgo de selección, sesgo de información, falta de comparabilidad— y un costo concreto en decisiones tardías o equivocadas.

Organismos internacionales de salud — entre ellos la OPS y la OMS— han señalado con insistencia que la carencia de sistemas de información robustos no es una consecuencia inevitable de presupuestos exiguos sino, en gran medida, una decisión de política sanitaria: los países de menores recursos no pueden darse el lujo de prescindir de buena información precisamente porque son pobres. Fortalecer los SIS e invertir en formación estadística de los equipos de salud son responsabilidades del Estado que debemos exigir y contribuir a construir. Para eso están OBA y OBIOS.

La estadística como acto ético y político

La estadística sanitaria no es neutral. Decidir qué se mide, cómo se desagrega la información —por sexo, clase social, condición de cobertura— y a quiénes se hace accesible tiene consecuencias directas sobre la atención y la prevención. Las desigualdades sanitarias solo se hacen visibles cuando se las mide. Y lo que no se ve, no se trata.

El cálculo de probabilidades no debe confundirse con fatalismo. Estimar —mediante modelos de riesgo como Framingham o las escalas de la ACC/AHA— que un individuo tiene una probabilidad elevada de enfermedad cardiovascular en los próximos diez años no es condenarlo: es identificar el punto de intervención preventiva. La probabilidad, en salud, no predice lo inevitable; orienta la acción posible. Un sistema de salud que no invierte en la calidad de su información no solo toma peores decisiones: distribuye mal sus recursos, tarda más en detectar lo que daña y protege menos a quienes más lo necesitan. La estadística sanitaria, en ese sentido, no es un insumo técnico: es una condición de cumplimiento del derecho a una atención sanitaria adecuada.

Los nodos informantes

El laboratorio es uno de los nodos informantes más relevantes de toda red sanitaria. Cada resultado de glucemia, hemograma o hepatograma es un dato potencialmente epidemiológico. Cuando esos datos se integran en sistemas de vigilancia —como propone el Observatorio Bioquímico Argentino (OBA), iniciativa conjunta del INFIBIOC-UBA y el OBIOS de la FBA— dejan de ser información individual para convertirse en información poblacional procesable estadísticamente. Lo mismo vale para farmacias, atención veterinaria o unidades sanitarias locales. Esa transformación es el corazón de los SIS: convertir el dato clínico individual en información poblacional que sirva de base para la decisión sanitaria.

1 Doctor (Área Farmacia y Bioquímica – Epidemiología) UBA. / Magister en Epidemiología, Gestión y Políticas de Salud UNLa.
Director Coordinador del diseño y desarrollo de bases de datos sanitarios y ambientales de OBIOS. (Observatorio Bioquímico de la Salud- FBA) / Director del Observatorio Bioquímico Argentino. INFIBIOC-UBA

Deja un comentario