Los problemas de usar datos del siglo pasado para una pandemia del siglo XXI

Los problemas de usar datos del siglo pasado para una pandemia del siglo XXI

El Gobierno español ha sido incapaz de proporcionar números claros durante la crisis. 

*Este reportaje se publicó originariamente en El País, por Kiko Llaneras, el 21 de junio de 2020

El 18 de marzo un español aparecía en una base de datos de infectados por coronavirus: era el paciente 217, un estudiante de 22 años que había sido hospitalizado… en Singapur. El país asiático ofrecía esos y otros detalles caso por caso, mientras en España no se habían publicado todavía ni los totales por edad. La historia apareció en EL PAÍS y a los tres días el propio paciente 217 contactó al diario desde una red social: “Hola. Soy el español que dio positivo del coronavirus al volver de España a Singapur”.

Es un ejemplo del mundo futurista que ya está aquí, aunque no en todos los lugares por igual: el manejo de información de algunos países asiáticos ha sido una demostración de modernidad —para bien y para mal—, mientras que España y algunos vecinos seguían en el siglo pasado.

“La gestión de la información y los datos estadísticos han sido un gran problema durante esta pandemia en España y en Europa”, resume Helena Legido-Quigley, experta en sistemas de salud y profesora asociada de la Escuela de Higiene y Medicina Tropical de Londres. Es un juicio similar al de Clara Prats, investigadora de biología computacional en la UPC: “Todos los países europeos han tenido que lidiar con problemas parecidos, algunos más graves que otros”. De España destaca que no hubiese sistemas de información preparados: “Se han tenido que corregir, validar y optimizar sobre la marcha”. Ángela Bernardo, periodista científica en Civio, cree que “la gestión de información y su comunicación se ha revelado como una debilidad”, y Saúl Ares, del Centro Nacional de Biotecnología del CSIC, piensa que “ha sido un desastre”.

Una lección de esta crisis es que se debe mejorar la capacidad de las Administraciones para gestionar información sanitaria; por transparencia, pero sobre todo porque disponer de datos ordenados, detallados y abiertos ayudará a combatir epidemias.

POR QUÉ IMPORTAN LOS DATOS

Los epidemiólogos no saben ni por dónde empezar cuando se les pregunta por la importancia de los datos. “Lo cuantitativo es inherente a la epidemiología”, explica Miquel Porta, investigador y catedrático de salud pública en el Instituto Hospital del Mar, de Barcelona. La disciplina tiene por mito fundacional a John Snow, el médico inglés de mediados del siglo XIX, que demostró con mapas y estadísticas que los brotes de cólera los causaban aguas contaminadas. “Los epidemiólogos son los científicos de datos (de salud) originales”, subraya Miguel Hernán, catedrático de Epidemiología en Harvard.

La mejor prueba del valor de los datos se vio en febrero, cuando las cifras que llegaban de China hicieron que muchos expertos se preocuparan. “Los epidemiólogos de élite que trabajan con infecciones empezaron a hablar sobre la posibilidad de pandemia a primeros de mes. Para el 25 de febrero ya existía un cierto consenso entre ellos”, asegura Hernán. ¿Qué evidencias les movían? Los datos del ritmo de contagios, la letalidad del virus, la capacidad infecciosa de los asintomáticos, la cantidad de casos exportados y los indicios de transmisión fuera de Wuhan.

El 14 de febrero, el epidemiólogo de Harvard Marc Lipsitch declaró en varias entrevistas que era probable una pandemia global. “Nos estaban diciendo en enero que había un 50% de probabilidad, a principios de febrero un 70%, a finales un 99%”, explica Hernán sobre sus colegas. Por esas fechas se redactó el informe de la misión de la OMS en China: “Es un nuevo patógeno altamente contagioso, que puede expandirse deprisa y debe considerarse capaz de causar un enorme impacto social, económico y sanitario en cualquier lugar. No es SARS y no es gripe”.

Ya en marzo, las cifras de casos fueron siempre premonitorias. La web de la universidad estadounidense Johns Hopkins fue anticipando los problemas país por país: ahí donde despuntaban los casos luego veíamos brotes explosivos. Desde entonces los datos se han demostrado vitales para detectar repuntes, rastrear contactos y localizar agrupaciones. Además nos han enseñado a protegernos: ¿Por qué sabemos que hay que evitar los espacios cerrados mal ventilados? Porque algunos países han recogido información minuciosa, investigando una oficina mesa por mesa. 

A continuación sigue un repaso de los problemas vividos en España con la gestión de datos. Muchos son compartidos con otros países.

1. COLAPSO DE LOS SISTEMAS DE DETECCIÓN Y CONTROL

En España la detección temprana fracasó en febrero. El origen de los problemas fue consecuencia de un protocolo demasiado estrecho: hasta el 25 de febrero solo se permitió hacer pruebas de covid-19 a personas que hubiesen venido de Wuhan, lo que hizo imposible detectar los contagios locales que ya estaban produciéndose. A finales de mes el protocolo se flexibilizó, los positivos afloraron deprisa y los sistemas de vigilancia epidemiológica se vieron rápidamente superados.

El mejor ejemplo es SiVies, la plataforma informática del Centro Nacional de Epidemiología (CNE) donde las comunidades tenían que notificar individualmente cada caso, con información de la edad del paciente, su lugar de residencia, sus síntomas, etcétera. Ese sistema perdió el tren de la epidemia muy pronto: el día 9 de marzo solo se habían notificado 140 casos de casi 1.000 conocidos (el 14%) y el día 16 apenas le constaban 700 de 10.000 en toda España (8%).

Los servicios de salud pública de las comunidades estaban alimentando el sistema con mucho retraso. A finales de marzo, según información de Maldita.es, había tres comunidades que no habían notificado al SiVies ni el 20% de sus casos conocidos (Galicia, País Vasco y Cataluña) y una de las más golpeadas no había reportado ni uno (Castilla-La Mancha).

Los servicios que debían vigilar y controlar la epidemia estaban superados. Les faltaban manos y personal cualificado, pero también tecnología. “Salud Pública está fatal en sistemas de información”, declara Miquel Porta. “Hay sistemas completamente dispares, débiles, a menudo incompatibles. El ministerio no ejercer el liderazgo necesario en los sistemas de vigilancia epidemiológica”. Hernán ve aquí una clave para explicar la lentitud de muchos países europeos respecto de los asiáticos: “Allí ya habían creado tanto la infraestructura de salud publica como la concienciación ciudadana para defenderse del virus”.

Otra tarea que dependía de salud pública era el rastreo de contactos. Pero si no tenían tiempo ni para registrar los casos en SiVies, ¿cómo iban a localizar y entrevistar a las personas de su entorno? Necesitaban un ejército que no parece haber llegado —“Un técnico por cada 3.000 personas”, según Legido-Quigley—. Eso representaría 15.000 rastreadores en toda España, que según el ministerio solo cuenta ahora con 1.554 personas haciendo esas labores. Además eran necesarios sistemas de información, añade Legido-Quigley: “Ha habido un gran esfuerzo por recoger los datos, pero es complicado con 17 comunidades autónomas y con la poca inversión que ha habido históricamente en desarrollar los sistemas de vigilancia”. Los expertos consultados destacan el esfuerzo de los profesionales de salud pública, pero esta conclusión de Hernán parece generalizada: “La consolidación de sistemas ágiles requerirá mayor inversión en medios y personal”.

2. SANIDAD NO USA UNA BASE DE DATOS

El centro de coordinación o CCAES, que dirige Fernando Simón, ha centralizado los datos que ofrece el Ministerio de Sanidad sobre contagios, hospitalizados, ingresos en UCI y fallecimientos. Pero su gestión durante meses ha parecido artesanal: recibían cada día las cifras agregadas de cada comunidad y luego las resumían en unos informe diarios en formato PDF, que son un puñado de hojas de papel.

El sistema se montó sobre la marcha. No se integraron sistemas de información existentes, sino que el 15 de marzo el Ministerio pidió a través del BOE que las comunidades le reportasen “en el intervalo entre las 20h y las 21h” media docena de indicadores generales y agregados.

La orden se rectificó un mes después para hacer aclaraciones. Durante semanas los datos de hospitalizados y UCI habían sumado cosas diferentes según la comunidad: Madrid, Cataluña, Castilla La Mancha y Galicia reportaban las personas ingresadas en ese momento, mientras que el resto daban el total de ingresos hasta esa fecha. La confusión no se detectó hasta el 2 de abril y no se subsanó hasta final de mes.

Estos problemas los reconoció el ministro Pedro Duque en una entrevista a EL PAÍS del 23 de abril: “No teníamos un plan de qué hacer en una pandemia. Ahora ya lo sabemos: lo que hay que hacer es poner muchísima más gente a recabar datos y recopilarlos en alguna autoridad central”. Además describía unos flujos de información sin engrasar: “Los datos se generan en un hospital, después van a una consejería, después al Gobierno central. Esos datos han tardado en llegar”.

La información que recibía y comunicaba el CCAES era un resumen a vista de pájaro que sumaba juntos todos los casos de una comunidad. No es hasta el 12 de mayo que el ministerio pidió información individualizada a través del BOE. Desde ese día exige que las unidades de salud pública le reporten los detalles caso por caso a través del SiViEs, “de manera que pueda realizarse la detección precoz”. No está claro cuándo empieza a fluir esa información hacía el ministerio, pero comienza a publicarse a finales de mayo con una transición problemática.

3. UNA SEMANA NEGRA PARA LOS DATOS OFICIALES

El cambio al sistema con datos individuales eran potencialmente positivo, pero la transición ha sido un desastre. La mejor prueba es que ni el ministerio ha podido adaptarse: su panel de “Situación de Covid-19” dejó de actualizarse el día 21 de mayo y ha estado parado hasta el 10 de junio. Todavía esta semana seguía sin recuperar las cifras de hospitalizados, UCI y fallecidos.

La interrupción ha dejado a ciegas a muchos investigadores. “Hemos dejado de publicar el informe diario sobre las comunidades durante estas semanas”, explica Clara Prats. “También nos afecta la congelación de la serie de defunciones por covid-19, ya que no podemos realizar los análisis de estimación de casos reales”. Son problemas similares a los que lamenta Susanna Manrubia, investigadora del Centro Nacional de Biotecnología (CSIC): “Los datos llegaban tarde, y luego descubrimos que además llegaban mal. El cambio de criterios en el último mes y pico, y la desaparición de unos 2.000 muertos, ha sido la puntilla”.

El otro gran contratiempo llegó con las cifras de fallecidos. Durante semanas el informe diario ha reportado un total falso. El 27 de mayo apareció una columna que se llamaba “total fallecidos”, pero que no era un verdadero total. Una nota al pie explicaba que solo se sumaban “de forma diaria los casos en los que consta como fecha de fallecimiento la del día previo”. No tenía sentido. Las muertes tardan varios días en conocerse y ese proceder convertía la cifra en una subestimación permanente. Si hoy se conoce una muerte de anteayer, no se sumaría al total. El propio Fernando Simón corroboró en rueda de prensa que así era.

Este periódico denunció la confusión. Poco después el diario británico Financial Times dedicó un artículo a los “fallidos datos” de España, y al final los problemas se hicieron evidentes: la semana del 27 de mayo al 3 de junio, ese “total” se incrementó solo en 10 muertes, aunque el mismo informe decía que al ministerio le constaban 63 muertes de los últimos siete días.

El falso total ha provocado un caos evitable. Alrededor del 3 de junio hubo días en que se sumaron cero muertos, aunque la cifra semanal seguía observando al menos cinco o seis diarios y ahora sabemos que hubo 20 o más. Era un error llamar total a algo que no lo era. Y era engañoso enfatizar las muertes del día anterior, si el 90% no se conocen tan pronto. Fernando Simón reconoció esos problemas, pero la confusión era evidente y hasta el presidente Pedro Sánchez acabó dando la cifra errónea de cero fallecidos.

Se ha levantado un debate hiperbólico que tiene una respuesta sencilla: el Gobierno no esconde los muertos, pero tampoco los comunica claramente. No los oculta, porque si sabemos que hay un exceso de 40.000 o 50.000 muertes en los registros civiles es precisamente porque esa información la publican ahora el INE y antes el CNE. Pero a la vez es evidente que las cifras no han sido claras. Primero, porque el total erróneo se publicó durante dos semanas de líos. Segundo, porque la cifra oficial de muertes confirmadas con covid-19 estuvo congelada alrededor de 27.000 por más de tres semanas. Y tercero, porque el informe diario podría haber ofrecido más datos para evitar suspicacias. Es cierto que las muertes confirmadas representan una métrica estándar que usan muchos países, pero nada impedía reportar también en esos informes el exceso de mortalidad que se iba registrando.

4. ¿EN QUÉ DATOS SE BASARON CIERTAS DECISIONES? 

Hay datos clave para informar de algunas decisiones que nunca han trascendido. Por ejemplo, durante el confinamiento siguieron produciéndose contagios, ¿pero sabíamos dónde? Un sistema más eficaz habría apuntado incluso a barrios y residencias concretas, como en Nueva Zelanda, donde se informa de focos en una casa de ancianos en Auckland o una boda en Bluff. Solo algunas comunidades reportaban información parecida.

También hay dudas sobre la información que decidió la desescalada. El plan del 28 de abril anunciaba que los pases de fase se basarían en criterios objetivos y marcadores públicos de cada provincia. Se presentó un panel de indicadores exhaustivos, que se iban a obtener “de forma automatizada, diaria e individualizada”. Pero ese panel nunca llegó a publicarse. Algunos de esos indicadores están entre los que el ministerio pidió a los servicios de salud pública el 12 de mayo, pero solo se han publicado parcialmente y desde finales de mayo, después de que se decidiesen los cambios de fase de los días 8 y 15 de ese mes.

Otra incógnita han sido los esfuerzos de rastreo en cada comunidad autónoma. Se supone que era una labor básica para evitar rebrotes, pero hasta principios de junio no se publicó ninguna información: ignorábamos el número de rastreadores, cuántos contactos se identificaban por infectado o cuántos daban positivo. Las únicas cifras sobre rastreo se publicaron a partir del 5 de junio, en días contados y sin desglosar ni por comunidades.

5. DATOS OPACOS INCLUSO PARA LOS CIENTÍFICOS

El ministerio apenas ha ofrecido datos abiertos sobre el coronavirus. Hay algunas excepciones, como el observatorio de mortalidad, y se han publicado algunas series en formato CSV a través del Instituto de Salud Carlos III (ISCIII), pero han sido pocas, se han actualizado de forma irregular y se las considera un extra: el centro de la comunicación son los informes en PDF.

La distinción puede parecer un tecnicismo, pero es una buena práctica aceptada: la transparencia exige comunicar los datos de forma sistemática y en formatos que puedan ser reutilizados y escrutados. Sin ese acceso, cualquier análisis se complica, como explica Saul Ares, investigador del CSIC: “No solo son los cambios de criterios, las series que se dejan de continuar… Es que a día de hoy, tras bucear para encontrar algún dato un poco menos habitual, finalmente uno llega a un PDF ¡Tablas en un PDF! Supongo que a algunos se les escapará el despropósito”.

Diversas organizaciones han reclamado otros datos sin éxito, como el número de test que se hicieron en marzo. “Durante muchas semanas no se dio a conocer el número de pruebas de diagnóstico realizadas, pese a que este indicador es fundamental para conocer cómo se estaba gestionando la epidemia”, dice Ángela Bernardo. Todavía hoy ignoramos cuántas personas son testadas y qué porcentaje da positivo, información que sí ofrecen países como Italia y Estados Unidos. En muchos lugares han faltado formatos utilizables, aunque es fácil encontrar mejores prácticas en webs oficiales de Islandia, Noruega, Italia, Reino Unido y algunas comunidades autónomas.

Quizás lo más grave es que el acceso a los datos está siendo restringido incluso entre científicos. “Desde el principio solicitamos información desagregada por municipio y franjas de edad al Instituto Carlos III —explica Manrubia—. Recibimos la respuesta de que se estaban revisando y que pronto se harían públicos. Todavía no lo son. La opacidad en los datos sonaba a ocultismo”. También Diego Ramiro, del Instituto de Economía, Geografía y Demografía del CSIC, describe una experiencia similar después de haber solicitado datos al ISCIII sin éxito: “No podrán dar respuesta por el poco personal que tienen”. Pero deja entrever los costes de poner barreras al trabajo de los académicos: “Es probable que tengamos nuevas olas —como pasó con las gripes de 1889 y 1918— y sería conveniente analizar el comportamiento de la covid-19 antes de que eso ocurra”.

CONCLUSIONES

Fallaron los sistemas de información

– Los sistemas de información nacionales se han demostrado limitados. El CNE tiene como meta “generar información para la toma de decisiones en salud pública”, pero los datos le llegaron con mucho retraso en momentos clave. El CCAES, cuya función es coordinar la gestión de la información en emergencias sanitarias, no siempre recibía los datos de forma automática y tardó meses en pedir información individualizada.

– Han faltado recursos en salud pública. Los servicios de las comunidades se vieron rápidamente superados en sus tareas de vigilancia y control. Ha faltado personal, especialmente en el rastreo de contactos. Además es posible que ese personal haya tenido que suplir con trabajo manual las carencias en sistemas de información.

– Quizás falten profesionales con perfiles cuantitativos, especialistas en datos. También cultura de transparencia. Algunos de los problemas con la gestión no tienen sus raíces en la falta de recursos: publicar un CSV es tan fácil como publicar un PDF.

RECOMENDACIONES

Llevar los datos al siglo XXI

– Lo fundamental quizás sea hacer una investigación. Es importante pensar cuál habría sido la gestión ideal de esta crisis y luego tratar de averiguar qué barreras la impidieron.

– Los expertos consultados dan algunas pistas. “Es el momento de definir protocolos y de poner medios para su implementación”, dice el investigador Saúl Ares. “Ante una epidemia la recogida de datos (en hospitales, residencias, registros civiles, etcétera) debe ser exhaustiva; su transmisión a las administraciones, rápida y fiable; su publicación, inmediata, transparente, centralizada y en formatos que permitan hacer un tratamiento a informático racional”.

– También sugieren la creación de nuevos organismos. El epidemiólogo Miquel Porta cree que “tiene que haber una agencia de Estado de salud pública, que trabaje en red en problemas que son sistémicos”. Desde el CSIC, Diego Ramiro sugiere que la producción de estadísticas de salud recaiga en un organismo especializado similar al INE: “Centrado en la producción y no en la investigación, lo que agilizaría que los datos estén disponibles”.

– Por último, cabe preguntarse si habrían ayudado las famosas “oficinas del dato”, unidades dentro de la administración con expertos que sepan recogerlos, analizarlos y comunicarlos. Desde hace años se dice que los datos son el oro del siglo XXI, pero casi siempre se piensa en las empresas que los explotan. Nos olvidamos de que las instituciones públicas pueden hacer un uso virtuoso de los datos y mejorar la vida de la gente. Combatir una pandemia es un ejemplo radical, pero quizás también valioso.

Este reportaje de formato largo escrito por Kiko Llaneras para El País forma parte de un estudio que en esta página se está realizando con fines científicos. Se trata de estudio que aborda el campo de la experiencia de lectura.