Tres sugerencias para abonar a la certeza del mensaje y las cifras oficiales en torno al Covid-19 en México

Este texto es una colaboración que escribí para Nexos.

Desde hace más de un mes, el Salón Tesorería de Palacio Nacional es la sede de la conferencia de prensa nocturna en la que el personal del Sector Salud informa al país sobre la situación de la epidemia de Covid-19 en México.

Cada noche las y los funcionarios de Salud enfrentan un reto muy complicado: deben transmitir visual y discursivamente un conjunto de estadísticas de la forma más eficiente, efectiva e incontrovertida posible a una audiencia heterogénea. De forma inevitable y recurrente, su éxito en esta tarea incide tanto en la confiabilidad de su mensaje como en la de las cifras oficiales.

Es claro que las y los especialistas que han tomado el micrófono, así como el equipo que arma las presentaciones y reportes diarios, tratan de comunicarnos de la mejor forma posible información compleja y delicada. Lo hacen, además, en un contexto de enorme presión y, probablemente, sin haber recibido el entrenamiento adecuado.

En este texto propongo tres sugerencias que desde mi perspectiva podrían mejorar la forma en que el personal de Salud comunica visualmente las estadísticas relacionadas con la epidemia de Covid-19, y, con ello, abonar a la confiabilidad de las cifras oficiales.

1. Piensen en su audiencia

Uno de los problemas más comunes cuando hacemos una gráfica o mapa es que solemos no considerar las características de quienes la consumirán. Este punto es particularmente relevante en el caso de las gráficas que publica la Secretaría de Salud sobre el Covid-19 pues llegarán a una audiencia muy diversa.

Aquí hay dos implicaciones prácticas para este caso. Primero, la manera de presentar los datos debería tomar en cuenta la forma en que la audiencia obtiene información similar de otras fuentes que se han vuelto predominantes (por ejemplo, el portal del CSSE de Johns Hopkins o el de la OMS) y, en la medida de los posible, ser consistentes con ellas. Esto incluye tanto el tipo de datos que ofrecen dichas alternativas (casos confirmados, muertes y recuperados), como la manera de presentar los datos en estas fuentes (por ejemplo, mostrar el número acumulado de casos confirmados conforme la fecha en que se dio a conocer la cifra de cada día, no la fecha en la que los pacientes dijeron haber comenzado a experimentar síntomas).

Segundo, y más relevante, dada la heterogeneidad de su audiencia, el personal de la Secretaría de Salud debería elegir las visualizaciones más eficientes y efectivas para presentar sus datos.

De las diversas visualizaciones que han utilizado en las conferencias nocturnas, hay dos en particular que no me parecen buenas opciones. Las primeras son las gráficas de pays, ya sea cuando i) incluyen más de tres o cuatro categorías y varias de ellas representan porcentajes muy pequeños, o bien, ii) cuando utilizan un segundo pay para desagregar los datos de una porción del primero. En ambos caso sugeriría reemplazar los pays por gráficas de barras. Son más eficientes para comunicar diferencias de magnitudes (ver 1 y 2), incluso si éstas son pequeñas.

El segundo tipo de visualización en el que se podrían hacer cambios útiles es en los dos mapas que se incluyen en las presentaciones. El primero es el mapa del mundo que ilustra el tipo de contagio (casos importados, transmisión local, sin casos) en cada país. Dado que ya en casi todos los países y territorios la transmisión es local, el mapa ofrece muy poca información relevante, por lo que sugeriría dejar de usarlo.

El otro mapa se usa para representar la distribución geográfica de los casos en México. Este mapa comenzó a ser utilzado a comienzos de marzo y desde entonces ha tenido tres esquemas de colores diferentes. El actual es de tipo divergente, con colores verdes para las entidades con entre 1 y 100 casos, amarillo para estados con entre 101 y 250 casos y colores rojos para entidades con más de 250 casos.

El problema con este esquema de colores es que la naturaleza de la variable representada –casos confirmados– tiene un orden creciente secuencial (va de 0 a infinito), no divergente como el esquema de colores.1 Además de esto, con el actual esquema de colores muy pronto buena parte de los estados estarán pintados de rojo, lo cual agrega un carga de dramatismo innecesario para comunicar los datos. Mi sugerencia en este caso es cambiar el esquema de colores y usar la gama de un solo tono (por ejemplo, verde).

2. Sean consistentes en el tiempo

A lo largo de las más de 30 conferencias celebradas hasta ahora, el número y tipo de visualizaciones usados en la conferencia de cada día ha cambiado constantemente. En parte, esto es comprensible porque conforme pasan los días comienza a haber datos que antes no existían (por ejemplo, casos confirmados en más de una entidad o el perfil de las personas que han fallecido). Pero hay otros cambios que son, desde mi perspectiva, contraproducentes.

Por ejemplo, el domingo pasado planteé por qué me parecía que una gráfica presentada en la conferencia de prensa de esa noche, no contribuía en nada a generar certidumbre y confianza en las cifras oficiales. Minutos después, el Dr. Ricardo Cortés Alcalá, Director General de Promoción de la Salud, amablemente me explicó cómo había sido construido la gráfica que presentaron y a partir de esto pude replicarla con éxito.

Los problemas que yo señalé en mi tuit tienen dos orígenes. El primero es que la gráfica presentada esa noche no indicaba explícitamente en el título o en una nota al pie que el número de casos acumulados habían sido contabilizados a partir de la fecha de inicio de sintomatología. La segunda, y más importante, es que esta gráfica no era consistente con las gráficas que en conferencias previas había presentado el propio subsecretario Hugo López-Gatell, en donde el número de casos se cuentan por la fecha en que se hicieron públicos.

Este tipo de disonancias puede mermar de forma innecesaria y completamente prevenible la certidumbre y credibilidad de las cifras oficiales. Por suerte, la solución es sencilla. Consiste en definir un conjunto básico de gráficas y mapas para transmitir el mensaje clave relacionado con casos confirmados, fallecimientos, casos recuperados y pruebas realizadas (hasta ahora dos temas poco protagónicos en las conferencias nocturnas), y mostrarlas de forma consistente todas las noches.

3. Sean más abiertos

Casi desde que comenzaron las conferencias nocturnas las autoridades de la Secretaría de Salud han publicado diariamente tres documentos en formato PDF: un comunicado técnico, una tabla de casos sospechosos y una tabla de casos confirmados. Las dos últimas contienen la información más relevante para quienes analizamos cotidianamente la evolución de esta epidemia.

Como en otros ámbitos de la actual administración, la publicación de estos dos últimos PDFs implica transparentar muchos datos, pero no abrirlos a la sociedad. Esto no sólo dificulta sustantiva e innecesariamente la posibilidad de que las cifras puedan ser analizadas, sino que abre la posibilidad de que se cometan errores al transformar la lista diaria de casos a una tabla. Es factible que este último problema aumente conforme lo haga el número de casos.

Si bien Katia Guzmán, Serendipia y Pablo Reyes han hecho un gran trabajo para facilitarnos el acceso a una versión de los datos que pueda ser leída por una computadora, lo ideal sería que fuera la propia Secretaría de Salud quien directamente publicara estas dos bases de datos en formato abierto.

Sería deseable además que junto con estas bases de datos, la Secretaría publicara tres más: una con el número de personas que se han recuperado diariamente, otra con el número de personas que fallecieron por Covid-19 y la tercera con el número pruebas diarias realizadas diariamente hasta ese día.

Para completar el círculo de la transparencia, sería ideal que la Secretaría de Salud generara sus mapas y gráficas a través de algún programa de código abierto como Python o R, y que hiciera público el código utilizado. Esto permitiría que cualquier persona interesada pudiera replicar sus análisis y visualizaciones, reduciendo al mínimo cualquier sospecha.

Si es de utilidad, en esta liga se puede consultar el repositorio con el código que he utilizado para analizar la evolución de la pandemia de Covid19 para el Buró de Investigación de ADN40.

Relacionado