5 errores que la gente comete al compartir visualizaciones de datos COVID-19 en Twitter

Staff November 11, 2020

173 4 minutos de lectura

El análisis encuentra errores comunes en el intercambio de información sobre una pandemia en las redes sociales .

Muchos usuarios de las redes sociales continúan encontrando cuadros y gráficos sobre la nueva ola de casos de coronavirus que han comenzado a surgir en todo el mundo. / Foto: Pexels

EurekAlert | INDIANA UNIVERSITY

Escucha este artículo

Read in english: 5 mistakes people make when sharing COVID-19 data visualizations on Twitter

El frenético remolino de intercambio de información relacionada con el coronavirus que tuvo lugar este año en las redes sociales es objeto de un nuevo análisis dirigido por investigadores de la Facultad de Informática y Computación de la IUPUI.

Publicado en la revista de acceso abierto Informatics , el estudio se centra en el intercambio de visualizaciones de datos en Twitter , tanto por expertos en salud como por ciudadanos promedio, durante la lucha inicial para comprender el alcance de la pandemia de COVID-19 y sus efectos en sociedad. Muchos usuarios de redes sociales continúan encontrando cuadros y gráficos similares todos los días, especialmente a medida que una nueva ola de casos de coronavirus ha comenzado a surgir en todo el mundo .

El trabajo encontró que más de la mitad de las visualizaciones analizadas de usuarios promedio contenían uno de los cinco errores comunes que reducían su claridad, precisión o confiabilidad.

"Los expertos aún no han comenzado a explorar el mundo de las visualizaciones casuales en Twitter", dijo Francesco Cafaro , profesor asistente en la Facultad de Informática y Computación, quien dirigió el estudio. "Estudiar las nuevas formas en que las personas comparten información en línea para comprender la pandemia y su efecto en sus vidas es un paso importante para navegar por estas aguas inexploradas".

Las visualizaciones de datos casuales se refieren a tablas y gráficos que dependen de las herramientas disponibles para los usuarios promedio para representar visualmente la información de una manera personalmente significativa. Estas visualizaciones se diferencian de la visualización de datos tradicional porque no las generan ni distribuyen los "guardianes" tradicionales de la información de salud, como los Centros para el Control y la Prevención de Enfermedades o la Organización Mundial de la Salud, ni los medios de comunicación.

"La realidad es que las personas dependen de estas visualizaciones para tomar decisiones importantes sobre sus vidas: si es seguro o no enviar a sus hijos de regreso a la escuela, si es seguro o no tomarse unas vacaciones y adónde ir", dijo Cafaro. "Dada su influencia, sentimos que era importante comprender más sobre ellos e identificar problemas comunes que pueden hacer que las personas que los crean o los vean malinterpreten los datos, a menudo sin intención".

Para el estudio, los investigadores de IU rastrearon Twitter para identificar 5.409 visualizaciones de datos compartidas en la red social entre el 14 de abril y el 9 de mayo de 2020. De estas, 540 fueron seleccionadas al azar para su análisis, con un análisis estadístico completo reservado para 435 visualizaciones basadas en criterios adicionales. . De estos, 112 fueron hechos por ciudadanos promedio.

Lea también: La paralización voluntaria de Tokio puede haber detenido al COVID-19

En términos generales, Cafaro dijo que el estudio identificó cinco escollos comunes a las visualizaciones de datos analizadas. Además de identificar estos problemas, los autores del estudio sugieren pasos para superar o reducir su impacto negativo:

Desconfianza: más del 25 por ciento de las publicaciones analizadas no lograron identificar claramente la fuente de sus datos, lo que generó desconfianza en la precisión. Esta información a menudo se oscureció debido a un diseño deficiente, como una mala elección de color, un diseño ocupado o errores tipográficos, no una ofuscación intencional. Para superar estos problemas, los autores del estudio sugieren etiquetar claramente las fuentes de datos, así como colocar esta información en el propio gráfico en lugar del texto que lo acompaña, ya que las imágenes a menudo se desvinculan de su publicación original durante el intercambio social.
Razonamiento proporcional: el once por ciento de las publicaciones presentaba problemas relacionados con el razonamiento proporcional, que se refiere a la capacidad de los usuarios para comparar variables basadas en proporciones o fracciones. Comprender las tasas de infección en diferentes ubicaciones geográficas es un desafío de razonamiento proporcional, por ejemplo, ya que un número similar de infecciones puede indicar diferentes niveles de gravedad en entornos de población baja o alta. Para superar este desafío, los autores del estudio sugieren usar etiquetas como el número de infecciones por cada 1000 personas para comparar regiones con poblaciones dispares, ya que esta métrica es más fácil de entender que los números absolutos o los porcentajes.
Razonamiento temporal: los investigadores identificaron el 7 por ciento de las publicaciones con problemas relacionados con el razonamiento temporal, que se refiere a la capacidad de los usuarios para comprender el cambio a lo largo del tiempo. Estos incluyeron visualizaciones que compararon el número de muertes por gripe en un año completo con el número de muertes por COVID-19 en unos pocos meses, o visualizaciones que no tuvieron en cuenta el retraso entre la fecha de infección y las muertes. Las recomendaciones para abordar estos problemas incluyeron métricas de ruptura que dependen de diferentes escalas de tiempo en gráficos separados, en lugar de transmitir los datos en un solo gráfico.
Sesgo cognitivo: un pequeño porcentaje de publicaciones (0,5 por ciento) contenía texto que parecía alentar a los usuarios a malinterpretar los datos basándose en los "sesgos relacionados con la raza, el país y la inmigración" del creador. Los investigadores afirman que la información debe presentarse con descripciones claras y objetivas cuidadosamente separadas de cualquier comentario político que la acompañe.
Malentendido sobre el virus: el dos por ciento de las visualizaciones se basaron en malentendidos sobre el nuevo coronavirus, como el uso de datos relacionados con el SARS o la influenza.

El estudio también encontró que ciertos tipos de visualizaciones de datos se desempeñaron mejor en las redes sociales. Las visualizaciones de datos que mostraban cambios a lo largo del tiempo, como gráficos de líneas o barras, se compartían con mayor frecuencia. También encontraron que los usuarios interactuaban con más frecuencia con los gráficos que transmitían el número de muertes en comparación con el número de infecciones o el impacto en la economía, lo que sugiere que las personas estaban más interesadas en la letalidad del virus que en otros efectos negativos para la salud o la sociedad.