Contenidos
Charla «Tres vías para detectar una mala estadística» de TEDNYC en español.
A vece es difícil saber qué estadísticas son fiables. Pero no debemos contar con todas ellas… en cambio, debemos aprender a mirar más allá de ellas. En esta agradable y divertida charla, la periodista de datos Mona Chalabi comparte consejos útiles para cuestionar, interpretar y verdaderamente entender lo que dicen los números.
- Autor/a de la charla: Mona Chalabi
- Fecha de grabación: 2017-02-15
- Fecha de publicación: 2017-03-24
- Duración de «Tres vías para detectar una mala estadística»: 705 segundos
Traducción de «Tres vías para detectar una mala estadística» en español.
Hoy les hablaré de estadísticas.
Si eso les hace sentir recelosos de inmediato, está bien, eso no los vuelve unos locos de teorías de conspiración, los vuelve escépticos.
Cuando se trata de números, en especial actualmente, deberían ser escépticos.
Pero también deberían poder distinguir números fiables de los que no lo son.
Así que hoy quiero darles herramientas para poder hacer eso.
Pero antes de hacerlo, quiero aclarar sobre qué números les hablaré.
No haré aseveraciones como, «9 de 10 mujeres recomiendan esta crema antiedad».
Creo que todos ponen los ojos en blanco con números como esos.
La gente ahora cuestiona estadísticas como, «La tasa de desempleo en EE.
UU.
es del 5 %».
Esta aseveración es distinta porque no proviene de una compañía privada, proviene del gobierno.
Cerca de 4 de 10 estadounidenses desconfían de los datos económicos que publica el gobierno.
El número aumenta entre los adeptos del presidente Trump, alrededor de 7 de 10.
No necesito decirles que hay muchas líneas divisoras en nuestra sociedad actualmente, y muchas comienzan a cobrar sentido, cuando se comprende la relación entre la gente y los números del gobierno.
Por una parte, hay quienes dicen que estas estadísticas son cruciales, y necesarias para entender la sociedad como un todo para superar anécdotas emocionales y medir el progreso de manera objetiva.
Por otra parte, hay quienes dicen que estas estadísticas son elitistas, incluso manipuladas; que no tienen sentido y que no reflejan en realidad lo que ocurre en la vida cotidiana de la gente.
Pareciera que el segundo grupo va ganando la pelea hasta ahora.
Vivimos en un mundo de hechos alternativos donde la gente no se identifica con estas estadísticas, el punto de partida para el debate.
Esto es un problema.
Hay movimientos en EE.
UU.
actualmente para eliminar algunas estadísticas gubernamentales.
Hay un proyecto de ley en el congreso para medir la inequidad racial.
La proposición dice que el dinero del gobierno no debe usarse para recolectar datos sobre la segregación racial.
Es un desastre total.
Si no obtenemos esta información,
¿cómo observar la discriminación, para solucionarla?
En otras palabras:
¿Cómo creará un gobierno políticas justas si no puede medir los actuales niveles de injusticia?
No solo se trata de discriminación, sino de todo, piénsenlo.
¿Cómo legislar los servicios sanitarios sin datos sobre salud o pobreza?
¿Cómo tener un debate público sobre inmigración si no concordamos sobre cuánta gente entra y sale del país?
Las estadísticas provienen del estado; de allí viene su nombre.
El objetivo era medir mejor la población a fin de servirle mejor.
Así que necesitamos los números del gobierno, pero no tenemos que aceptarlos ciegamente o rechazarlos ciegamente.
Necesitamos tener las habilidades para detectar malas estadísticas.
Comencé a aprender de esto trabajando en un departamento de estadísticas de Naciones Unidas.
Mi trabajo era averiguar cuántos iraquíes se vieron forzados a dejar sus casas como resultado de la guerra, y qué necesitaban.
Era un trabajo muy importante, pero muy difícil también.
Cada día tomábamos decisiones que afectaban la exactitud de los números, decisiones como cuáles partes del país debíamos visitar, con quién hablar, qué preguntas realizar.
Comencé a sentirme desilusionada con nuestro trabajo, porque pensábamos que hacíamos un buen trabajo pero los únicos que podían decírnoslo eran los iraquíes, y ellos casi nunca tenían oportunidad de ver o cuestionar nuestro análisis.
Así que me convencí de que para obtener números exactos se debía interrogar a cuanta gente se pudiera.
Así me convertí en periodista de datos.
Mi trabajo es encontrar series de datos y compartirlas con el público.
Cualquiera lo puede hacer, no se necesita ser un nerdo.
Pueden ignorar esas palabras; la gente las usa para decir que son inteligentes pretendiendo ser modestos.
En definitiva, cualquiera puede hacerlo.
Quiero darles tres preguntas que les ayudarán a detectar malas estadísticas.
Pregunta número uno,
¿Se distingue incertidumbre?
Una cosa que ha cambiado la relación de la gente con los números, incluso su confianza en los medios, ha sido el uso de las encuestas políticas.
Personalmente tengo muchos problemas con las encuestas políticas porque creo que el rol de los periodistas es informar sobre hechos y no intentar predecirlos, en especial cuando esas predicciones pueden dañar la democracia al decirle a la gente: ni voten por ese tipo, no tiene oportunidad.
Dejemos eso a un lado y hablemos de la exactitud de esta tarea.
Basándose en elecciones nacionales en el Reino Unido, Italia, Israel y claro, en la más reciente elección presidencial de EE.
UU., usar encuestas para predecir resultados electorales es tan preciso como usar la Luna para predecir admisiones hospitalarias.
No, en serio, usé información real de un estudio académico para sacarlo.
Hay muchas razones por las que las encuestas se han vuelto inexactas.
Nuestras sociedades son diversas, lo que hace difícil a los encuestadores obtener un muestreo representativo de la población en sus encuestas.
La gente es reacia a contestar por teléfonos encuestas, y también, sorprendentemente, la gente miente.
Pero no se necesita saberlo para mirar los medios.
La probabilidad de que Hillary Clinton ganara se comunicó con cifras decimales.
No usamos cifras decimales para describir la temperatura.
¿Cómo es que predecir la conducta de 230 millones de votantes en este país es algo tan preciso?
Y luego tenemos esas gráficas elegantes.
Muchas visualizaciones de datos exageran exactitud, y funciona; esas gráficas nos insensibilizan a la crítica.
Cuando escuchan un número pueden sentirse escépticos.
Cuando se pone en una gráfica se siente como ciencia objetiva, y no lo es.
Así que busqué mejores maneras de comunicar esto a la gente, de mostrarles la inexactitud en los números.
Comencé a tomar grupos de información real, y a convertirlos en visualizaciones hechas a mano, para que la gente viera cuán imprecisos son los datos; que estaban hechos por un humano, que encontró la información y la visualizó.
Por ejemplo, en lugar de encontrar la probabilidad de enfermarse de gripa en algún mes, verían la distribución bruta de la temporada de gripa.
Esta es…
(Risas) una mala toma mostrada en febrero.
Pero es una visualización de datos más responsable, porque si mostraran las probabilidades exactas quizá alentaría a la gente a tomar sus vacunas en el momento equivocado.
El punto de estas líneas inestables es que la gente recuerda estas imprecisiones, pero no necesariamente se quedan con un número específico, pero recuerdan datos importantes.
Datos como injusticia e inequidad marcan nuestras vidas.
Datos como que afroamericanos y nativos americanos tienen menos esperanza de vida que los de otras razas, y eso no cambiará pronto.
Datos como se puede confinar a prisioneros en EE.
UU.
en aislamiento en celdas más pequeñas que un espacio de aparcamiento promedio.
El punto de estas visualizaciones es también recordarle a la gente algunos conceptos estadísticos muy importantes, conceptos como promedios.
Supongamos que escuchan, «La piscina promedio en EE.
UU.
sufre de 6,23 accidentes fecales».
No significa que cada alberca en el país tiene 6,23 mojones.
Para mostrar eso, revisé la información original, provenientes de la CDC, ellos estudiaron 47 instalaciones acuáticas.
Invertí una tarde redistribuyendo excremento.
Para que pudieran ver cuán engañosos son los promedios.
(Risas) La segunda pregunta que se deben hacer para detectar un número erróneo:
¿Me reflejo en los datos?
Esta pregunta también es acerca de los promedios, porque la gente se frustra con las estadísticas nacionales porque estas no dicen quién va ganando o perdiendo en una política nacional.
Se comprende por qué la gente se frustra con los promedios globales cuando no coinciden con sus experiencias personales.
Quería mostrarles cómo los datos se relacionan con la vida cotidiana.
Comencé una columna de consejos «Querida Mona,» donde la gente me escribe preguntas y preocupaciones e intento responderles con datos.
La gente pregunta de todo, como, «
¿Es normal que duerma en camas separadas con mi esposa?
«, «
¿La gente se arrepiente de tatuarse?
«, «
¿Qué significa morir por causas naturales?
«.
Todas las preguntas son buenas, porque te hacen pensar en maneras de encontrar y comunicar estos números.
Si alguien pregunta, «
¿Cuánta orina es demasiada orina?
«, que es una pregunta que me hicieron, quieres asegurarte de que la visualización tenga sentido para tanta gente como sea posible.
Estos números están disponibles.
A veces están enterrados en el apéndice de un estudio académico.
Y ciertamente no son inescrutables; si realmente quieren probar estos números de volumen de orina, podrían probarlo Uds.
mismos con una botella.
(Risas) El punto de esto no es necesariamente que cada grupo de datos se relacione con Uds.
Me interesa cuántas mujeres recibieron multas en Francia por usar velo facial, o el nicab, incluso si no vivo en Francia o no uso el velo facial.
El punto es lograr tanto contexto como sea posible Se trata de alejarse del punto de datos, como la tasa de desempleo es del 5 %, y ver cómo cambia con el tiempo, o ver cómo cambia según el estatus educativo, —por eso sus padres siempre quisieron que fueran a la universidad— o ver cómo varía según el género.
Hoy la tasa de desempleo de varones es mayor que la de las mujeres.
Hasta principios de los ochenta, era al revés.
Este es uno de los mayores cambios en la sociedad estadounidense, y todo está en la gráfica, si ven más allá de los promedios.
Los ejes lo son todo; si se cambia la escala, se puede cambiar la historia.
La tercera y última pregunta que quiero que piensen cuando miren una estadística es:
¿Cómo se recopiló la información?
Hasta ahora, solo he hablado de cómo se comunican los datos, pero el cómo se recopilaron es igual de importante.
Sé que es difícil, porque la metodología puede ser opaca y un tanto aburrida, pero hay unos pasos sencillos para revisar esto.
Usaré un último ejemplo.
Una encuesta encontró que el 41 % de los musulmanes del país apoyaban la yihad, lo cual obviamente asusta, y se reportó en todos lados en 2015.
Cuando quiero revisar un número como ese, comenzaré por encontrar el cuestionario original.
Resulta que los periodistas que reportaron esa estadística ignoraron una pregunta posterior en la encuesta que pedía a los encuestados definir «yihad».
Y la mayoría lo definían como, «La lucha personal y pacífica para ser más religioso».
El 16 % lo definió como «guerra santa y violenta contra los no creyentes».
Este es un punto importante: basándose en esos números es posible que nadie en la encuesta que lo definió como guerra santa dijera que también lo apoyaba.
Esos dos grupos quizá no coincidan.
También es pertinente preguntar cómo se realizó la encuesta.
Esta fue encuesta fue de participación libre, cualquiera pudo encontrarla en internet y responderla.
No se puede saber si esas personas se identificaban como musulmanes.
Finalmente, hubo 600 encuestados en esa encuesta.
Hay cerca de tres millones de musulmanes en este país, según el Centro de Investigación Pew.
Significa que se encuestó a uno de cada 5000 musulmanes en este país.
Esta es una de las tres razones por las que las estadísticas gubernamentales son mejores que las privadas.
Una encuesta puede hablar con unos cientos, o miles, o como L’Oreal en 2005, para vender productos para el cuidado de la piel, hablaron con 48 mujeres para decir que trabajaron.
(Risas) Las compañías privadas no tienen gran interés por obtener bien los números, solo necesitan los números correctos.
Los estadísticos gubernamentales no son así.
En teoría, al menos, son imparciales, porque la mayoría hace su trabajo sin importar quién esté en el poder.
Son servidores públicos.
Y hacen su trabajo apropiadamente, no solo hablan con un par de cientos.
Esos números de desempleo de los que he hablando vienen de la administración de Estadísticas Laborales, y para sacar sus estimaciones, hablan con cerca de 140 000 negocios en el país.
Lo comprendo, es frustrante.
Si quieren comprobar una estadística de una compañía privada, compren la crema facial y pruébenla si no funciona, pueden decir que los números se equivocan.
Pero
¿cómo cuestionar estadísticas gubernamentales?
Solo continúen revisando todo.
Averigüen cómo recopilaron los números.
Averigüen si en la estadística ven todo lo que necesitan ver.
Pero no se rindan ante los números porque si lo hacen, estaremos tomando decisiones sobre políticas públicas ciegamente, usando solo intereses privados para guiarnos.
Gracias.
(Aplausos)
https://www.ted.com/talks/mona_chalabi_3_ways_to_spot_a_bad_statistic/