“Hay tres clases de mentiras: La mentira, la maldita mentira y las estadísticas.”
—Mark Twain
En 1954 Darrell Huff escribió su libro Cómo mentir con estadísticas, que aún hoy sigue reeditándose en todo el mundo, con el fin de denunciar la presentación de información cuantitativa en formas diseñadas intencionadamente para oscurecer su interpretación. En su libro nos advierte de que “el lenguaje secreto de las estadísticas, tan atractivo, se emplea como arma sensacionalista, o para inflar, confundir o simplificar en exceso”.
Os presento varios gráficos en los que la representación visual ha sido deliberadamente manipulada para contar una historia totalmente diferente. Ojo, los datos no se han cambiado, sólo la elección del tipo de gráfico y sus parámetros de diseño. ¿Eres capaz de detectar en cada caso dónde se esconde la mentira? Si no detectas las mentiras, entonces no estás preparado para interpretar los gráficos de la vida moderna. Mañana publicaré las respuestas junto con las recomendaciones de diseño de gráficos que informen en lugar de desinformar. Y recuerda, no son ilusiones ópticas: son mentiras descaradas.
1) Mintiendo con la escala
El PSE-EE arrasó en el País Vasco en las elecciones generales del 2008, con respecto al PNV y especialmente con respecto al PP.
Las ventas de esta empresa han experimentado un crecimiento espectacular en el último año.
En ambos caso se deforma la historia de los datos utilizando como base del eje Y un valor arbitrario, en lugar del valor cero. En gráficos de barras incluye siempre el valor cero. En gráficos de líneas, ajusta la escala de manera que se extienda un poco por debajo del valor más bajo y un poco por encima del valor más alto, asegurándote de que la audiencia comprende el contexto y es consciente del cambio de escala.
España es el país de Europa con mayor número de víctimas de violencia doméstica, pero a la par que el resto.
Se ha usado una escala logarítmica para el eje Y. Si la audiencia no puede ver los valores del eje o no está familiarizada con los logaritmos, seguramente el cambio le pasará desapercibido y hará una lectura totalmente errónea.
2) Mintiendo con 3D
Las ventas del iPhone de Apple en el mercado de smartphones estadounidense están marchando fantásticamente.
Steve Jobs ha utilizado un gráfico circular, su primer error, porque son una pésima herramienta de comunicación de información. Nunca uses gráficos circulares, sustitúyelos por barras. En segundo lugar, lo ha rotado y luego girado hacia nosotros, de manera que se produzca la sensación de que la porción de Apple es mucho más grande de lo que en realidad es. En tercer lugar, ha puesto deliberadamente el sector “Otros” en posición opuesta al de Apple, para que gracias al giro su tamaño disminuya. Se trata de una torticera y deliberada manipulación de los datos para hacerles contar una historia falsa. Compárese con la impresión que produce el gráfico de barras de la derecha.
3) Mintiendo con el área
España está creciendo económicamente al mismo ritmo que otros países europeos.
En este caso, se ha usado un gráfico apilado en el que da la impresión de que España sigue la marcha de los otros países, cuando en realidad ¡no ha cambiado en toda la serie! El gráfico de líneas de la derecha cuenta la historia verdadera de cómo ha sido la evolución de los distintos países.
4) Mintiendo con la agrupación de datos
Después de agrupar los ingresos brutos de los españoles durante el 2010 por categorías, está claro que el dinero en España se concentra en el grupo de renta entre los 100.000 y 200.000 € brutos anuales. Si hay que gravar más fiscalmente a algún grupo, será claramente éste.
Aquí se han agrupado los ingresos en grupos totalmente arbitrarios para servir al oscuro propósito de hacer aparecer el grupo de entre 100.000 y 200.000 € como el que más renta concentra. Evidentemente, con otra agrupación la historia cambia completamente, como en el gráfico de la derecha. A quien habría que gravar más es a los de más de 200.000 €.
En cualquier caso, el segundo gráfico sigue haciendo una agrupación de datos completamente arbitraria. Si lo observas atentamente, comprobarás cómo la escala horizontal varía caprichosamente. Cuando una escala se desplaza en intervalos regulares, la audiencia espera que siga moviéndose de manera consistente hasta el final del eje. La escala irregular está creando agrupaciones arbitrarias que permiten contar la historia que te dé la gana a partir de los mismos datos originales.
Cuenta la verdad con tus gráficos
Para mí, lo peor no son estas manipulaciones descaradas de la información, sino el hecho de que con apabullante frecuencia contamos erróneamente la historia de los datos por falta de cultura de visualización gráfica. La mayoría de gráficos en presentaciones de negocios comunican pobremente, si es que comunican en absoluto. En tus manos está aprender a visualizar gráficamente la información y descollar sobre el resto de presentaciones por la claridad y veracidad de tus historias.
Entradas relacionadas
No muestres datos, cuenta historias
Huye de los archisílabos en tus presentaciones
Diálogo abierto
¿Has descubierto las mentiras? Deja un comentario con tu descripción.
Estoy recibiendo clases de una Maestría en Desarrollo Local y Cooperación Internacional en mi País Honduras, y en la clase de Métodos Cuantitativos nos pidieron analizar un artículo respecto a cómo se miente o distorciona la realidad mediante las estadísticas, específicamente con la representación de datos gráficamente, por lo que su artículo fué de muchísima ayuda para una de mis tareas, artículo que me ilustró grandemente,gracias
Los gráficos o graficas estadísticas son la representación visual de resultados aritméticos comparativos generalmente entre fechas y cantidades
para una mas fácil comprensión de los datos. Ver mas en http://www.elephant-project.com/
La verdad yo no tenia ni idea de que esto pasara, solo lo busque por información para una tarea pero gracias a ello m di cuenta de todo lo que nos engañan y nos pueden mentir, como el ejemplo claro de la grafica circular en 3D. Muchas gracias por los datos.
La frase del subtítulo, atribuida a Mark Twain yo la conocía atribuida a Disderí.
Es lo malo con estas frases, han circulado tanto por Internet que uno ya no sabe a quién pertenecen. En cualquier caso, me quedo con el contenido demoledor de la frase.
Esto es literalmente no tener “escala de valores”.
Excelente articulo felicitaciones, desde que vi algo de estadistica en la Universidad deje de creer en ella
Pobre estadística, tampoco es para tanto. Es una herramienta que puede emplearse bien o mal, como el PowerPoint, como la TV y como tantas otras en la vida. Hagamos un buen uso de ella y aprendamos a detectar el uso engañoso cuando nos quieran manipular.
Genial este post. lo comparto y lo guardo pues lo considero de mucho interés
ok
Esto es literalmente no tener «escala de valores».
Excelente artículo, muy interesante, aunque hay algunos puntos que no comparto totalmente.
En primer lugar, las fiebres (gráficas lineales) creo que sí pueden comenzar por un punto que no sea 0 porque lo que se quiere expresar con ellas es una tendencia y no un dato en sí. La visualización exagera la tendencia, es cierto, pero para eso está. Si se indica la escala al lado no debe haber mayor problema. Se trata precisamente de eso, de que se vean las fluctuaciones. En algunos diarios, lo que se hace es meter en grande la fiebre que indica la tendencia y en pequeño contextualizarla con eje = 0.
En segundo lugar, a mí me parece correcto que Other se coloque al final de la tarta (aunque obviamente no con perspectiva). Ten en cuenta que Other no es un competidor en sí, sino un grupo de micro-competidores que, en la realidad, se encuentran muy por detrás del segundo, del tercero, del cuarto y del quinto. Si colocas Other sólo por debajo del líder, estás diciendo que el segundo competidor de RIM es ese conglomerado, cuando realmente tal conglomerado no existe y no es competidor ni de lejos porque sólo existe a la hora de simplificar la información.
Por último, lo de agrupar datos de diferentes rangos (ejemplo 4, aunque también sirve para lo de Apple) no me parece tan malo porque pretende llamar la atención sobre unos datos que, dependiendo del contexto, pueden ser explicativos. Si 200M es una barbaridad de dinero, quizá no sea tan relevante que alguien tenga ya 215 o 230 y por eso es mejor agrupar. Como dices, todo depende de lo que se quiera contar, pero creo que es una fórmula válida y muy utilizada en códigos de color aplicados a mapas.
Desde luego, todo lo que te digo es más que discutible y creo que hay que tener en cuenta siempre el contexto. En cualquier caso, felicidades por el artículo porque es muy bueno y es importante que los que nos dedicamos a esto sepamos de qué nos puede criticar. Gracias!!
Muchas gracias, Alberto, por tu comentario. Encantado de recibir la participación de un experto en las infografías.
Lo que critico en esta entrada es la tergiversación deliberada de las gráficas para ocultar la verdadera historia de los datos. Tristemente, nos encontramos cotidianamente con ejemplos de manipulación informativa a través de los gráficos.
Por ejemplo, estoy de acuerdo en que es correcto colocar Other al final, no en segundo lugar, pero es totalmente torticero poner a Apple abajo y girar la perspectiva del gráfico. Eso es una manipulación descarada, pura y dura.
Por ejemplo, agrupar hay que agrupar, no hay otra, estamos de acuerdo, pero la forma como agrupes puede contar historias radicalmente distintas de los datos. ¿Cuál eliges? ¿Por qué? Esas son las preguntas que nos debemos hacer.
Nuestra misión es contar la verdad de los datos, no ocultarla ni manipularla.
Aprovecho para felicitarte por tus trabajos, me he dado una vuelta por tu blog y son excelentes. Ya te he añadido tu blog a mi lista RSS, un gran descubrimiento 🙂
Muchas gracias!!!
Super interesante.
Aquí tienes un ejemplo:
http://plazamoyua.com/2010/04/13/el-ipcc-reinventa-el-calculo-para-mentir/
Gracias, se trata nuevamente de la agrupación arbitraria de escalas en el eje x. Cuando agrupas como te la gana, los datos dicen lo que te da la gana que digan.
Muy interesante esta entrada!. La verdad es que el tema de las gráficas me ha interesado mucho, como para escribir un libro (que muy elogiósamente ha citado en estos comentarios Iñaki Agirre). A ver si soy capaz de resumir mi punto de vista en pocas líneas… Las gráficas son elementos de comunicación soportados por datos numéricos. Como elementos de comunicación deben estar codificados de forma adecuada al receptor de la misma: no es igual dirigirse al público en general en un artículo de prensa que a especialístas en física en una revista científica especializada; en este segundo caso ya hay muchos elementos gráficos de uso común que no hay que detallar que resultarían incomprensibles a profanos (exáctamente igual que con la comunicación léxica y las jergas).
Es importante enfatizar el mensaje que uno quiere transmitir con la representación elegida, pero ese mensaje debe estar siempre soportado por los datos, y no debe obviar características más importantes de los datos que enmascararían nuestro mensaje buscado. Usar los ejes «que nos interesan» (logarítmicos o no y comenzando en un sitio u otro) es una de las estrategias para este fin, tanto para enfatizar el mensaje existente com opara transmitir uno «torticero». Siempre hay formas honestas de llamar la atención sobre una variación pequeña montada sobre una base grande. Si al menos se da la escala y el origen, parte del exito de la comunicación está en que el receptor esté bien formado y lea correctamente la idea, pero hay casos en que no se da ni escala ni origen: http://joaquinsevilla.blogspot.com/2008/12/no-hay-origen-ni-escala.html
En cuanto a las gráficas de tarta, no son una mala representación siempre que se quiera expresar reparto (para los usos de distintos tipos de gráficas ver: http://joaquinsevilla.blogspot.com/2009/12/que-grafica-elegir.html). Pero en cuanto el círculo empieza a verse en prespectiva empieza la trampa. Sólo los círculos vistos totalmente de frente presentan las proporciones como realmente son, toda inclinación añade peso a los quesitos cercanos y se lo resta a los lejanos (como en el caso de Jobs). Ver otro ejemplo aquí http://joaquinsevilla.blogspot.com/2008/11/la-perspectiva-fuera-de-las-grficas.html
A lo largo de este texto me he referido a varias entradas de mi blog, en el que hay una categoría sobre gráficas (http://joaquinsevilla.blogspot.com/search/label/Gr%C3%A1ficas). En una de esas entradas, además de la definición y una figura muy divertida, hay enlaces a varios sitios web con información interesante sobre gráficas, es esta: http://joaquinsevilla.blogspot.com/2008/09/qu-es-una-grafica.html
Bueno, con todos estos enlaces, quien no tenga ganas de hacerse con el libro en papel, puede acceder a las ideas principales que he resopilado sobre el tema. Espero que puedan resultar de alguna utilidad.
Un saludo, Joaquin
Muchas gracias, Joaquín, por tu detallada exposición sobre la comunicación de información cuantitativa a través de gráficas. Estaremos atentos a las próximas entradas en tu blog para seguir aprendiendo.
eres un grande
En la solución que planteas al ejemplo nº 4, se plantea también una trampa. ¿Eres capaz de encontrarla?
La solución, mañana
jajaja me estás pagando con mi misma moneda 😉
El problema con las agrupaciones arbitrarias (la solución también lo es) es que puedes hacer las barras tan altas o bajas como quieras y por tanto puedes mostrar lo que te dé la gana. O se agrupan de forma equiespaciada, o la agrupación resulta sospechosa. ¿Van por ahí tus tiros?
Respuesta afirmativa. Veo que estás atento y no te dejas caer en tus propias trampas. 😉
Enhorabuena. Se ve que tienes talento.
http://comunsinsentido.blogspot.com/2011/11/talento.html
No me ha quedado claro por qué dices que no debemos usar gráficos circulares. Son mis favoritos y los veo por todas partes. ¿Por qué eliminarlos si son tan prácticos?
Me acabas de dar una idea para el post de la semana que viene: explicaré por qué los gráficos circulares no deberían usarse, ni en presentaciones, ni informes.
una frase que dice Javier Fernández aguado en sus conferencias: «Existen las grandes verdades, luego están la verdades, las mentiras y las grandes mentiras, y después, está la estadística» 🙂
Enhorabuena por esta magnífica entrada.
Hace algún tiempo publiqué una entrada sobre lo mismo en Comunicación Audiovisual
(http://noesunamanzana.blogspot.com/2006/12/medias-verdades-son-medias-mentiras.html)
Utilizaré estos ejemplos tuyos para completar un pequeño ejercicio para mis alumnos de 4ºESO.
Un saludo cordial
Ángel Encinas
¡Qué bueno! Me ha encantado tu post. Hay que ver cómo intentan manipularnos desde todos los medios a la hora de presentar la información cuantitativa sin cambiar los datos en sí mismos sino la historia que cuentan.
Y estoy ansiosa por tus respuestas… mejor de una vez publícalas!! =) jajajaja
No sé leer estadísticas.
Pues te recomiendo que aprendas los rudimentos, porque sin ese conocimiento, nos la meten doblada en la primera esquina 🙁
Muy buen artículo. Voy a plantear mis posibles rspuestas, como si fuera un ejercicio:
1 – La escala debe empezar en 0, no en 200.000
2 – Al concentrar el rango entre 40 y 50 se amplían las diferencias. Nuevamente, la escala debe empezar en 0
3 – ¿Qué escala es ésta que evoluciona 1, 10, 100, 1.000, 10.000? Las escalas deben ser proporcionadas. Debería ser 0, 500, 1.000, 1.500, por ejemplo
4 – Si está ordenada por tamaños, la de «Other» debería ir en segundo lugar. Se reserva el lugar que visualmente se percibe más grande al del interesado. Las gráficas de tarta son especialmente engañosas. La perspectiva de profundidad complica una percepción adecuada
5 – No entiendo la gráfica. Si la segunda y tercera de ñas áreas suponen un sumatorio de las anteriores, la distorsión está clara, pues arrastran la diferencia de la primera serie. Pero no está claro
6 – Nuevamente la escala es engañosa: los primeros tramos agrupan valores de 5 K, el central de 100 K, el siguiente de 300 K. Los tramos que se representan deberían ser proporcionados (siguiendo la misma escala).
Espero haber acertado.
Un saludo
Alberto Secades
http://comunsinsentido.blogspot.com/
Caliente, caliente, a punto de quemarte 😉
La solución, mañana.
¿Qué parte es la que me faltó por quemarme?
¿O es posible que me falte talento?
Solución en el artículo adjunto
http://comunsinsentido.blogspot.com/2011/11/talento.html
Saludos
El conocimiento de escalas logarítmicas es muy importante para representar datos con una inmensa diferencia, desde unidades y decenas hasta millones. Es la única manera de representar ciertas cosas. Ahora bien, como en el ejemplo, podrían usarse maliciosamente para tergiversar.
Sobre este problema (cómo mentir no, cómo decir la verdad), recomiendo el excelente libro «Gramática de las gráficas»:
http://javaitor.blogsome.com/2011/04/13/gramatica-de-las-graficas/
Muchas gracias, Iñaki, lo pongo en la lista de libros para comprar, tiene muy muy buena pinta.
Me encanta esta entrada. Entre falsas escalas, falsas perspectivas, uso engañoso de los colores, y otros trucos, la representación de la información puede ocultar intencionadamente el significado de los datos. Curiosamente, hay un problema inverso aún más difícil: ¿Cómo hacer evidente el significado de los datos?
La solución al problema inverso que planteas la revelaré mañana y ahondaré en ella en futuras entradas.