Maybaygiare.org

Blog Network

Ejemplos de Estadísticas Engañosas – Descubra El Potencial De Uso Indebido de Estadísticas y Datos En La Era Digital

Hombre que busca ejemplos de estadísticas engañosas con lupa

«Hay tres tipos de mentiras: mentiras, mentiras, mentiras y estadísticas.»- Benjamin Disraeli

Los análisis estadísticos han sido históricamente uno de los pilares de las industrias de alta tecnología y negocios avanzados, y hoy en día son más importantes que nunca. Con el auge de la tecnología avanzada y las operaciones globalizadas, los análisis estadísticos brindan a las empresas una visión para resolver las incertidumbres extremas del mercado. Los estudios fomentan la toma de decisiones informadas, juicios sólidos y acciones llevadas a cabo sobre el peso de la evidencia, no sobre suposiciones.

Dado que las empresas a menudo se ven obligadas a seguir una hoja de ruta de mercado difícil de interpretar, los métodos estadísticos pueden ayudar con la planificación necesaria para navegar por un paisaje lleno de baches, trampas y competencia hostil. Los estudios estadísticos también pueden ayudar en la comercialización de bienes o servicios y en la comprensión de los factores de valor únicos de cada mercado objetivo. En la era digital, estas capacidades solo se mejoran y aprovechan mediante la implementación de tecnología avanzada y software de inteligencia empresarial. Si todo esto es cierto, ¿cuál es el problema con las estadísticas?

En realidad, no hay ningún problema per se – pero puede haberlo. Las estadísticas son infames por su capacidad y potencial de existir como datos engañosos y malos.

Contenido Adicional Exclusivo: Descargue nuestra Lista de verificación de Integridad de datos gratuita ¡Obtenga nuestra lista de verificación gratuita para garantizar la integridad de la recopilación y el análisis de datos!

¿Qué Es Una Estadística Engañosa?

Las estadísticas engañosas son simplemente el mal uso-útil o no-de un dato numérico. Los resultados proporcionan una información engañosa al receptor, que luego cree que algo está mal si no nota el error o no tiene la imagen completa de los datos.

Dada la importancia de los datos en el mundo digital de hoy en día, en rápida evolución, es importante familiarizarse con los fundamentos de las estadísticas engañosas y la supervisión. Como ejercicio de diligencia debida, examinaremos algunas de las formas más comunes de mal uso de las estadísticas, y varios ejemplos alarmantes (y tristemente comunes) de estadísticas engañosas de la vida pública.

¿Las Estadísticas Son Fiables?

el 73,6% de las estadísticas son falsas. ¿En serio? No, por supuesto, es un número inventado (a pesar de que tal estudio sería interesante de saber, pero de nuevo, podría tener todos los defectos que intenta señalar al mismo tiempo). La fiabilidad estadística es crucial para garantizar la precisión y validez del análisis. Para asegurarse de que la confiabilidad sea alta, hay varias técnicas que realizar, la primera de ellas son las pruebas de control, que deben tener resultados similares al reproducir un experimento en condiciones similares. Estas medidas de control son esenciales y deberían formar parte de cualquier experimento o encuesta; desafortunadamente, no siempre es así.

Si bien los números no mienten, de hecho pueden usarse para engañar con medias verdades. Esto se conoce como el «mal uso de las estadísticas.»A menudo se supone que el uso indebido de las estadísticas se limita a aquellas personas o empresas que buscan obtener beneficios de distorsionar la verdad, ya sea en la economía, la educación o los medios de comunicación.

Sin embargo, la narración de verdades a medias a través del estudio no se limita solo a los aficionados matemáticos. Una encuesta de investigación de 2009 realizada por el Dr. Daniele Fanelli de la Universidad de Edimburgo encontró que el 33,7% de los científicos encuestados admitieron prácticas de investigación cuestionables, incluida la modificación de los resultados para mejorar los resultados, la interpretación de datos subjetivos, la retención de detalles analíticos y la eliminación de observaciones debido a los sentimientos intestinales…. Los científicos!

Si bien los números no siempre tienen que ser fabricados o engañosos, está claro que incluso las sociedades con los guardianes numéricos de mayor confianza no son inmunes al descuido y el sesgo que pueden surgir con los procesos de interpretación estadística. Hay diferentes maneras en que las estadísticas pueden ser engañosas que detallaremos más adelante. El más común es, por supuesto, la correlación versus la causalidad, que siempre deja de lado otro factor (o dos o tres) que son la causalidad real del problema. Beber té aumenta la diabetes en un 50%, y la calvicie aumenta el riesgo de enfermedades cardiovasculares hasta en un 70%. ¿Nos olvidamos de mencionar la cantidad de azúcar puesta en el té, o el hecho de que la calvicie y la vejez están relacionadas, al igual que los riesgos de enfermedades cardiovasculares y la vejez?

Entonces, ¿se pueden manipular las estadísticas? Seguro que pueden. ¿Los números mienten? Tú puedes ser el juez.

Cómo las estadísticas pueden ser engañosas

pizarra que muestra los tipos comunes de mal uso de las estadísticas

Recuerde, el mal uso de las estadísticas puede ser accidental o intencional. Si bien una intención maliciosa de difuminar las líneas con estadísticas engañosas seguramente aumentará el sesgo, la intención no es necesaria para crear malentendidos. El uso indebido de las estadísticas es un problema mucho más amplio que ahora está presente en múltiples industrias y campos de estudio. Aquí hay algunos contratiempos potenciales que comúnmente conducen al mal uso:

  • Polling defectuoso

La forma en que se formulan las preguntas puede tener un gran impacto en la forma en que una audiencia las responde. Los patrones de redacción específicos tienen un efecto persuasivo e inducen a los encuestados a responder de manera predecible. Por ejemplo, en una encuesta que busca opiniones sobre impuestos, veamos las dos preguntas potenciales:

– ¿Cree que debería pagar impuestos para que otros ciudadanos no tengan que trabajar?- ¿Crees que el gobierno debería ayudar a las personas que no pueden encontrar trabajo?

Es probable que estas dos preguntas den lugar a respuestas muy diferentes, aunque traten del mismo tema de la asistencia gubernamental. Estos son ejemplos de «preguntas cargadas».»

Una forma más precisa de formular la pregunta sería, » ¿Apoya los programas de asistencia del gobierno para el desempleo?»o, (aún más neutralmente)» ¿Cuál es su punto de vista con respecto a la asistencia por desempleo?»

Los dos últimos ejemplos de las preguntas originales eliminan cualquier inferencia o sugerencia del encuestador, y por lo tanto, son significativamente más imparciales. Otro método injusto de sondeo es hacer una pregunta, pero precederla con una declaración condicional o una declaración de hecho. Siguiendo con nuestro ejemplo, eso se vería así: «Dado el aumento de los costos para la clase media, ¿apoya los programas de asistencia del gobierno?»

Una buena regla general es siempre tomar el sondeo con un grano de sal, y tratar de revisar las preguntas que realmente se presentaron. Proporcionan una gran visión, a menudo más que las respuestas.

  • Correlaciones defectuosas

El problema con las correlaciones es este: si mide suficientes variables, eventualmente parecerá que algunas de ellas se correlacionan. Como uno de cada veinte se considerará inevitablemente significativo sin ninguna correlación directa, los estudios se pueden manipular (con datos suficientes) para probar una correlación que no existe o que no es lo suficientemente significativa para probar la causalidad.

Para ilustrar este punto, supongamos que un estudio ha encontrado una correlación entre un aumento de accidentes automovilísticos en el estado de Nueva York en el mes de junio (A), y un aumento de ataques de osos en el estado de Nueva York en el mes de junio (B).

Eso significa que probablemente habrá seis explicaciones posibles:

– Accidentes automovilísticos (A) causan ataques de osos (B)- Ataques de osos (B) causan accidentes automovilísticos (A)- Accidentes automovilísticos (A) y ataques de osos (B) se causan entre sí en parte – Accidentes automovilísticos (A) y ataques de osos (B) son causados por un tercer factor (C)- Ataques de osos (B)) son causados por un tercer factor (C) que se correlaciona con los accidentes automovilísticos (A) – La correlación es única posibilidad

Cualquier persona sensata identificaría fácilmente el hecho de que los accidentes automovilísticos no causan ataques de osos. Cada uno es probablemente el resultado de un tercer factor, que es: un aumento de la población, debido a la alta temporada de turismo en el mes de junio. Sería absurdo decir que se causan el uno al otro… y por eso es exactamente nuestro ejemplo. Es fácil ver una correlación.

Pero, ¿qué pasa con la causalidad? ¿Qué pasaría si las variables medidas fueran diferentes? ¿Y si fuera algo más creíble, como el Alzheimer y la vejez? Claramente hay una correlación entre los dos, pero ¿hay causalidad? Muchos asumirían falsamente, sí, basándose únicamente en la fuerza de la correlación. Camine con cuidado, ya sea a sabiendas o por ignorancia, la caza de correlación continuará existiendo dentro de los estudios estadísticos.

  • Pesca de datos

Este ejemplo de datos engañosos también se conoce como» dragado de datos » (y está relacionado con correlaciones defectuosas). Es una técnica de minería de datos en la que se analizan volúmenes extremadamente grandes de datos con el fin de descubrir relaciones entre puntos de datos. Buscar una relación entre los datos no es un mal uso de los datos per se, sin embargo, hacerlo sin una hipótesis lo es.

El dragado de datos es una técnica de interés propio que a menudo se emplea con el propósito no ético de eludir las técnicas tradicionales de minería de datos, con el fin de buscar conclusiones de datos adicionales que no existen. Esto no quiere decir que no haya un uso adecuado de la minería de datos, ya que de hecho puede llevar a valores atípicos sorprendentes y análisis interesantes. Sin embargo, la mayoría de las veces, el dragado de datos se utiliza para suponer la existencia de relaciones de datos sin más estudio.

A menudo, la pesca de datos resulta en estudios que son muy publicitados debido a sus hallazgos importantes o extravagantes. Estos estudios se contradicen muy pronto con otros hallazgos importantes o extravagantes. Estas correlaciones falsas a menudo dejan al público en general muy confundido, y en busca de respuestas con respecto a la importancia de la causalidad y la correlación.

Del mismo modo, otra práctica común con los datos es la omisión, lo que significa que después de mirar un gran conjunto de respuestas de datos, solo elige las que respaldan sus puntos de vista y hallazgos y omite las que lo contradicen. Como se mencionó al principio de este artículo, se ha demostrado que un tercio de los científicos admitieron que tenían prácticas de investigación cuestionables, incluida la retención de detalles analíticos y la modificación de los resultados…! Pero, de nuevo, nos enfrentamos a un estudio que podría caer en este 33% de prácticas cuestionables, encuestas defectuosas, sesgos selectivos… ¡Se hace difícil creer cualquier análisis!

Contenido Adicional Exclusivo: Descargue nuestra Lista de verificación de Integridad de datos gratuita ¡Obtenga nuestra lista de verificación gratuita para garantizar la integridad de la recopilación y el análisis de datos!

  • Visualización de datos engañosa

Los gráficos y tablas perspicaces incluyen una agrupación de elementos muy básica, pero esencial. Cualquiera que sea el tipo de visualización de datos que elija usar, debe transmitir:

– Las escalas utilizadas – El valor inicial (cero o no)- El método de cálculo (por ejemplo, conjunto de datos y período de tiempo)

A falta de estos elementos, las representaciones visuales de datos deben verse con un grano de sal, teniendo en cuenta los errores comunes de visualización de datos que se pueden cometer. También se deberían identificar puntos de datos intermedios y dar contexto si ello añadiera valor a la información presentada. Con la creciente dependencia de la automatización inteligente de soluciones para comparaciones de puntos de datos variables, se deben implementar las mejores prácticas (es decir, diseño y escalado) antes de comparar datos de diferentes fuentes, conjuntos de datos, horarios y ubicaciones.

  • Sesgo intencionado y selectivo

El último de nuestros ejemplos más comunes de mal uso de estadísticas y datos engañosos es, quizás, el más grave. Sesgo intencionado es el intento deliberado de influir en los hallazgos de los datos sin siquiera fingir responsabilidad profesional. Es más probable que el sesgo adopte la forma de omisiones o ajustes de datos.

El sesgo selectivo es un poco más discreto para quienes no leen las líneas pequeñas. Por lo general, cae sobre la muestra de personas encuestadas. Por ejemplo, la naturaleza del grupo de personas encuestadas: preguntar a un estudiante universitario sobre la edad legal para beber, o a un grupo de jubilados sobre el sistema de atención a ancianos. Terminará con un error estadístico llamado «sesgo selectivo».

  • Usando el cambio porcentual en combinación con un tamaño de muestra pequeño

Otra forma de crear estadísticas engañosas, también vinculadas con la elección de la muestra discutida anteriormente, es el tamaño de dicha muestra. Cuando un experimento o una encuesta se lleva a cabo con un tamaño de muestra totalmente no significativo, no solo los resultados serán inutilizables, sino que la forma de presentarlos, es decir, como porcentajes, será totalmente engañosa.

Hacer una pregunta a un tamaño de muestra de 20 personas, donde 19 responden » sí «(=95% dicen que sí) versus hacer la misma pregunta a 1,000 personas y 950 responden» sí » (=95% también): la validez del porcentaje claramente no es la misma. Proporcionar únicamente el porcentaje de cambio sin los números totales o el tamaño de la muestra será totalmente engañoso. el cómic de xkdc ilustra esto muy bien, para mostrar cómo la afirmación de» crecimiento más rápido » es un discurso de marketing totalmente relativo:

xkcd comic que se burla del argumento de" crecimiento más rápido""fastest-growing" argument

Asimismo, el tamaño de muestra necesario está influenciado por el tipo de pregunta que hace, la significación estadística que necesita (estudio clínico vs estudio de negocios) y la técnica estadística. Si realiza un análisis cuantitativo, los tamaños de muestra menores de 200 personas generalmente no son válidos.

Ejemplos de Estadísticas Engañosas En la Vida Real

Ahora que hemos revisado varios de los métodos más comunes de uso indebido de datos, veamos varios ejemplos de la era digital de estadísticas engañosas en tres espectros distintos, pero relacionados: medios y política, publicidad y ciencia. Si bien es probable que ciertos temas enumerados aquí causen emoción dependiendo del punto de vista de uno, su inclusión es solo para fines de demostración de datos.

  • Ejemplos de estadísticas engañosas en los medios y la política

ejemplo de estadísticas engañosas en política: gráfico de propaganda sin eje y creado por un grupo antiaborto para engañar al juicio

Las estadísticas engañosas en los medios son bastante comunes. En Sept. El 29 de septiembre de 2015, los republicanos del Congreso de los Estados Unidos cuestionaron a Cecile Richards, presidenta de Planned Parenthood, sobre la apropiación indebida de 5 500 millones en fondos federales anuales. El gráfico/gráfico anterior se presentó como un punto de énfasis.

El representante Jason Chaffetz de Utah explicó: «En rosa, esa es la reducción en los exámenes de mama, y el rojo es el aumento en los abortos. Eso es lo que está pasando en su organización.»

De acuerdo con la estructura de la tabla, de hecho, parece mostrar que el número de abortos desde 2006 experimentó un crecimiento sustancial, mientras que el número de exámenes de detección de cáncer disminuyó sustancialmente. La intención es transmitir un cambio de enfoque de las pruebas de detección de cáncer al aborto. Los puntos de la tabla parecen indicar que 327,000 abortos son mayores en valor inherente que 935,573 exámenes de detección de cáncer. Sin embargo, un examen más detallado revelará que el gráfico no tiene un eje y definido. Esto significa que no hay una justificación definible para la colocación de las líneas de medición visibles.

Politifact, un sitio web de defensa de verificación de hechos, revisó los números del Representante Chaffetz a través de una comparación con los propios informes anuales de Planned Parenthood. Usando una escala claramente definida, así es como se ve la información:

visualización de datos correcta que muestra planned parenthood tal como está con una escala claramente definida y un eje y existente

Y así con otra escala válida:

demostración de planned parenthood con escala de valor codificador

Una vez colocada dentro de una escala claramente definida, se hace evidente que, si bien el número de exámenes de detección de cáncer ha disminuido, todavía supera con creces la cantidad de procedimientos de aborto realizados anualmente. Como tal, este es un gran ejemplo de estadísticas engañosas, y algunos podrían argumentar sesgo considerando que la tabla no se originó del Congresista, sino de Estadounidenses Unidos por la Vida, un grupo antiaborto. Este es solo uno de los muchos ejemplos de estadísticas engañosas en los medios y la política.

  • Estadísticas engañosas en publicidad

tubos de pasta dental colgate

En 2007, Colgate fue ordenado por la Autoridad de Estándares de Publicidad (ASA) del Reino Unido abandonó su afirmación: «Más del 80% de los dentistas recomiendan Colgate.»El eslogan en cuestión se colocó en un cartel publicitario en el Reino Unido, y se consideró que violaba las reglas de publicidad del Reino Unido.

La afirmación, que se basó en encuestas a dentistas e higienistas realizadas por el fabricante, resultó ser tergiversada, ya que permitió a los participantes seleccionar una o más marcas de pasta de dientes. La ASA declaró que la afirmación » would los lectores entenderían que el 80 por ciento de los dentistas recomiendan Colgate por encima de otras marcas, y el 20 por ciento restante recomendaría diferentes marcas.»

La ASA continuó :» Debido a que entendimos que la marca de otro competidor fue recomendada casi tanto como la marca Colgate por los dentistas encuestados, concluimos que la afirmación implicaba erróneamente que el 80 por ciento de los dentistas recomiendan la pasta dental Colgate en preferencia a todas las demás marcas.»La ASA también afirmó que los guiones utilizados para la encuesta informaban a los participantes de que la investigación estaba siendo realizada por una empresa de investigación independiente, lo que era inherentemente falso.

En base a las técnicas de mal uso que cubrimos, es seguro decir que esta técnica de engaño de Colgate es un claro ejemplo de estadísticas engañosas en publicidad, y caería en encuestas defectuosas y sesgos absolutos.

Contenido Adicional Exclusivo: Descargue nuestra Lista de verificación de Integridad de datos gratuita ¡Obtenga nuestra lista de verificación gratuita para garantizar la integridad de la recopilación y el análisis de datos!
  • Estadísticas engañosas en la ciencia

Al igual que el aborto, el calentamiento global es otro tema con carga política que es probable que despierte emociones. También resulta ser un tema que es vigorosamente respaldado por los oponentes y los proponentes a través de estudios. Echemos un vistazo a algunas de las pruebas a favor y en contra.

Generalmente se acepta que la temperatura media global en 1998 fue de 58,3 grados Fahrenheit. Esto es de acuerdo con el Instituto Goddard de Estudios Espaciales de la NASA. En 2012, la temperatura media mundial se midió a 58,2 grados. Por lo tanto, los opositores al calentamiento global argumentan que, como hubo una disminución de 0,1 grados en la temperatura media global durante un período de 14 años, el calentamiento global está refutado.

El siguiente gráfico es el que más a menudo se hace referencia para refutar el calentamiento global. Demuestra el cambio en la temperatura del aire (Celsius) de 1998 a 2012.

estadísticas engañosas ejemplo: reducir los resultados del calentamiento del aire global en un período de tiempo no relevante (solo de 1998 a 2012)

Vale la pena mencionar que 1998 fue uno de los años más calurosos registrados debido a una corriente de viento anormalmente fuerte de El Niño. También vale la pena señalar que, como hay un gran grado de variabilidad dentro del sistema climático, las temperaturas se miden típicamente con un ciclo de al menos 30 años. El siguiente gráfico expresa el cambio de 30 años en las temperaturas medias mundiales.

gráfico que ilustra el calentamiento global de 1980-2012

Y ahora eche un vistazo a la tendencia de 1900 a 2012:gráfico que ilustra el cambio de temperatura global del aire de 1900-2012

Si bien los datos a largo plazo pueden parecer reflejar una meseta, claramente muestran un calentamiento gradual. Por lo tanto, usar el primer gráfico, y solo el primer gráfico, para refutar el calentamiento global es un ejemplo perfecto de estadísticas engañosas.

Cómo Leer Estadísticas Con Distancia

Una primera cosa buena sería, por supuesto, pararse frente a una encuesta/experimento/investigación honesta, elija la que tiene debajo de sus ojos, que haya aplicado las técnicas correctas de recopilación e interpretación de datos. Pero no puedes saberlo hasta que te hagas un par de preguntas y analices los resultados que tienes entre tus manos.

Como el empresario y ex consultor Mark Suster aconseja en un artículo, debe preguntarse quién realizó la investigación primaria de dicho análisis. ¿Grupo de estudio universitario independiente, equipo de investigación afiliado al laboratorio, empresa de consultoría? De ahí surge naturalmente la pregunta: ¿quién les pagó? Como nadie trabaja gratis, siempre es interesante saber quién patrocina la investigación. Del mismo modo, ¿cuáles son los motivos detrás de la investigación? ¿Qué intentaron averiguar los científicos o estadísticos? Finalmente, ¿qué tan grande era el conjunto de muestras y quién formaba parte de él? ¿Qué tan inclusivo fue?

Estas son preguntas importantes para reflexionar y responder antes de difundir por todas partes resultados sesgados o sesgados, a pesar de que sucede todo el tiempo, debido a la amplificación. Un ejemplo típico de amplificación ocurre a menudo con periódicos y periodistas, que toman una pieza de datos y necesitan convertirla en titulares, por lo tanto, a menudo fuera de su contexto original. Nadie compra una revista donde se dice que el próximo año, lo mismo va a suceder en el mercado XYZ que este año, aunque sea cierto. Los editores, clientes y personas quieren algo nuevo, no algo que sepan; es por eso que a menudo terminamos con un fenómeno de amplificación que se hace eco y más de lo que debería.

Mal uso de las estadísticas – Un resumen

A la pregunta » ¿se pueden manipular las estadísticas?», podemos abordar 6 métodos utilizados a menudo, a propósito o no, que sesgan el análisis y los resultados. Estos son los tipos comunes de mal uso de las estadísticas:

  • Sondeo defectuoso
  • Correlaciones defectuosas
  • Pesca de datos
  • Visualización engañosa de datos
  • Sesgo selectivo y con propósito
  • Utilizando el cambio porcentual en combinación con un tamaño de muestra pequeño

Ahora que los conoces, será más fácil detectarlos y cuestionar todas las estadísticas que se te dan todos los días. Del mismo modo, para asegurarse de mantener una cierta distancia a los estudios y encuestas que lee, recuerde las preguntas que debe hacerse: quién investigó y por qué, quién pagó por ello, cuál fue la muestra.

Contenido Adicional Exclusivo: Descargue nuestra Lista de verificación de Integridad de datos gratuita ¡Obtenga nuestra lista de verificación gratuita para garantizar la integridad de la recopilación y el análisis de datos!

Soluciones Empresariales Basadas en datos y Transparencia

Aunque está bastante claro que los datos estadísticos tienen el potencial de ser mal utilizados, también pueden impulsar éticamente el valor de mercado en el mundo digital. El Big data tiene la capacidad de proporcionar a las empresas de la era digital una hoja de ruta para la eficiencia y la transparencia, y, finalmente, la rentabilidad. Las soluciones de tecnología avanzada, como el software de informes en línea, pueden mejorar los modelos de datos estadísticos y proporcionar a las empresas de la era digital un paso adelante en su competencia.

Ya sea para inteligencia de mercado, experiencia del cliente o informes empresariales, el futuro de los datos es ahora. Tenga cuidado de aplicar los datos de manera responsable, ética y visual, y vea crecer su identidad corporativa transparente.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.