Maybaygiare.org

Blog Network

Exemple de statistici înșelătoare – descoperiți potențialul de utilizare necorespunzătoare a statisticilor și datelor în era digitală

om care caută exemple de statistici înșelătoare cu lupă

„există trei tipuri de minciuni – minciuni, la naiba minciuni și statistici.”- Benjamin Disraeli

analizele statistice au fost istoric un stalwart de înaltă tehnologie și industriile avansate de afaceri, iar astăzi ele sunt mai importante decât oricând. Odată cu creșterea tehnologiei avansate și a operațiunilor globalizate, analizele statistice oferă întreprinderilor o perspectivă asupra rezolvării incertitudinilor extreme ale pieței. Studiile favorizează luarea deciziilor în cunoștință de cauză, judecăți solide și acțiuni efectuate pe baza greutății probelor, nu a ipotezelor.

întrucât întreprinderile sunt adesea forțate să urmeze o foaie de parcurs a pieței dificil de interpretat, metodele statistice pot ajuta la planificarea necesară pentru a naviga într-un peisaj plin de gropi, capcane și concurență ostilă. Studiile statistice pot ajuta, de asemenea, în comercializarea de bunuri sau servicii, precum și în înțelegerea fiecărei piețe țintă drivere unice de valoare. În era digitală, aceste capacități sunt îmbunătățite și valorificate doar prin implementarea de tehnologii avansate și software de business intelligence. Dacă toate acestea sunt adevărate, care este problema cu statisticile?

de fapt, nu există nici o problemă în sine – dar poate exista. Statisticile sunt infame pentru capacitatea și potențialul lor de a exista ca date înșelătoare și proaste.

conținut Bonus exclusiv: descărcați lista noastră gratuită de verificare a integrității datelor obțineți lista noastră de verificare gratuită pentru asigurarea integrității colectării și analizei datelor!

ce este o statistică înșelătoare?

Statisticile înșelătoare sunt pur și simplu utilizarea greșită – intenționată sau nu – a unei date numerice. Rezultatele oferă o informație înșelătoare pentru receptor, care apoi crede ceva greșit dacă el sau ea nu observă eroarea sau nu are imaginea completă de date.

având în vedere importanța datelor în lumea digitală de astăzi în evoluție rapidă, este important să se cunoască elementele de bază ale statisticilor înșelătoare și de supraveghere. Ca un exercițiu de due diligence, vom revizui unele dintre cele mai comune forme de abuz de statistici, și diverse alarmante (și, din păcate, comune) statistici înșelătoare exemple din viața publică.

sunt Statisticile fiabile?

73,6% din statistici sunt false. Serios? Nu, desigur, este un număr inventat (chiar dacă un astfel de studiu ar fi interesant de știut – dar, din nou, ar putea avea toate defectele pe care încearcă în același timp să le sublinieze). Fiabilitatea statistică este crucială pentru a asigura precizia și validitatea analizei. Pentru a vă asigura că fiabilitatea este ridicată, există diverse tehnici de efectuat – prima dintre ele fiind testele de control, care ar trebui să aibă rezultate similare atunci când se reproduce un experiment în condiții similare. Aceste măsuri de control sunt esențiale și ar trebui să facă parte din orice experiment sau sondaj – din păcate, acest lucru nu este întotdeauna cazul.

în timp ce numerele nu mint, ele pot fi folosite pentru a induce în eroare cu jumătăți de adevăr. Acest lucru este cunoscut sub numele de „abuzul de statistici.”Se presupune adesea că utilizarea greșită a statisticilor este limitată la acele persoane sau companii care doresc să obțină profit din denaturarea adevărului, fie că este vorba de economie, educație sau mass-media.

cu toate acestea, povestirea jumătăților de adevăr prin studiu nu se limitează doar la amatorii matematici. Un sondaj de investigație din 2009 realizat de Dr. Daniele Fanelli de la Universitatea din Edinburgh a constatat că 33,7% dintre oamenii de știință chestionați au recunoscut practici de cercetare discutabile, inclusiv modificarea rezultatelor pentru a îmbunătăți rezultatele, interpretarea subiectivă a datelor, reținerea detaliilor analitice și scăderea observațiilor din cauza sentimentelor intestinale…. Oamenii de știință!

în timp ce numerele nu trebuie întotdeauna să fie fabricate sau înșelătoare, este clar că nici societățile cele mai de încredere paznici numerici nu sunt imune la nepăsarea și părtinirea care pot apărea cu procesele de interpretare statistică. Există diferite moduri în care statisticile pot fi înșelătoare pe care le vom detalia mai târziu. Cea mai comună este, desigur, corelația versus cauzalitate, care lasă întotdeauna un alt factor (sau doi sau trei) care sunt cauzalitatea reală a problemei. Consumul de ceai crește diabetul cu 50%, iar chelia crește riscul bolilor cardiovasculare până la 70%! Am uitat să menționăm cantitatea de zahăr pusă în ceai sau faptul că chelia și bătrânețea sunt legate – la fel ca riscurile bolilor cardiovasculare și bătrânețea?

deci, statisticile pot fi manipulate? Sigur că pot. Numerele mint? Tu poți fi judecătorul.

cum statisticile pot induce în eroare

tablă care afișează tipurile comune de utilizare necorespunzătoare a statisticilor

amintiți-vă, utilizarea necorespunzătoare a statisticilor poate fi accidentală sau intenționată. În timp ce o intenție rău intenționată de a estompa liniile cu statistici înșelătoare va mări cu siguranță părtinirea, intenția nu este necesară pentru a crea neînțelegeri. Utilizarea abuzivă a statisticilor este o problemă mult mai largă care pătrunde acum prin mai multe industrii și domenii de studiu. Iată câteva potențiale ghinioane care duc în mod obișnuit la utilizarea necorespunzătoare:

  • votare defectuoasă

modul în care sunt formulate întrebările poate avea un impact enorm asupra modului în care un public le răspunde. Modelele specifice de formulare au un efect persuasiv și îi determină pe respondenți să răspundă într-o manieră previzibilă. De exemplu, într – un sondaj care caută opinii fiscale, Să analizăm cele două întrebări potențiale:

– credeți că ar trebui să fiți impozitați pentru ca alți cetățeni să nu fie nevoiți să lucreze?- Credeți că Guvernul ar trebui să ajute acei oameni care nu pot găsi de lucru?

aceste două întrebări sunt susceptibile de a provoca răspunsuri mult diferite, chiar dacă se ocupă de același subiect de asistență guvernamentală. Acestea sunt exemple de ” întrebări încărcate.”

un mod mai precis de formulare a întrebării ar fi: „sprijiniți programele guvernamentale de asistență pentru șomaj?”sau, (și mai neutru)” care este punctul dvs. de vedere cu privire la asistența pentru șomaj?”

ultimele două exemple ale întrebărilor originale elimină orice inferență sau sugestie din poller și, prin urmare, sunt semnificativ mai imparțiale. O altă metodă nedreaptă de votare este de a pune o întrebare, dar o precede cu o declarație condiționată sau o declarație de fapt. Rămânând cu exemplul nostru, ar arăta astfel: „având în vedere costurile în creștere pentru clasa de mijloc, susțineți programele de asistență guvernamentală?”

o regulă bună este să luați întotdeauna sondaje cu un bob de sare și să încercați să revizuiți întrebările care au fost prezentate efectiv. Ele oferă o perspectivă mare, de multe ori mai mult decât răspunsurile.

  • corelații eronate

problema cu corelațiile este aceasta: dacă măsurați suficiente variabile, în cele din urmă va apărea că unele dintre ele se corelează. Deoarece unul din douăzeci va fi inevitabil considerat semnificativ fără nicio corelație directă, studiile pot fi manipulate (cu suficiente date) pentru a dovedi o corelație care nu există sau care nu este suficient de semnificativă pentru a dovedi cauzalitatea.

pentru a ilustra acest punct în continuare, să presupunem că un studiu a găsit o corelație între o creștere a accidentelor de mașină în statul New York în luna iunie (a) și o creștere a atacurilor de urși în statul New York în luna iunie (B).

asta înseamnă că vor exista probabil șase explicații posibile:

– accidente de mașină (A) provoacă atacuri de urs (B)- atacuri de urs (B) provoacă accidente de mașină (A)- accidente de mașină (A) și atacuri de urs (B) provoacă parțial reciproc – accidentele de mașină (A) și atacurile de urs (B) sunt cauzate de un al treilea factor (C) -) sunt cauzate de un al treilea factor (C) care se corelează cu accidentele auto (a)- corelația este doar întâmplătoare

orice persoană sensibilă ar identifica cu ușurință faptul că accidentele auto nu provoacă atacuri de urs. Fiecare este probabil rezultatul unui al treilea factor, acesta fiind: o populație crescută, datorită sezonului turistic ridicat din luna iunie. Ar fi absurd să spunem că se provoacă reciproc… și tocmai de aceea este exemplul nostru. Este ușor să vezi o corelație.

dar, ce zici de cauzalitate? Ce se întâmplă dacă variabilele măsurate ar fi diferite? Ce se întâmplă dacă a fost ceva mai credibil, cum ar fi Alzheimer și bătrânețe? În mod clar există o corelație între cele două, dar există cauzalitate? Mulți ar presupune în mod fals, da, numai pe baza forței corelației. Călcați cu atenție, fie cu bună știință, fie din ignoranță, vânătoarea de corelații va continua să existe în cadrul studiilor statistice.

  • pescuit de date

acest exemplu de date înșelătoare este denumit și „dragare de date” (și legat de corelații eronate). Este o tehnică de extragere a datelor în care sunt analizate volume extrem de mari de date în scopul descoperirii relațiilor dintre punctele de date. Căutarea unei relații între date nu este o utilizare abuzivă a datelor în sine, totuși, a face acest lucru fără o ipoteză este.

dragarea datelor este o tehnică de auto-servire folosită adesea în scopul neetic de a eluda tehnicile tradiționale de extragere a datelor, pentru a căuta concluzii suplimentare de date care nu există. Acest lucru nu înseamnă că nu există o utilizare adecvată a mineritului de date, deoarece poate duce, de fapt, la surprize și analize interesante. Cu toate acestea, de cele mai multe ori, dragarea datelor este utilizată pentru a presupune existența relațiilor de date Fără studii suplimentare.

de multe ori, pescuitul de date are ca rezultat studii foarte mediatizate datorită constatărilor lor importante sau bizare. Aceste studii sunt foarte curând contrazise de alte descoperiri importante sau ciudate. Aceste corelații false lasă adesea publicul larg foarte confuz și caută răspunsuri cu privire la semnificația cauzalității și corelației.

de asemenea, o altă practică obișnuită cu datele este omisiunea, ceea ce înseamnă că, după ce te uiți la un set mare de date de răspunsuri, le alegi doar pe cele care îți susțin opiniile și constatările și le lași pe cele care le contrazic. După cum sa menționat la începutul acestui articol, sa demonstrat că o treime dintre oamenii de știință au recunoscut că au avut practici de cercetare discutabile, inclusiv reținerea detaliilor analitice și modificarea rezultatelor…! Dar, din nou, ne confruntăm cu un studiu care ar putea să se încadreze în aceste 33% din practicile discutabile, sondarea defectuoasă, părtinirea selectivă… Devine greu de crezut orice analiză!

conținut Bonus exclusiv: descărcați lista noastră gratuită de verificare a integrității datelor obțineți lista noastră de verificare gratuită pentru asigurarea integrității colectării și analizei datelor!

  • vizualizare înșelătoare a datelor

graficele și graficele intuitive includ gruparea elementelor foarte elementare, dar esențiale. Oricare ar fi tipurile de vizualizare a datelor pe care alegeți să le utilizați, aceasta trebuie să transmită:

– scalele utilizate – valoarea de pornire (zero sau altfel)- metoda de calcul (de exemplu, setul de date și perioada de timp)

în absența acestor elemente, reprezentările vizuale ale datelor trebuie vizualizate cu un bob de sare, ținând cont de greșelile comune de vizualizare a datelor pe care le puteți face. Punctele de date intermediare ar trebui, de asemenea, să fie identificate și să se dea un context în cazul în care ar adăuga valoare informațiilor prezentate. Odată cu creșterea dependenței de automatizarea inteligentă a soluțiilor pentru comparații cu puncte de date variabile, ar trebui implementate cele mai bune practici (adică proiectarea și scalarea) înainte de a compara datele din diferite surse, seturi de date, ore și locații.

  • părtinire intenționată și selectivă

ultimul dintre cele mai frecvente exemple de utilizare greșită a statisticilor și a datelor înșelătoare este, probabil, cel mai grav. Tendința intenționată este încercarea deliberată de a influența rezultatele datelor fără a preface chiar responsabilitatea profesională. Biasul este cel mai probabil să ia forma omisiunilor sau ajustărilor de date.

părtinirea selectivă este puțin mai discretă pentru cine nu citește liniile mici. De obicei, cade pe eșantionul de persoane chestionate. De exemplu, natura grupului de persoane chestionate: solicitarea unei clase de studenți despre vârsta legală de băut sau a unui grup de pensionari despre sistemul de îngrijire a persoanelor în vârstă. Veți ajunge la o eroare statistică numită”părtinire selectivă”.

  • folosind modificarea procentuală în combinație cu o dimensiune mică a eșantionului

un alt mod de a crea statistici înșelătoare, legate și de alegerea eșantionului discutat mai sus, este dimensiunea eșantionului menționat. Atunci când un experiment sau un sondaj este condus pe o dimensiune total nesemnificativă a eșantionului, nu numai că rezultatele vor fi inutilizabile, dar modul de prezentare a acestora – și anume ca procente – va fi total înșelător.

adresarea unei întrebări unui eșantion de 20 de persoane, unde 19 răspund „Da” (=95% spun da) față de adresarea aceleiași întrebări la 1.000 de persoane și 950 răspund „Da” (=95%): valabilitatea procentului nu este în mod clar aceeași. Furnizarea exclusivă a procentului de modificare Fără numărul total sau dimensiunea eșantionului va fi total înșelătoare. benzi desenate xkdc ilustrează acest lucru foarte bine, pentru a arăta modul în care afirmația „cu cea mai rapidă creștere” este un discurs de marketing total relativ:

xkcd comic batjocorind argumentul "cu cea mai rapidă creștere""fastest-growing" argument

de asemenea, dimensiunea eșantionului necesar este influențată de tipul de întrebare pe care o puneți, de semnificația statistică de care aveți nevoie (studiu clinic vs studiu de afaceri) și de tehnica statistică. Dacă efectuați o analiză cantitativă, dimensiunile eșantioanelor sub 200 de persoane sunt de obicei nevalide.

statistici înșelătoare exemple în viața reală

acum, că am analizat mai multe dintre metodele cele mai comune de utilizare abuzivă a datelor, să ne uităm la diferite exemple de vârstă digitală de statistici înșelătoare în trei Spectre distincte, dar conexe: media și politică, publicitate și știință. În timp ce anumite subiecte enumerate aici pot stârni emoții în funcție de punctul de vedere al cuiva, includerea lor este doar în scopuri demonstrative de date.

  • Exemple de statistici înșelătoare în mass-media și politică

statistici înșelătoare exemplu în politică: grafic de propagandă fără axa y creat de un grup anti-avort pentru a induce în eroare judecata

Statisticile înșelătoare din mass-media sunt destul de frecvente. În Septembrie. 29, 2015, Republicanii din Congresul SUA au interogat-o pe Cecile Richards, președintele Planned Parenthood, cu privire la deturnarea a 500 de milioane de dolari în finanțare federală anuală. Graficul/graficul de mai sus a fost prezentat ca punct de accent.

reprezentantul Jason Chaffetz din Utah a explicat: „în roz, aceasta este reducerea examenelor de sân, iar roșu este creșterea avorturilor. Asta se întâmplă în organizația ta.”

pe baza structurii graficului, se pare că numărul avorturilor din 2006 a înregistrat o creștere substanțială, în timp ce numărul de proiecții de cancer a scăzut substanțial. Intenția este de a transmite o schimbare în centrul atenției de la screening-ul cancerului la avort. Punctele din diagramă par să indice că 327.000 de avorturi au o valoare inerentă mai mare decât 935.573 de proiecții de cancer. Cu toate acestea, o examinare mai atentă va arăta că graficul nu are o axă y definită. Aceasta înseamnă că nu există o justificare definibilă pentru plasarea liniilor de măsurare vizibile.

Politifact, un site de advocacy pentru verificarea faptelor, a revizuit numerele reprezentantului Chaffetz printr-o comparație cu rapoartele anuale ale Planned Parenthood. Folosind o scară clar definită, iată cum arată informația:

vizualizare corectă a datelor care arată Planned parenthood așa cum este cu o scară clar definită și o axă Y existentă

și așa cu o altă scară validă:

demonstrarea Planned parenthood cu anoder valide scale

odată plasat într-o scară clar definită, devine evident că, în timp ce numărul de proiecții de cancer a scăzut de fapt, acesta depășește cu mult numărul procedurilor de avort efectuate anual. Ca atare, acesta este un exemplu excelent de statistici înșelătoare, iar unii ar putea argumenta părtinirea, având în vedere că graficul nu provine de la congresman, ci de la americanii uniți pentru viață, un grup anti-avort. Acesta este doar unul dintre multele exemple de statistici înșelătoare în mass-media și politică.

  • statistici înșelătoare în publicitate

tuburi de pastă de dinți colgate

în 2007, Colgate a fost comandat de autoritatea pentru standarde de publicitate (asa) din Marea Britanie să renunțe la afirmația lor: „mai mult de 80% dintre stomatologi recomandă Colgate.”Sloganul în cauză a fost poziționat pe un panou publicitar din Marea Britanie și a fost considerat a încălca regulile de publicitate din Marea Britanie.

afirmația, care s-a bazat pe sondaje efectuate de dentiști și igieniști efectuate de producător, s-a dovedit a fi denaturată, deoarece a permis participanților să selecteze una sau mai multe mărci de pastă de dinți. ASA a declarat că afirmația ” … ar fi înțeleasă de cititori ca însemnând că 80% dintre stomatologi recomandă Colgate peste alte mărci, iar restul de 20% ar recomanda diferite mărci.”

ASA a continuat: „pentru că am înțeles că marca unui alt concurent a fost recomandată aproape la fel de mult ca marca Colgate de către medicii stomatologi chestionați, am ajuns la concluzia că afirmația implică în mod înșelător 80% dintre stomatologi recomandă pasta de dinți Colgate în preferință față de toate celelalte mărci.”ASA a susținut, de asemenea, că scripturile utilizate pentru sondaj au informat participanții că cercetarea a fost efectuată de o companie independentă de cercetare, ceea ce a fost în mod inerent fals.

pe baza tehnicilor de utilizare necorespunzătoare pe care le-am acoperit, este sigur să spunem că această tehnică a lui Colgate este un exemplu clar de statistici înșelătoare în publicitate și ar cădea sub o votare defectuoasă și o părtinire directă.

conținut Bonus exclusiv: descărcați lista noastră gratuită de verificare a integrității datelor obțineți lista noastră de verificare gratuită pentru asigurarea integrității colectării și analizei datelor!
  • statistici înșelătoare în știință

la fel ca avortul, încălzirea globală este un alt subiect încărcat politic care este probabil să trezească emoții. De asemenea, se întâmplă să fie un subiect care este susținut viguros atât de adversari, cât și de susținători prin studii. Să aruncăm o privire la unele dintre dovezile pro și contra.

se convine în general că temperatura medie globală în 1998 a fost de 58,3 grade Fahrenheit. Acest lucru este potrivit Institutului Goddard pentru Studii Spațiale al NASA. În 2012, temperatura medie globală a fost măsurată la 58,2 grade. Prin urmare, oponenții încălzirii globale susțin că, deoarece a existat o scădere de 0,1 grade a temperaturii medii globale pe o perioadă de 14 ani, încălzirea globală este respinsă.

graficul de mai jos este cel la care se face referire cel mai des pentru a infirma încălzirea globală. Aceasta demonstrează schimbarea temperaturii aerului (Celsius) din 1998 până în 2012.

exemplu de statistici înșelătoare: reducerea rezultatelor încălzirii globale a aerului într-un interval de timp nerelevant (doar din 1998-2012)

merită menționat faptul că 1998 a fost unul dintre cei mai călduroși ani înregistrați din cauza unui curent eolian El Ni Ni-Noxto anormal de puternic. De asemenea, este demn de remarcat faptul că, deoarece există un grad mare de variabilitate în cadrul sistemului climatic, temperaturile sunt de obicei măsurate cu cel puțin un ciclu de 30 de ani. Graficul de mai jos exprimă schimbarea de 30 de ani a temperaturilor medii globale.

diagramă care ilustrează încălzirea globală din 1980-2012

și acum aruncați o privire asupra tendinței din 1900 până în 2012:diagramă care ilustrează schimbarea globală a temperaturii aerului din 1900-2012

în timp ce datele pe termen lung pot părea să reflecte un platou, acesta prezintă în mod clar o imagine a încălzirii treptate. Prin urmare, folosind primul grafic, și numai primul grafic, pentru a respinge încălzirea globală este un exemplu perfect de statistici înșelătoare.

cum să citești Statisticile cu distanța

un prim lucru bun ar fi, desigur, să stai în fața unui sondaj/experiment / cercetare onest – alege – l pe cel pe care îl ai sub ochi -, care a aplicat tehnicile corecte de colectare și interpretare a datelor. Dar nu puteți ști până nu vă puneți câteva întrebări și nu analizați rezultatele pe care le aveți între mâini.

după cum recomandă antreprenorul și fostul consultant Mark Suster într-un articol, ar trebui să vă întrebați cine a făcut cercetarea primară a analizei menționate. Grup independent de studiu universitar, echipă de cercetare afiliată la laborator, companie de consultanță? De acolo rezultă în mod natural întrebarea: cine le-a plătit? Deoarece nimeni nu lucrează gratuit, este întotdeauna interesant să știm cine sponsorizează cercetarea. De asemenea, care sunt motivele din spatele cercetării? Ce a încercat omul de știință sau statisticienii să-și dea seama? În cele din urmă, cât de mare a fost setul de eșantioane și cine a făcut parte din el? Cât de incluzivă a fost?

acestea sunt întrebări importante de meditat și răspuns înainte de a răspândi peste tot rezultate înclinate sau părtinitoare – chiar dacă se întâmplă tot timpul, din cauza amplificării. Un exemplu tipic de amplificare se întâmplă adesea cu ziarele și jurnaliștii, care iau o bucată de date și trebuie să o transforme în titluri – deci adesea în afara contextului său original. Nimeni nu cumpără o revistă în care afirmă că anul viitor, același lucru se va întâmpla pe piața XYZ ca și anul acesta – chiar dacă este adevărat. Editorii, clienții și oamenii își doresc ceva nou, nu ceva ce știu; de aceea ajungem adesea la un fenomen de amplificare care se repetă și mai mult decât ar trebui.

utilizarea abuzivă a statisticilor-un rezumat

la întrebarea „pot fi manipulate Statisticile?”, putem aborda 6 metode utilizate adesea – intenționat sau nu-care înclină analiza și rezultatele. Iată tipurile comune de utilizare abuzivă a statisticilor:

  • votare defectuoasă
  • corelații eronate
  • pescuit de date
  • vizualizare înșelătoare a datelor
  • părtinire intenționată și selectivă
  • folosind modificarea procentuală în combinație cu o dimensiune mică a eșantionului

acum, că le cunoașteți, va fi mai ușor să le identificați și să puneți la îndoială Toate Statisticile care vă sunt date în fiecare zi. De asemenea, pentru a vă asigura că păstrați o anumită distanță față de studiile și sondajele pe care le citiți, amintiți – vă întrebările pe care să le întrebați-cine a cercetat și de ce, cine a plătit pentru asta, care a fost eșantionul.

conținut Bonus exclusiv: descărcați lista noastră gratuită de verificare a integrității datelor obțineți lista noastră de verificare gratuită pentru asigurarea integrității colectării și analizei datelor!

transparență și soluții de afaceri bazate pe date

deși este destul de clar că datele statistice au potențialul de a fi utilizate în mod abuziv, pot, de asemenea, să conducă etic valoarea de piață în lumea digitală. Big data are capacitatea de a oferi întreprinderilor din era digitală o foaie de parcurs pentru eficiență și transparență și, în cele din urmă, profitabilitate. Soluțiile tehnologice avansate, cum ar fi software-ul de raportare online, pot îmbunătăți modelele de date statistice și pot oferi întreprinderilor din era digitală o creștere a concurenței.

fie pentru informații de piață, experiența clienților sau raportarea de afaceri, viitorul datelor este acum. Aveți grijă să aplicați datele în mod responsabil, etic și vizual și urmăriți creșterea identității corporative transparente.

Lasă un răspuns

Adresa ta de email nu va fi publicată.