Maybaygiare.org

Blog Network

誤解を招く統計の例–デジタル時代における統計とデータの誤用の可能性を発見

ルーペで誤解を招く統計の例を探している男

“嘘の三つのタイプがあります-嘘、くそうそ、および統計。”-Benjamin Disraeli

統計分析は歴史的にハイテクおよび高度なビジネス産業の重鎮となっており、今日ではこれまで以上に重要です。 高度な技術とグローバル化した事業の台頭に伴い、統計分析は、企業に市場の極端な不確実性を解決するための洞察を与えます。 研究は、情報に基づいた意思決定、健全な判断、および仮定ではなく証拠の重さに基づいて行われる行動を促進する。

企業はしばしば解釈が困難な市場ロードマップに従うことを余儀なくされているため、統計的方法は、甌穴、落とし穴、敵対的な競争で満たされた風景をナビゲートするために必要な計画を支援することができます。 統計的研究は、商品やサービスのマーケティング、および各ターゲット市場のユニークな価値ドライバーを理解するのにも役立ちます。 デジタル時代には、これらの機能は、高度な技術とビジネスインテリジェンスソフトウェアの実装を通じてさらに強化され、活用されています。 このすべてが真実ならば、統計の問題は何ですか?実際には、それ自体に問題はありません–しかし、そこにすることができます。 統計は、彼らの能力と誤解を招くと悪いデータとして存在する可能性のために悪名高いです。

排他的なボーナスコンテンツ:私たちの無料のデータ整合性チェックリストをダウンロードデータ収集と分析の整合性を確保する

誤解を招く統計とは何ですか?

誤解を招く統計は、単に数値データの誤用-意図的であるかどうか-です。 結果は彼または彼女が間違いに気づかないか、または完全なデータ映像を持たなければ間違って何かを信じる受信機に誤解を招く情報を提供する。

今日の急速に進化するデジタル世界におけるデータの重要性を考えると、誤解を招く統計と監督の基礎に精通していることが重要 デューデリジェンスの練習として、私たちは、統計の誤用の最も一般的な形態のいくつか、および公共の生活からの様々な驚くべき(そして悲しいことに、一般的な)誤解を招く統計の例をレビューします。

統計は信頼性がありますか?

統計の73.6%が偽です。 本当に? いいえ、もちろん、それは構成された番号です(たとえそのような研究が知っているのは面白いでしょうが、同時に指摘しようとするすべての欠陥を持 統計的信頼性は、分析の精度と妥当性を確保するために非常に重要です。 信頼性が高いことを確認するために、実行するための様々な技術があります–それらの最初の制御試験であり、それは同様の条件で実験を再現するときに同様の結果を持つ必要があります。 これらの制御措置は不可欠であり、任意の実験や調査の一部でなければなりません–残念ながら、それは常にそうではありません。数字は嘘ではありませんが、実際には半分の真実を誤解させるために使用することができます。

数字は嘘ではありませんが、実際には これは「統計の誤用」として知られています。”統計の誤用は、経済学、教育、マスメディアなど、真実を歪めることから利益を得ようとする個人や企業に限定されることが多いと仮定されています。しかし、研究を通じて半真理を伝えることは、数学的なアマチュアに限定されるものではありません。 エジンバラ大学のDaniele Fanelli博士による2009年の調査調査では、調査された科学者の33.7%が、結果を改善するための結果の変更、主観的なデータ解釈、分析的な詳細の源泉徴収、腸の感情のための観察の削除など、疑わしい研究慣行を認めていることが分かった。 科学者!

数字は必ずしも捏造または誤解を招く必要はありませんが、最も信頼されている数値ゲートキーパーであっても、統計的解釈プロセスで生 統計がどのように誤解を招くかはさまざまな方法がありますが、後で詳しく説明します。 最も一般的なものは、もちろん相関対因果関係であり、問題の実際の因果関係である別の(または2つまたは3つの)要因を常に除外します。 お茶を飲むことは糖尿病を50%増加させ、脱毛症は心血管疾患のリスクを70%まで上昇させます! 私たちはお茶に入れた砂糖の量、または脱毛症と老齢が関連しているという事実を言及するのを忘れましたか?p>

だから、統計を操作することができますか? 彼らは確かにできます。 数字は嘘ですか? あなたは裁判官になることができます。

統計が誤解を招く可能性がある方法

統計の誤用の一般的なタイプを表示する黒板

統計の誤用は、偶発的または意図的である可能性があることを覚えておいてください。 誤解を招く統計で線をぼかす悪意のある意図は確かにバイアスを拡大しますが、意図は誤解を作成する必要はありません。 統計の誤用は、現在、複数の産業や研究分野に浸透しているはるかに広範な問題です。 ここでは、一般的に誤用につながるいくつかの潜在的な事故があります:

  • 障害のあるポーリング

質問が表現される方法は、聴衆がそれらに答える方法に大きな影響を与える可能性があります。 特定の文言パターンは説得力のある効果を持っており、予測可能な方法で答えるために回答者を誘導します。 たとえば、税の意見を求めている世論調査では、二つの潜在的な質問を見てみましょう:

-他の市民が働く必要がないように課税されるべき-あなたは、政府が仕事を見つけることができない人々を助けるべきだと思いますか?

これら二つの質問は、彼らが政府支援の同じトピックを扱っていても、はるかに異なる応答を引き起こす可能性があります。 これらは”ロードされた質問の例です。”

質問を表現するより正確な方法は、”あなたは失業のための政府の支援プログラムをサポートしていますか?”または、(さらに中立的に)”失業支援に関するあなたの視点は何ですか?”

元の質問の後者の二つの例は、ポーラーからの推論や提案を排除し、したがって、はるかに公平です。 ポーリングのもう一つの不公平な方法は、質問をすることですが、条件文または事実の声明でそれに先行することです。 私たちの例にとどまると、それは次のようになります:”中産階級へのコスト上昇を考えると、あなたは政府の支援プログラムをサポートしていますか?”

良い経験則は、常に塩の粒でポーリングを取り、実際に提示された質問をレビューしようとすることです。 彼らは、多くの場合、より多くのように答えよりも、偉大な洞察力を提供します。

  • 欠陥のある相関

相関の問題はこれです:十分な変数を測定すると、最終的にはそれらのいくつかが相関しているよう 二十のうちの一つは、必然的に任意の直接相関なしで重要とみなされるように、研究は存在しないか、因果関係を証明するのに十分な有意ではない相関

この点をさらに説明するために、ある調査では、月のニューヨーク州での自動車事故の増加(A)と月のニューヨーク州でのクマの攻撃の増加(B)との間に相関が見つかったと仮定しましょう。

それは可能性が高い六つの可能な説明があることを意味します:

-車の事故(A)はクマの攻撃を引き起こす(B)-クマの攻撃(B)は車の事故(A)-車の事故(a)とクマの攻撃(B)は部分的にお互いを引き起こす-車の事故(a)とクマの攻撃(B)は第三の要因(C)によって引き起こされる-クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、クマの攻撃(B)は、車の事故に相関する第三の要因(c)(a)-相関は唯一のチャンスです

賢明な人は、車の事故がクマの攻撃を引き起こさないという事実を簡 それぞれが第三の要因の結果である可能性があります,そのこと:増加した人口,月の月の高い観光シーズンのために. 彼らがお互いを引き起こすと言うのは馬鹿げているでしょう。.. そしてそれがまさにそれが私たちの例である理由です。 相関関係を見るのは簡単です。しかし、因果関係はどうですか? 測定された変数が異なっていた場合はどうなりますか? それがアルツハイマー病や老齢のような、より信じられるものだったらどうなりますか? 明らかに2つの間には相関関係がありますが、因果関係はありますか? 多くの人が誤って、はい、単に相関の強さに基づいて仮定します。 故意または無知のいずれかのために、相関狩猟は統計的研究の中で存在し続けるだろう、慎重に踏みます。

  • データ釣り

この誤解を招くデータ例は、”データ浚渫”とも呼ばれます(および欠陥のある相関に関連しています)。 これは、データポイント間の関係を発見する目的で、非常に大量のデータが分析されるデータマイニング技術です。 データ間の関係を求めることは、それ自体がデータの誤用ではありませんが、仮説なしでそうすることはそうです。

データ浚渫は、多くの場合、存在しない追加のデータの結論を求めるために、伝統的なデータマイニング技術を回避する非倫理的な目的のた これは、実際には驚きの外れ値や興味深い分析につながる可能性があるため、データマイニングの適切な使用がないと言うことではありません。 しかし、多くの場合、データ浚渫は、さらなる研究なしにデータ関係の存在を前提とするために使用されます。

多くの場合、データ釣りは、その重要なまたは風変わりな調査結果のために非常に公表されている研究の結果をもたらします。 これらの研究は、すぐに他の重要なまたは風変わりな発見によって矛盾しています。 これらの誤った相関関係は、しばしば一般の人々を非常に混乱させ、因果関係と相関の重要性に関する答えを探します。

同様に、データのもう一つの一般的な方法は、回答の大規模なデータセットを見た後、あなたはあなたの意見と発見をサポートしているも この記事の冒頭で述べたように、科学者の3分の1が、分析の詳細を源泉徴収し、結果を修正するなど、疑わしい研究慣行を持っていることを認めたこ..! しかし、再び、我々はそれ自体が疑わしい慣行、障害のあるポーリング、選択的バイアスのこれらの33%に陥る可能性のある研究に直面しています。.. それは、任意の分析を信じることは困難になります!

排他的なボーナスコンテンツ:私たちの無料のデータ整合性チェックリストをダウンロードデータ収集と分析の整合性を確保する
  • 誤解を招くデータの可視化

洞察力のあるグラフやチャートは、要素の非常に基本的な、しかし不可欠な、グループ化が含まれ 使用するデータビジュアライゼーションの種類にかかわらず、次のことを伝える必要があります。

-使用されるスケール-開始値(ゼロまたはその他)-計算方法(データセットや期間など)

これらの要素がない場合、視覚的なデータ表現は、一般的なデータビジュアライゼーションの間違いを考慮して、塩の粒で表示する必要があります。 提示された情報に価値を追加する場合は、中間データポイントも識別し、コンテキストを指定する必要があります。 可変データポイント比較のインテリジェントなソリューション自動化への依存が高まるにつれて、さまざまなソース、データセット、時間、場所からのデータを比較する前に、ベストプラクティス(設計とスケーリング)を実装する必要があります。

  • 意図的かつ選択的バイアス

統計の誤用や誤解を招くデータのための私たちの最も一般的な例の最後は、おそらく、最も深刻 意図的なバイアスは、専門家の説明責任を装うことなく、データの調査結果に影響を与える意図的な試みです。 バイアスは、データの欠落や調整の形をとる可能性が最も高いです。

選択バイアスは、小さな行を読んでいない人のために少し控えめです。 それは通常、調査された人々のサンプルに落ちます。 例えば、調査した人々のグループの性質:大学生のクラスに法的飲酒年齢について尋ねるか、または高齢者ケアシステムについて退職した人々のグループ。 あなたは”選択的バイアス”と呼ばれる統計的誤差で終わるでしょう。

  • 小さなサンプルサイズと組み合わせて変化率を使用して

誤解を招く統計を作成する別の方法は、上記のサンプルの選択 実験や調査が完全に有意ではないサンプルサイズに導かれている場合、結果は使用できなくなるだけでなく、それらを提示する方法-すなわちパーセンテージ

20人のサンプルサイズに質問をし、19人が”はい”と答え(=95%が”はい”と言う)、1,000人と950人が”はい”と答え(=95%も同様):割合の妥当性は明らかに同じでは 合計数やサンプルサイズなしで変更の割合のみを提供することは、完全に誤解を招くことになります。 xkdcの漫画は、”最も急速に成長している”主張が完全に相対的なマーケティングスピーチであるかを示すために、これを非常によく説明しています:

xkcd comicは、"最も急速に成長している"引数を嘲笑"fastest-growing" argument

同様に、必要なサンプルサイズは、あなたが尋ねる質問の種類、必要な統計的 定量分析を実行すると、通常、200人未満のサンプルサイズは無効になります。

実際の生活の中で誤解を招く統計の例

今、私たちは、データの誤用の最もコモンズの方法のいくつかを検討していることを、のは、 ここに記載されている特定のトピックは、自分の視点に応じて感情をかき混ぜる可能性がありますが、それらの包含はデータデモの目的のみです。

  • メディアと政治における誤解を招く統計の例

政治における誤解を招く統計の例:判断を誤解させるために反中絶グループによって作成されたy軸のないプロパガンダグラフ

div>メディアの誤解を招く統計は非常に一般的です。 月号に掲載されました。 29,2015,米国議会からの共和党員は、セシル*リチャーズに疑問を呈しました,計画親子関係の社長,年間連邦資金でmis500百万の横領について. 上記のグラフ/チャートは、重点のポイントとして提示されました。

ユタ州の代表Jason Chaffetzは説明しました:”ピンクでは、それは乳房検査の減少であり、赤は中絶の増加です。 それがあなたの組織で起こっていることです。”

チャートの構造に基づいて、それは実際には癌スクリーニングの数が大幅に減少しながら、2006年以来の中絶の数は、実質的な成長を経験 その意図は、がん検診から中絶への焦点のシフトを伝えることです。 チャートポイントは、327,000の中絶が935,573の癌スクリーニングよりも固有の値が大きいことを示しているようです。 しかし、詳細に検討すると、チャートには定義されたy軸がないことが明らかになります。 これは目に見える測定ラインの配置のための定義可能な正当化がないことを意味する。

ファクトチェックアドボカシーのウェブサイトであるPolitifactは、計画された親子関係の独自の年次報告書との比較を通じてChaffetz議員の数字を 明確に定義されたスケールを使用して、ここで情報がどのように見えるかです:

明確に定義されたスケールと既存のy軸

:

anoder valideスケールで計画された親子関係を実証

一度明確に定義されたスケール内に配置されると、がんスクリーニングの数は実際には減少しているが、それはまだはるかに毎年行われる中絶手順の量を上回っていることが明らかになる。 このように、これは大きな誤解を招く統計の例であり、チャートが下院議員からではなく、反中絶グループであるAmericans United for Lifeからのものであることを考慮して、 これは、メディアや政治における誤解を招く統計の多くの例の1つにすぎません。

  • 広告における誤解を招く統計

コルゲート歯磨き粉チューブ

2007年、コルゲートは広告標準局(ASA)によって発注された。英国は彼らの主張を放棄する:”歯科医の80%以上がコルゲートをお勧めします。”問題のスローガンは、英国の広告看板に配置され、英国の広告ルールに違反しているとみなされました。

メーカーが実施した歯科医と衛生士の調査に基づいていたこの主張は、参加者が一つ以上の歯磨き粉ブランドを選択することを可能にしたため、誤って表現されていることが判明した。 ASAは、この主張は”…歯科医の80%が他のブランドの上にコルゲートを推奨し、残りの20%が異なるブランドを推奨することを意味すると読者に理解されるだろう”と述べた。”

ASAは続けて、”別の競合他社のブランドが調査された歯科医によってコルゲートブランドとほぼ同じくらい推奨されていたことを理解していたため、歯科医の80%が他のすべてのブランドよりもコルゲート歯磨き粉を推奨していることを誤って暗示していると結論づけた。”ASAはまた、調査に使用されたスクリプトは、研究が本質的に偽であった独立した研究会社によって行われていたことを参加者に通知したと主張した。

私たちがカバーした誤用の技術に基づいて、Colgateによるこの手の手の技術は、広告における誤解を招く統計の明確な例であり、障害のあるポーリングとあからさまなバイアスに該当すると言っても安全です。

排他的なボーナスコンテンツ:私たちの無料のデータ整合性チェックリストをダウンロードデータ収集と分析の整合性を確保する
  • 科学における誤解を招く統計

中絶と同様に、地球温暖化は感情を喚起する可能性のある政治的に充電された それはまた、研究を通じて反対派と支持者の両方によって積極的に支持されているトピックであることを起こります。 のは、のためと反対の証拠のいくつかを見てみましょう。

1998年の世界の平均気温は華氏58.3度であることは一般的に合意されています。 これはNASAのGoddard Institute For Space Studiesによると、これは宇宙研究のためのものです。 2012年には、世界の平均気温は58.2度で測定されました。 したがって、地球温暖化反対派によって、14年間にわたって地球平均気温が0.1度低下したため、地球温暖化は反証されていると主張されています。

下のグラフは、地球温暖化を反証するために最も頻繁に参照されるグラフです。 これは、1998年から2012年までの気温(摂氏)の変化を示しています。

誤解を招く統計の例: 関連しない時間枠で地球大気温暖化の結果をカットする(1998年から2012年のみ)

1998年は異常に強いエルニーニョ風の流れのために記録上で最もホットな年の一つであったことに言及する価値がある。 また、気候システム内に大きな程度の変動があるため、温度は通常、少なくとも30年サイクルで測定されることにも注目する価値があります。 下の表は、世界の平均気温の30年の変化を表しています。

1980年から2012年の地球温暖化を示すチャート

そして今、1900年から2012年までの傾向を見てみましょう:1900年から2012年までの世界的な気温変化を示すチャート1980年から2012年までの地球温暖化を示すチャート1900年から2012年までの世界的な気温変化を示すチャート

長期的なデータは高原を反映しているように見えるかもしれませんが、徐々に温暖化の絵をはっきりと描いています。 したがって、最初のグラフを使用して、最初のグラフのみを使用して、地球温暖化を反証することは、誤解を招く統計の完全な例です。

距離で統計を読み取る方法

最初の良いことは、正直な調査/実験/研究の前に立つことはもちろんでしょう–あなたの目の下にあ しかし、あなた自身にいくつかの質問をし、あなたの手の間にある結果を分析するまで、あなたは知ることができません。

起業家で元コンサルタントのMark Susterが記事でアドバイスしているように、あなたは誰が言った分析の主要な研究をしたのだろうか。 独立した大学の研究グループ、研究室所属の研究チーム、コンサルティング会社? そこから自然に質問が出てくる:誰がそれらを支払ったのですか? 誰も無料で働いていないので、誰が研究を後援しているのかを知ることは常に興味深いことです。 同様に、研究の背後にある動機は何ですか? 科学者や統計学者は何を理解しようとしましたか? 最後に、サンプルセットはどのくらいの大きさで、誰がその一部でしたか? それはどのように包括的でしたか?

これらは、増幅のために常に起こっているにもかかわらず、歪んだ結果や偏った結果をどこにでも広げる前に熟考して答える重要な問 増幅の典型的な例は、1つのデータを取り、それを見出しに変える必要がある新聞やジャーナリストで頻繁に起こります–それゆえ、しばしば元の文脈から 誰もそれが来年、同じことが今年のようにXYZ市場で起こるだろうと述べている雑誌を購入しません–それは本当ですにもかかわらず。 編集者、クライアント、そして人々は、彼らが知っている何かではなく、新しい何かをしたい、私たちはしばしばエコーされ、それが必要以上の増幅現象で終わp>

統計の誤用-要約

“統計を操作することはできますか?”、私たちは、多くの場合、使用される6つの方法に対処することができます-意図的にかどうか-分析と結果を歪めます。 統計の誤用の一般的なタイプは次のとおりです:

  • 障害のあるポーリング
  • 欠陥のある相関
  • データ釣り
  • 誤解を招くデータ可視化
  • 意図的かつ選択的バイアス
  • 小さなサ

    あなたがそれらを知っているので、それらを見つけ出し、毎日あなたに与えられているすべての統計に質問する方が簡単になります。 同様に、あなたが読んだ研究や調査に一定の距離を保つようにするために、自分自身に尋ねる質問を覚えておいてください-誰が研究し、なぜ、誰がそれ

    排他的なボーナスコンテンツ:私たちの無料のデータ整合性チェックリストをダウンロードデータ収集と分析の整合性を確保する

    透明性とデータ駆動型ビジネスソリューション

    統計データが悪用される可能性があることは明らかですが、デジタルの世界 ビッグデータは、効率性と透明性、そして最終的には収益性のためのロードマップをデジタル時代の企業に提供する能力を持っています。 オンラインレポートソフトウェアのような高度な技術ソリューションは、統計データモデルを強化し、彼らの競争上のステップアップをデジタル時代の企業に提供することができます。

    市場インテリジェンス、顧客体験やビジネスレポートのためかどうか、データの未来は今です。 責任を持って、倫理的かつ視覚的にデータを適用し、透明な企業アイデンティティの成長を見守るように注意してください。

コメントを残す

メールアドレスが公開されることはありません。