統計のマジック(曖昧さの恐怖)

『これは多くの人に気に入られている商品です。』
『これは使用者の大半の人が評価した商品です。』

テレビや新聞、プレゼンでこれを聞いてどう思いますか?
「へぇー」と思う人もいれば、「多くの人に、とか、大半って曖昧だなぁ」と思う人もいると思います。

では、次はどうでしょう?

『この商品を使った人にアンケートを取ったところ、66%の人が良い評価をしました。』
『街角で100人に調査した結果、好きな野球チーム1位はジャイアンツでした。』

少し信憑性は高まったでしょうか?

ですが、ここには統計結果を良くも悪くも使える罠が潜んでいます。

調査を行った対象者 は何人でしょう?アンケートの 有効な回答をした人が3人 だったら、2人が良いと言えば66% が良いと言ったことになります。
調査した街角はどこだったでしょう?札幌、広島、博多、東京、千葉、大阪のどこでも同じ結果だったでしょうか?札幌だったらファイターズが1位でしょう。
また、調査した日時はいつだったでしょう?2016年と2006年でも同じ結果だったでしょうか?

では「3000人に対して調査した結果、66% が良い」と言った場合と信頼性はどう違うでしょう?
では「2016年11月時点で全国の都道府県庁所在地で各100人に対して調査した結果、1位はジャイアンツ」と言った場合と信憑性はどう違うでしょう?

人の行動や興味、評価、流行、平均数量等を数値で知るために統計情報を使用するには、
その情報が本当に使えるものかを判断してください。

なぜ(どういう意図で作られた?)、だれが(公正な機関か?)、いつ(確認したい時期か?)、
どこで(確認したい人・地域・年齢・性別等の範囲か?)、何を(調査対象は適正か?曖昧でないか?)、どのくらい(調査対象者数は?)
といったようにです。

ビッグデータ時代になった現在。ありとあらゆる情報がデータ化されて、統計情報は作りやすくなりましたが、
標本(サンプリング)の仕方を間違えると、間違った統計結果を導き、統計結果に従った次の行動が誤った行動につながる可能性があります。
それを逆手に取れば、悪質な業者は信憑性の低い統計結果を利用して商売をしているかもしれません。

統計情報は、老若男女だれもが信じやすく、調査次第では正確にも曖昧にもできる魔法のような情報です。使い方には気をつけましょう。

タイトルとURLをコピーしました