頻度確率による論理的な判断は一流の数学者でも間違えることがある？｜馬場正博の「ご隠居の視点」【寄稿】

TAG : Garbage in Big “X” Out | 横丁のご隠居
AUTHOR : ギックス
POSTED : 2014.09.04 09:07

1 モンティホール問題

モンティホール問題

前回の「ウェイソンテスト」は直観の方が論理より正しい答えを速く導き出すというちょっと不思議な例でした。しかし、直観より論理の方が、より正しい答えを出すというのは一般的には事実です。問題はダニエル・カーニマンが「ファスト＆スロー」でシステム1、システム2と分けた判断の仕組みで、システム2を使う論理をベースにした判断は遅いため、すべてを論理分析に従って行動すると、時間がかかり過ぎて日常生活が不可能になってしまうということです。ところが、論理的な判断が常に正しいとは限りません。直観と論理と二つに分けても、実際にはどのような論理分析をするかは直観に大きく依存しています。頭が良くて数学が得意な人はどのように解を導き出すかを他の人より速く直観的に見つけ出します。今回は論理を導き出す直観が一流の数学者でも正しくない場合があるという話です。

「3つのドアがあり、そのうち1つのドアの後ろには新車が、2つのドアの後ろにはヤギがいます。あなたからは、ドア向こうが何かわかりませんが、新車の隠れているドアを開けると新車がもらえます。ヤギの隠れているドアを開けても何ももらえません。あなたが1つのドアを選んだ後、ドアの後ろに何があるかを知っている司会者が残りの2つのドアのうちヤギがいる方のドアを開けました。そして、今あなたは自分が選んだドアと、まだ開けられていないドアを交換しても良いと言われます。あなたは交換すべきでしょうか。」多くの「2つのドアが開けられていないので、ヤギか新車かはどちらのドアも50％づつ」だから「変えない」と考えます。ところが、直感的には正しそうなこの答は間違いです。残っている方のドアの後ろに新車がある確率は50％ではなく、3分の2、約66.7％なのです。この問題はLet’s Make a Dealというアメリカのテレビ番組が元になっていて、番組の司会者のモンティ・ホールの名前をとってモンティ・ホール問題（Monty Hall Problem）と呼ばれています。TV番組では司会者のモンティホールがドアを開けてゲームの参加者にドアを取り換えるかどうかの決断を迫ります。

1万通を超える納得いかないと言う投書

話が有名になったのは、パレードマガジン誌のコラムニストのマリリン・ヴォン・サヴァントが1990年9月9日号で読者からの質問に答えたことに始まります。サヴァントはドアを変えれば新車がもらえる確率は3分の1から3分の2に高まると言ったのですが、納得できない読者から一万通にもおよぶ投書を受ける羽目になります。反論を寄せた人には一般の人だけでなく、大学教授や確率論の専門家もいました。その中には20世紀最大の数学者の一人と呼ばれるエルディッシュもいました。

モンティホール問題はいくつかの解き方がありますが、次のように考えてみます。

3枚のドアを2つのグループA、Bに分け、Aは1枚、Bには2枚のドアを割り当てる。
最初に自分が選んだグループをAグループとし、残りをBグループとする。するとAグループのドアの後ろに車がある確率は1/3、Bグループのいずれかのドアの後ろに車がある確率は2/3.になる。
Bグループの1枚のドア開けてもAグループ、Bグループの中に車がある確率は1/3、2/3で変わらない。ゆえに、Bグループの残りのドアの後ろに車がある確率は2/3となる。

まだ、納得できないと思う方はAグループに1枚、Bグループに99枚のドアを割り当て、Bグループの98枚のドアを開けた後、ドアを交換した方が良いか考えてみると良いかもしれません。この場合のAグループの1枚のドアの後ろに車がある確率は1％、Bグループの最後の1枚のドアの後ろに車がある確率は99％になります。

サイコロの目が出る確率は1/6だけではない?

モンティホール問題が大きな注目を浴びたのは、（数学者を含む）ほとんどの人の直観と正解がひどく違っているからです。なぜなのでしょうか。一つ考えられるのは私たちが確率とはサイコロを振るようなものだと考えていることがあります。サイコロは正しく作られていればどの目の出る確率は同じです。それはサイコロはそのように作られているから当然です。つまり「サイコロは正しく作られている」という原因がわかっていれば「どの目も同じ確率で出る」という結果が予測できます。確率とは原因の構造が理解できれば結果を予測する道具と考えてもよいでしょう。そして、サイコロの目が等しく出る確率は、それまでサイコロを何回振っても変わりません。例えば、1の目が3回続いても次に1の目が出る確率は1/6のままです。

そのようにモンティホール問題を考えると、ドアの後ろに車がある確率は1/3でこれは不変のように思えます。実際に、ドアを開けたのが司会者のモンティホールではなく、会場に乱入してきた子供だったら、そこにヤギがいてもドアの後ろに車がある確率は変わりません。正確に言えば、選ばれたドアと残ったドアの後ろに車ある確率は等しい。つまりどちらも1/2です。モンティホール問題のキモは「どこに車があるかを知っている司会者が、必ず車のないドアを開ける」という点にあります。そのため、サイコロを振った時の目を予測するような確率とは違った確率の考えを必要とさせているのです。モンティホール問題で扱っている確率は原因から結果を予測するのではなく、今ある一定の条件から原因を予測する確率です。結果から原因を予測すると言っても良いでしょう。これを「条件付き確率」、一般的にはこのような確率を定義したイギリスの数学者トーマス・ベイズの名を取ってベイズ確率と呼びます。

頻度確率に慣れると理解が気持ち悪いベイズ確率

ベイズ理論の応用の一つにスパムメールの除去があります。スパムメールは当初「無料」「セックス」といったスパムに特徴的なキーワードを登録することで除去する方法が使われたのですが、この方法ではスパムでないメールをスパムとしてしまうことは避けられませんし、「f＊ck」のように一部の文字を変更する方法には、なかなか対抗できません。これに対し、ベイズ理論を使うスパムフィルターでは、スパムメールとなるかどうかを、ある特長（例えば「無料」という言葉を含むかどうか）を持つものがスパムとして報告されると、「無料」という語が含まれるという条件下ではスパムメールである確率は高くなるように作られています。もちろん「無料」すなわちスパムではないため、他の語やメールの形式などと組み合わせて、全体としてスパムである確率を判断します。このような作り方であれば、先ほどの「f*ck」のような語があれば、スパムメールである確率かえって高いことが一定の学習を積むことでわかります。ベイズ確率を応用することで学習するプログラムを作れるのです。

ベイズ確率の別の応用でグーグルの検索エンジンの辞書があります。グーグルの検索窓に何か語を入れると次に続く検索語の候補を挙げられます。つまり、最初に入力した検索語という条件の下で次に続く検索語を予測してくれるわけです。これは入力された語、例えば「じょうほう」に対し「情報、上方、乗法・・」と候補を挙げていくATOKのような仮名漢変換のソフトウェアとは全く違うものです。グーグルの検索では「情報」と入れると「情報の故買、情報処理、情報検索・・」のように入力した語の次に入れる候補がいくつも出てきます。グーグルの検索はこのような推論を１文字入れただけで開始します。そしてグーグルの辞書は莫大な検索語入力を取り込みながら、どんどん成長していきます。正直これではATOKは適いません。

論理にも先入観という敵がいる

ベイズ確率は従来のように最初から客観的に確率が決められるのではなく、どのような出発点つまり「主観確率」からでも学習を通じて、より精度の高い確率の推論を行います。別の言い方をすると結果から原因を予測するものです。これが、サイコロの目を予測するような確率（これを頻度確率と呼びます）に慣れた人たち（数学者を含め！）の直観が誤ってしまった理由だと思われます。論理にも先入観という敵がいるのです。

（本記事は「ビジネスのための雑学知ったかぶり」を加筆、修正したものです。）

馬場正博（ばば　まさひろ）

経営コンサルティング会社代表取締役、医療法人ジェネラルマネージャー。某大手外資メーカーでシステム信頼性設計や、製品技術戦略の策定、未来予測などを行った後、IT開発会社でITおよびビジネスコンサルティングを行い、独立。