最適に買い物するのはNP困難?

一部の計算機科学者に言わせると経済学の市場の理論は使えないということらしい。なぜかというと、そもそも消費者の効用最大化問題さえNP困難ということ。コンピュータにも大変な計算が何で人間に出来るだろうかというわけだ。

しかし経済学者からすると、そのような見方はモデルを文字通りに解釈しすぎているように感じる。計算機科学者がNP困難というとき、それはもちろん最悪のケース*1を考えているわけだが、実際に消費者が解いている問題は結構簡単な問題かもしれないではないか。

もっと経済学っぽく計算複雑性にアプローチすることはできないだろうか?一つのやり方はいわゆる顕示選好理論と計算の複雑性を組みあわせることだ。

経済学者はしばしば次のような問いの立てかたをする。

さまざまな価格が与えられたときにある消費者がどのように消費するかという有限のデータが与えられたとしよう。このデータが消費者の効用最大化問題の結果になっているとみなせるような効用関数は存在するだろうか?

この問いにはAfriatによるよく知られた答えがある。データがある条件(GARP)を満たすかどうかが、消費者の行動が効用最大化とみなせるかどうかの必要十分条件になっているのである。しかも、GARPが満たされているときはデータを合理化する=最適化の解として説明する効用関数として非常に便利な選好(凸で単調)を見つけることが出来る。*2

さて、ここに計算の複雑性を追加的な条件として加えてみよう。すると問いはつぎのようになる。

さまざまな価格が与えられたときにある消費者がどのように消費するかという有限のデータが与えられたとしよう。このデータが消費者の効率的に計算可能な効用最大化問題の結果になっているとみなせるような効用関数は存在するだろうか?

つまりすべての可能な効用関数を考えるのではなく、データを説明するような効用関数のなかで計算量の観点から便利なものはあるかと聞くわけだ。するともちろん答えはAfriatの定理より、GARPが満たされる限り然りということになる。凸最適化問題の解は効率的に計算可能であるからだ。別の言い方をすれば、計算複雑性は顕示選好理論に関して制約として効いていないということになる。どのようなデータが与えられても、必ずそれが効用最大化と整合的でないかさもなくば効率的に計算可能な凸最適化問題(=効用最大化問題)の解として解釈できるかのどちらかになるのである。

......というCalTechの計算機科学者と経済学者の共著の論文*3の発表を、エンジニアと計算機科学者と経済学者を集めた会議で聞いてきたんだけど、これはなかなか面白かった。次に熱いのはCS/Econの境界領域かもね。

*1:効用関数が複雑な場合。

*2:正確には効用関数が有限個のアフィン関数のLower Envelopeになっているので、さらにシンプルである。

*3:"A Revealed Preferenced Approach to Computational Complexity in Economics," Echenique, Golovin and Weirman 2010.

 左利きであることは大統領になることよりリスキーか?


統計学とは何か ―偶然を生かす (ちくま学芸文庫)

統計学とは何か ―偶然を生かす (ちくま学芸文庫)


こことかここによると、独身の人は10年早く死ぬという話らしい。大統領になると5年早く死ぬということなので、独身は大統領になることよりリスキーなわけだ。統計学者ラオの「統計学とは何か」に出てくるこの話はよく聞く話なのでそれほど驚くこともないのだが、驚いたのは独身の次に寿命を縮める要因だ。ラオの同じ表によると、左利きの人は平均して9年(3250日)も早く死ぬということらしい。だから、左利きであることは大統領になることよりもリスキーということになる。


この表を見たときの第一印象は「これは統計の解釈以前の間違いに違いない」だった。最初に疑ったのは翻訳だ。ところが原著”Statistics and Truth: Putting Chance to Work”の該当部分をGoogle Booksで検索してみると、確かに「左利き」は表の中に入っていて3250日寿命が縮まることになっている(P.166)。 *1

http://books.google.com/books?hl=en&lr=&id=jqWd4oe3iwIC&oi=fnd&pg=PA1&dq=statistics+and+truth+putting+chance+to+work+&ots=Xg-1gHipHB&sig=jaQ3kf_iLLV8-JNei9C1QY6O9qc#v=snippet&q=left%20handed&f=false


そこでこんどは、ラオが表を作るのに使ったとしている元論文Cohen and Lee*2をチェックしてみた。するとそのまとめの表には、左利きのことは一言も出てきていない!その一方、左利き以外の要因については項目も数値も完全に一致している。これはどうやらラオさんが左利きの項目をうっかり付け加えてしまったということのようだ。


しかし火のないところには...ということはあるし、3250日という数値も勘違いというにはあまりに具体的すぎる。この話には何か元ネタがあるはずだ、と思って探してみると、Coren and Halpern*3という論文を見つけた。この中の一番極端な結果によれば「左利きは9年早死にする」ということらしい。どうやらここがネタ元のようだ。


この結果は次のような調査に基づいている: 最近死亡した人の内から3000人ほどのサンプルをランダムに抽出し、最も近い家族や親戚から亡くなった当人の利き腕のアンケートをとり、返事があったおよそ1000のサンプルから利き手(と性別)ごとに「平均死亡年齢」を計算するというものだ。それによると右利きの人は平均して9年短命で、しかもこの効果は男性の場合にはるかに大きいという。


この論文はよく引用されているようだが、しかし結果はかなり怪しいように見える。この「平均死亡年齢」の計算がよくわからないというのもあるが(例えば人口の変動を考慮に入れていない)、それ以前に年寄りの世代は左利きであることをカミングアウトしたくないからアンケートに返事をしなかったんじゃないかという疑いがある。昔は左利きは縁起が悪く、差別の対象になっていたのだから。

*1:ただし、自然放射で寿命が11日縮まるというのは8日縮まるの誤訳であることがわかる。

*2:A Catalog of risk, Health Physics 1979.

*3:Left-handedness: A marker for decreased survival fitness, Psychological Bulletin 1991.

 経済学のモデルが現実的であるとはどういうことか?

"...a good model in game theory has to be realistic in the sense that it provivdes a perception of real life social phenomena...These (relevant factors) need not necessarily represent the physical rule of the world." A. Rubinstein 1991


最近目にした論文にだいたいこんな感じのことが書いてあった:経済学者はしばしば数学的に便利だから無限の数の消費者の存在するモデルを考えるが、より現実的なモデルは有限の数の消費者が存在するモデルである。前者のようなモデルは、消費者の人数が十分大きいときに後者のモデルの近似として考えられる限りにおいて有用である、と。


世界には有限の数の人間しかいないことは小学生でも知っている。その意味で有限の消費者のモデルは無限の消費者のモデルより現実的である。無限のモデルは有限のモデルの近似であるという考えも、物理でいえばたとえば流体力学などの例を考えればしっくりくるだろう。


しかし、その論文はこう続ける。経済には有限の数のアクターしか存在しないので、一人一人の消費者の行動は市場価格にインパクトを与える。で、著者たちは、一人一人の消費者が自分たちが市場価格に与える影響を正確に予測して意思決定する、と仮定するのだ(しかもこの仮定は論文の結論に決定的に影響を与えている!)。この仮定はきつい。*1このような個人に超人的な計算/予測能力を要求する仮定をするぐらいなら、無限の消費者がいて(だから)消費者は自分の行動が市場価格に影響を与えないと信じているモデルのほうがまだましなのだ*2


ここには少なくとも二つの教訓がある。一つは、ある現実的な仮定を持ち込んだときに同時に非現実的な仮定を持ち込む可能性があること。そしてより重要なのは、現実を物理的に近似するだけではよい経済のモデルにならないということ。より「現実的な」モデルは、ひとの認知能力や信念(belief)なども近似しているモデルなのである。

*1:価格に大きなインパクトを与えることのできるアクター、たとえば企業、あるいは最近の例では潤沢な資金を動かせるトレーダーなどはこの限りではない。

*2:有限の消費者がいて、一個人に価格は動かせないと信じられているモデルにすればいい気もするが。

 自然実験による経済学の革命


以下はあのAngrist and PischkeのJEP論文の超おおざっぱなまとめ。読みやすさを重視するため本文に足したり引いたりしているところが多々あるとお断りしておきます。

(追記:Regression discontinuity designの例を足しておきます。)


リーマー批判

80年代にAERに掲載されたエド・リーマーによる有名な実証経済学批判がある。彼の批判は、多くの実証的な結論がちょっと仮定を変えるだけでひっくり返ることに向けられていた。*1もっと下世話な言いかたをすれば、実証する学者が自分のほしい結論が出るまで仮定やモデルをいじくり続けるので得られた結果は当然不安定になるということだろう。

この問題は、経済学における実証が純粋な実験によるものではないということに端を発している。たとえば、最低賃金を上げたときの雇用への効果を測定したいとしてみよう。通常の科学的手続きからすれば、まず被験者をランダムに実験群と対照群にわけることを考えるのが普通だろう。ここでいえばそれは人々をランダムに最低賃金の異なるグループに割り振るということになる。もちろんこのような社会的実験を行うことはあまり現実的ではない。だから実証をする経済学者は、このような実験を行うかわりに出来合いのデータを使わなければならない。すると、たとえば州による最低賃金の違いと雇用の関係を調べるとかいうことになる。しかしそうすると最低賃金の雇用への影響は(少なくとも)次のような2つの理由により曖昧になる:(1)異なる州の間には最低賃金以外にもいろいろと(コントロールされていない)違いがある(Omitted variable bias)、(2)雇用の状況が逆に最低賃金に影響を与えているかもしれない(Reverse causality)。このような曖昧さは、実証する側に偽の相関を発見する(ふりをする)余地を与えてしまう。*2

実証の研究をより信頼できるものにするにはどうするべきだろうか?リーマーは、結果の安定性を論文のなかできちんと吟味することを提案した。具体的には、いろいろなモデルやサンプルのとり方を試してみて、出てきた結果をすべて報告するということだ。*3しかし、この提案は部分的にしか学会で受け入れられることはなかった。


リサーチデザイン革命

うれしいことに現在の実証研究の信頼性は30年前にくらべて著しく回復した。しかしそれはリーマーの提案が受け入れられたからではない。この革命の担い手はより洗練されたリサーチデザインである

この洗練されたリサーチデザインの中核にあるのは「自然実験」(Natural Experiment)のアイデアだ。*4ある効果を測定するのに理想的なのは純粋な社会実験だが、前にも述べたようにそのような実験を行うのは難しい。*5そこで現代のリサーチデザインを重視する研究者は、現実の中の歴史の偶然のようなものを利用する。厳密な意味での実験は不可能でも、なるべくそれに近いような状況をみつけてくるのだ。

ひとつ有名な(操作変数の)例を挙げてみよう。Angristには徴兵が長期的に収入に与える影響を調べた有名な研究がある(AER,1990)。単純に考えれば、収入を(いろいろな共変数を考慮に入れた上で)徴兵の時期と期間などに回帰すればそれでいいと思うかもしれない。しかしこれでは上で述べたようなバイアスを回避できない。なぜなら、収入を十分見込めないような人たちが率先して徴兵に志願する可能性があるからだ。この場合、徴兵の経験自体が賃金を下げているのではないとしても賃金の低さと徴兵の経験に相関が生まれてしまう。徴兵の賃金への真の影響を測るには、人々をランダムに徴兵しなくてはいけない。Angristはこの理想的な実験に近いような状況を見つけてきてうまく利用した。べトナム戦争の徴兵にはある時期くじが使われていたのだ。一年365日をランダムに引いてきて、その日が誕生日である人が徴兵されるというシステムだ。*6,*7この場合さすがに上で述べたようなバイアスが入り込む余地はないと考えられる。*8ちなみに推定の結果によると、徴兵された若者の10数年後の収入はそうでない人に比べて平均して15%低かったそうだ。*9

もうひとつ今度はRegression discontinuity design*10の例を紹介してみよう。学級のサイズの子供の教育へ与える影響を測ってみたいとしてみる。単純な(古い)アプローチでは、適当に関係のありそうな変数を放り込んで統計ソフトで回帰分析のキーを押すだけというということになる。しかし学級のサイズはいろいろな要因によって影響される - たとえば過疎地では生徒の数は少ない - からそのような方法で得られた結果は信用できない。Angrist and Lavy(QJE, 1999)は、あるイスラエルのデータに着目した。イスラエルでは一クラスあたりの生徒数が40人を超えることができない。たとえば39人の生徒は一クラスにいれられるが、たまたま41人の生徒がいる場合20人と21人のクラスに分けられる。つまり人数がたまたまちょっと40人を上回るか下回るかでクラスの大きさががくんと変わるので、小さいクラスに割り振られた生徒達と大きいクラスに割り振られた生徒たちはそれ以外の部分では統計的に似たような生徒たちであると考えることができる。AngristとLavyはこれをある種の実験と解釈するのだ。彼らの推定からはクラスが大きくなるとかなりの負の学習効果が生まれるということがわかったが、上のような素朴な回帰分析ではこれほどきれいな結果は出なかったかもしれない。

今ではリサーチデザイン革命は応用ミクロ経済学一般(労働、開発経済学など)を席捲したといえる。その一方、マクロ経済学と産業組織論にはいまだ十分に浸透していない。しかし最近はこれらの分野でリサーチデザインを活用した優れた論文が出てきている。将来的にはリサーチデザインを重視した研究が増えることが望まれる。


リサーチデザイン革命は行き過ぎたか?

最近、リサーチデザイン革命は行き過ぎだという声がよく聞かれる。この反革命的な反応は二つに分けられる。ひとつはExternal Validityの問題。つまり、自然実験(あるいは純粋の社会実験)で得られた結果が他の状況にそのまま適用できるかどうかは怪しい、という疑いである。まず一ついえるのは、これはあらゆる実証的な結論に対して向けられる一般的過ぎる疑念だということだ。それはさておくとしても、自然実験に基づく研究ではいくつかの重要な問題について同様の結果が繰り返し得られていることを忘れてはならない。さまざまな状況で追試をして同一の結果を確認することは、この問題へのもっとも望ましい対処の仕方である。

もうひとつよく口にされる不満は、うまい自然実験を見つけられるようなトピックに研究のバイアスがかかるので、本当に大事な問題から研究者の目がそらされてしまうという問題だ。しかしこの批判はまったく妥当しない。えてしてこの類の批判は、特定の実験における文脈の狭さを問題自体の非重要性とつなげてしまうことからくる勘違いである。非常に特殊な実験でもそれが対象とする問題は経済学的に重要なものであり、そのような小さな実験が蓄積されることからくる一般的な問題への洞察を過小評価するべきではない。*11


まとめ

経済学における実証研究の信頼性は近年著しく改善された。その主な理由は、研究者がリサーチ・デザインにより注意を払うようになったためである。

*1:Ehrlichによる死刑制度による殺人抑止の研究を思い出してほしい。

*2:純粋な実験では、(1)の問題はランダマイゼーションによって解消されるし(2)の可能性は定義上ありえない。

*3:その結果得られるものは、パラメーターの推定値よりも、パラメーターの「信頼区間」のようなものであろう。

*4:より一般的にはQuasi-experimental methodと呼ばれる。典型的な手法は、操作変数法、regression discontinuity design, そしてdifferences-in-differences designである。

*5:最近では実際に社会実験をするケースが増えてきているが。

*6:このくじ引きはテレビで放映された。

*7:正確にはまず日にちがくじによって順序付けされ、あとで必要な人数に対応するだけの誕生日が順に選ばれた。

*8:これは操作変数法の一種。操作変数に選ばれるのは説明変数(徴兵)と相関しているが、説明変数を通さずに被説明変数(収入)と相関していない変数である。ここではくじが操作変数の役割を果たしていると考えることができる。

*9:この結果のひとつの解釈としては、徴兵中に自分へ投資できなかったということが考えられる。

*10:日本語でなんていうか知らない......

*11:ここでも追試が大事な役割を果たしている。

 経済学を王座から引きずり下ろせ!


経済学を王座から引きずり下ろせ!  JBpress(日本ビジネスプレス)


治せない病気があるから近代医学を否定しましょうみたいなロジックで否定されてもね。*1
もっとましなものがあれば、喜んで下りるのだけど。
というか、そもそも日本では王座についてないんだっけ。

*1:誤解を招かないように付け加えれば、経済学の信頼性は近代医学にはるかに及びませんが。

 茶の世界史

茶の世界史―緑茶の文化と紅茶の社会 (中公新書 (596))

茶の世界史―緑茶の文化と紅茶の社会 (中公新書 (596))

 

しかしここでふりかえってみると、中国をルーツとし、いわゆる照葉樹林帯の代表的植物であり文化であった茶が、ユーラシア大陸の西の端に位置するイギリスにおいて、たんなるくすりや珍貴な飲料としてではなく、国民の生活必需品として根を下ろしたということは、歴史の奇妙というべきであろう。


文化としての茶と、商品としての茶の歴史をたどった本。歴史ではしばしばそうであるように、茶の歴史をさかのぼると、そこには現代からは想像もしないような風景を見つけることができる。たとえば次のような「常識」を聞いて、あなたはどう思うだろうか?

  • 茶は中国からヨーロッパに伝わった。
  • ヨーロッパで最初に茶を飲んだのはイギリスである。
  • イギリスでは初めから紅茶がよく飲まれていた。
  • かつて日本の主要輸出産品であった茶は、主に東アジアに輸出されていた。


これらはすべて間違いである。ヨーロッパに茶が伝わったのは日本の緑茶がオランダに持ち帰られたのが最初だし、イギリス(のみならずヨーロッパ)では初めは緑茶が主に飲まれていたし、日本の緑茶の最大の輸出相手はアメリカであった(で、ミルクと砂糖を入れて飲むのである)。

 日本人の平均寿命が下がる


平均寿命を計算するときは、直近のデータ、具体的には前年のデータのみを使う。たとえば、62歳の人の死亡率は、その前の年に亡くなった62歳の人の割合で代替される。そのため、平均寿命は一時的なショックの影響を大きく受ける。


で、これがどうしたかというと、日本人の平均寿命が久しぶりに下がるんじゃないかと思うのだ。もちろん、昨今の非実在高齢者問題のあおりを受けて、である。


今まで出てきた数字を見ていると、その影響はあまりたいしたことがないという見方の方が普通かもしれない。しかし、今年から来年へと新しく死亡したとみなされる人が増えるのはもちろんだが(ただそれがどうカウントされるかわからない)、それに加えて、この騒動のため従来なら死亡届けを出していなかった世帯がより正直に申告する可能性があることを忘れてはいけない。だから、新聞上に現れている数字だけを見ているだけではよく分からないんじゃないかと思う。