データサイエンティストとビッグデータ [世間話]

はい、お久しぶりです。

えーまぁ色々とありまして人生プランをかなり変更する事になりました。

色々と決まったらちゃんと報告をしたいと思います。


で、まぁプランが変更になったので当然必要な知識も変更になり、ここ数日は日本でデータ分析とかがどんな感じで使われてるのかなぁという事について調べていました。

2年くらい前から結構ビッグデータという単語を聞いたり、それに付随してデータサイエンティストなんか聞いたりします。
それらが具体的に指してる意味って何よ?とか、それ使って何が出来るのよ?とか、どうやってやるのよ?って事を今日は書いて行きます。


データサイエンティストから。
早い話このスライドを見れば良いかと。
http://www.slideshare.net/shoheihido/120913-pfi-dist

ぱっと調べたイメージでは、
「データを分析して何らかの関連だったりパラメーターだったりを推定して、それを使って業務を改善して行ける人。」
といった所でしょうか?

研究者との大きな違いは、「見つけて報告して終了!」ではなくて実際に見つけたものから業務を改善して利益を高める所まで求められているという所でしょう。

気になった点は、どのような手法を使って解析業務をこなしているのか?です。
例えば僕みたいに回帰分析とそれを発展させた手法でゴリゴリ仮説を検証するタイプの人って結構いるんでしょうか?
それとも自然科学系でアルゴリズムとかデータマイニングを勉強してきて、データの中から関連性を見つけてくる様な人ばかりなんでしょうか?
新しい関連性とか事実を見つけてくるには後者のほうが圧倒的に有利なのは否めないでしょう。
ただ、その場合だと見つけてきた関連性に理由をつけるのが難しいのではないかな?と。そういった点では前者のほうにもある程度のメリットがありそう。


あと気になっている点は、「プログラミングのスキルってどのくらい持ってるのかな?」って事。
例えばリコメンドサービスをやりたいとして、アソシエイト分析とかで一緒に買われている商品のセットを発見できるのはわかってると。
じゃぁ片方の商品を今見ている人にもう片方を推奨するようなシステムを実装するのって誰なんでしょ?エンジニアさんなんですかね?それともデータサイエンティストなんですかね?



ビッグデータって何よ?ってお話。
ん〜サンプル数と変数の多いデータセットって所なんじゃないですかね?
ただ、データセットが大きいためにデータの処理が重くなってしまうのが難点っぽいです。
hadoopが注目される理由はおそらくそういった重い処理を分散処理で効率的にこなせる様にできるからなんでしょう。
ちょっとまだ理解できていない点は、結局分析はローカルでやるのか?それともオンラインで(hadoop上で)やるのか?って所。
オンライン上で行う場合には何かしら特別なソフトウェアを用いてるんでしょうか?
mahoutでアソシエーション分析とか協調フィルタリングとか出来るみたいですけど他はどーなんでしょ?


ちなみにhadoopについてはこの2つがとてもわかり易かったです。
http://www.ustream.tv/recorded/17517378
http://www.ustream.tv/recorded/28690598



nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:学問

深く深く [世間話]

むかーしむかし、僕が真面目にフェンシングをやっていた頃、これで何かを掴みたいと思っていた。

何かって何かと言うと、多分生きる土台みたいな物だったのかもしれない。

その為には結果が必要だという事を理解していたし、それなりの結果も持っていた。

でも、次第に努力が怠る様になり、真面目にフェンシングに向き合わなくなり結局は引退する事になる。

最後の3年間、勝てない事を理解しながら練習するのは本当に苦痛だった。

で、そこで理解した物というのは、進めば進む程それに深くのめり込めないといけないという事だった。

勝てば勝つ程、練習の質と量を増やして行き、四六時中それについて考えなければそれ以上勝てない。

君が得意な物で生きようとしたら、それをもっと得意にならないといけない。

コストが低いからと言う理由ではやっていけないのだ。



そして今も同じ事を味わっている。

自分の興味を追えば、僕はもっとそれについて考え、のめり込んで、もっと深い所へと入って行かないといけない。

思考の質を上げないといけないし、量も増やさなくちゃならない。

その為にはインプットの量も質も無くてはならない。

もしそれを怠れば、僕はフェンシングで味わった事と同じ事をもう1回味わう事になる。







とまぁこんな事を書くのにはきっかけがある訳なんですが、

今3つ大きな問題を抱えてまして、それらを1ヶ月くらいの期間で並列的に解決しないといけないんですね。

1. Dynamic Econometrics
2. Time Series Analysis
3. Optimal Control Theory

まぁこの3つなんですよ。
元々選択と集中が得意で、有り余る時間的資源を集中させて問題を一つ一つ解決してここまで来てる人間なので、やっぱり選択と集中なのかな?って思ってたんです。

けれども、この3つのトピックは全部時間軸を扱う話で、結局関連性があるみたいなんですね。

時間って言う次元の中にこの3つのトピックがあって、それらが地続きになっているのが見えたら多分理解が盤石な物になるという仮定が頭にあって、その絵をみたいわけなんですが。。。

難しいw

いつもの方法だと、取り敢えずどれか決め打ちしてそこを集中してやってみて、そこを軸にして他の分野の理解をして行くというパターンなんですが。

う〜ん。多分今回はそれじゃ駄目なんじゃないかな?と。勘ですけどw

nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:学問

having a dynamics in static circumstances or maybe having a static condition in dynamic circumstances [世間話]

えっとね。だらだら思ってる事書いてるだけなので、特に読んでも楽しくないと思います。あしからず



何かに願書を出すとき、必ずwhyを突き詰めなければならない。

why?

なんで僕は経済学を好きなんだろう?

考えると自然とその問いはwhyからwhatへと移る。

経済学の何がそんなに面白いのだろう?

そしてその答えを僕はdynamicsにある事を見つける。

すると新たにwhyがまた出てくる。

多分何かの願書ではこのレベルの事に答える必要性は無いのだと思う。

けど、ちょっとした手がかりがあるかもしれないから考えてみた。


静的(static)とか動的(dynamic)とかって言葉を知る前から現実はdynamicな物だと思っていた。

周りを観る時には、現状ではなくて時間で変化した事を観るべきだと知っていた。

けれども、その考えを開けてみる相手がいなかったし多分同意も得られなかったと思う。

物事の捉え方に関して誰かに話を聞いてみても、大体は言葉遊びで自己矛盾を程度と価値観の違いで逃げる物ばかりだった。

初歩的な経済学と出会って理解したとき(単純なマクロモデルを理解するのに1年掛かったけどw)、モデルには逃げ場が無いという事と、そのモデルがデザインされた意図を達成していれば逃げる必要なんか無いという事を理解した。

ケイジアンモデルは国の経済の状況をシンプルに分析して、不況時にどうするか?とか、消費や投資や政府の予算がどのような影響を国の経済に与えるかと言う問いに良く答えることができた。

ただ、そのモデルは会計的な物に近く、最初のモデルということもあってstaticだった。

けどここにdynamicなモデルを知りたいと言う欲求があったかと言われると。。。どーなんだろ。


そしてアメリカへ交換留学した時に始めて経済成長モデルを習った。

でも、そのモデルの目的はsteady stateを見つける事であって、dynamicな流れの中にある一定の条件を持ったstaticな点を見つける事が目的だった。

あぁでも今思い返してみればdynamic equilibriumを扱ったのはこれが最初だったのかもしれない。

で、アメリカから帰って数ヶ月した所で福岡伸一の「生物と無生物の間」を読んだ。

多分今の興味はこの本に出会った事によって形成されている。

魚とかbioeconomic modelingとかに興味があるのは間違いなくこの本を読んだからだろう。

色々な事が書いてあったのだけれども、この本の中で二つの事に心を奪われたと思う。

1つは動的平行(dynamic equilibrium)のお話。生命は常に体を作っては自分で壊す事によって自身を保っているというのがその内容だったかと。
自分の体が動的に流れているのに、自分の存在は維持され続けている。その話がとても面白かった。

もう一つは鴨長明の方丈記の話。
方丈記の冒頭に
「ゆく河の流れは絶えずして、しかももとの水にあらず。
 よどみに浮かぶうたかたは、かつ消えかつ結びて、久しくとどまりたるためしなし。
 世の中にある人とすみかと、またかくのごとし。 」
とあり、鴨長明が如何に生命の本質を捉えていたかという事が書かれていた。

完全に妄想なのだけれども、鴨長明はこの世の本質が動的な物であると考えたのだけれども、
この時代にはモデリングなんて物は存在しなかったので、このような言葉で書き記したのだと思う。

同じ時期に落語の中で「急水不流月」というこれもまた動的な平衡を表す禅の言葉を聞いた。
川の流れは急であるが、そこに移る月は流れる事は無い。
という言葉で、「移り変わる環境や世の中でも、自分の意志は流れずにいたいね」といった意味だったと思う。

これらの話は僕の頭の中に「時として詩人や作家が理論的な本質をその才覚のみによって見つけ出す事がある」という事を焼き付けた。
そして、頭の中にメッセージを強く焼き付けるという点において言葉はモデルを遥かに凌ぐ威力がある事を学んだ。

落語を飽きずに聞いているのはこういった経験があるからなのかも。



まぁ古典とか落語とかにハマってる一方で衝撃的な記事を読んだ。
http://cruel.org/krugman/evolutej.html
ポールクルーグマンが進化理論と経済学について話している物の邦訳。

正直言って記事の意味の半分も理解していなかったと思う。
多分今でも8割くらいの理解だと思う。(読み直してないけどw)

けれども、僕に取って大事なメッセージは進化論と経済学のモデルはとても似通っていて、ある場面に置いては同じだと言えるという事だった。(もし遺伝子の目的がその複製の数を最大化させる事だったとするなら、そのモデルは経済学における効用最大化と指して変わりのない物になるだろうという事)

この記事は「時にモデルは一般性を持っていて、分野間の共通性を明らかにしてくれる」という大事な事を教えてくれた。そしてその一般性を見つける事がとても楽しいという事も。



別に言葉もモデルも卓越して上手ではないけれども、両方上手に使えたら如何に楽しいだろうかと考えるとわくわくするね。
多分経済学を、特にモデルに拘って勉強する理由と、ブログを続ける理由ってここにあるんだろうね。

then why?
the answer is... just because of the shape of my utility function.
nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:学問

明日。 [世間話]

明日の午後の便で日本へ帰ります。

3週間程の滞在です。

この一年間かなりの事を犠牲にしてやってきました。

そして疲れました。

多分自分がやりたい事へと繋がる道を、この色々と犠牲にした一年で何とか切り開けたと思います。

甘えようともしたし、

すがろうともしたし、

諦めようともしました。



でも今はちゃんと手が届きそうな場所にいます。

その反面、手が届かなくなった物も多いのだと思います。

そして僕は何が届かなくなったのかを明日からの三週間で思い知らされるのでしょう。

正直それに耐えられるか解んないです。結構帰るのが怖いです。

ふぅ。

そろそろ寝ますかね。

では皆さん。日本で会いましょう。
nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:学問

デザイン [世間話]

「興味がある」

誰かの言うその一言に今までどれだけの時間を傾けて来た事だろうか。

勉強 英語 留学 就職 何故か良くわからないけれども皆この辺の事柄についてやたらとこの一言から会話を始めてくる。

大抵の場合、その興味のある事柄に対して曖昧な説明をした上に良くわからない専門用語でお茶を濁し、その事柄について他人に喋れた事に満足して帰って行く。

いつも喉まで出そうな言葉が幾つもある。

興味って何?

他の事柄と比較して言っているの?

他の事柄はどのくらい見て回ったの?

服屋で服を観る時、店に入って最初に見つけた服を手に取って、これが最高の服だとどうして決めつけられるのだろうか?

そしてその服を購入した人が数ヶ月後にその服を着ている事を観る事はまず無い。

俺はまだこの服を脱いだ人達に、何で服を脱いだのか?と聞いた事は無い。

そう聞く事にもその答えにもとても興味がある。ただ、そうする事には情熱が持てないからだ。

聞いた話によると皆人間関係を理由にするそうだ。まぁそれは良いや。

「興味がある」とはとても使いやすい言葉だ。

事柄に対して好意を見せることができて、尚かつリスクを取らなくて済むからだ。

もし興味を失っても誰も咎めない。自分の中にいる他人は自分を責めない。

つまり、興味なんてその程度の言葉でしかないし、皆そういう意図で使う言葉なのだろう。

もしこれが常識として皆に解られている事なのであれば、俺はとてもショックだ。

何でかと言うと俺がこの事実に気がついたのは今日の朝8時にベーコンと卵を炒めて醤油をかけた物をご飯と一緒に食べながら、今やっている研究につかうグラフを見ながら考え事をしている時だったからだ。

俺は一体どれだけの時間を無駄にして来たんだろう。

そうやって考えている内に、情熱とやらを持っている人をどのくらい知っているのかを考え始めた。

今知っている限りでは4人だけだ。

でも、幸運な事に好きな事を追いたければ興味では足りなくて、情熱とやらが必要だという事を知ってそうな人は結構いる。嬉しい限りだ。


ところで、デザインという言葉はとても魅力的だ。

何かをデザインする。

デザイナー。

何かを作っていると言う気がしてくる。

数年前までデザインという言葉が嫌いだった。

何故かと言うと、デザインが好きな奴が大体興味で動く奴らだったからだ。

空っぽに生きて、

体裁だけとりつくろって、

体裁だけを気にする人達で集まって認め合って、

デザインが好きで、

興味があると宣う。

自分の人生さえデザイン出来ない奴が何を言うのだろうか。

人間一度は何かをデザインする機会を得る。

それは間違いなく人生だろう。

デザインとは、意思を物に入れ込む行為だ。

デザインされた製品には意思と目的があり、伝えるものがある。

それをどう使うかは使用者次第だ。

人生の最初の部分をデザインするのは親だろう。

教育や環境を与え、製品としてのコアを作る。

そしてそれらの制約を受けて残りの部分を自分でデザインする。

スコップからバケツを作れない様に、最初のデザインは次の形をある程度決めてしまう。

しかし、その形は一定ではない。自分で新しい意思を入れれば、時間とともに形は変化する。

そして最後にはデザイン通りに機能する事が出来る。

人生をデザインするという事は、人生の方向を長期で決めるという事だ。

だから興味ではデザインは出来ない。

いや、興味でデザインした物は生き残れない。のかもしれない。

そこには情熱とやらが必要なんだろう。


もし自分に子供が産まれたら、その子の人生をデザインする事になるのだろう。

教育を決め、環境を決め、与える情報を決め、多くの事を決定してデザインして行かなければならない。

いや、デザインに従って決定して行く事になるのだろう。

もしそこにデザインが無く、無秩序な方向性が存在すれば後のデザインがし難い事になるだろう。

だから、その時の興味や親の見栄で子の人生をデザインしてはいけないと思う。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

子供のゆめ [世間話]

子供は非現実的な夢を見て、それを実現可能だと思い努力をする。

大人は夢をみず、目の前にある現実可能な事に時間を注ぐ。

今日のはとっても解りづらいです。俺も良くわかんないっす。


天才的な経済学者のWeitzmanは投資に置ける割引率についての革命的な論文を書いた。
以前ちょっと解説したのでそっちを読んで下さい。
http://housecat442.blog.so-net.ne.jp/2012-09-14
元の論文
http://reep.oxfordjournals.org/content/5/2/275.abstract

さて、これによると、不確実な未来の為に投資をする場合、あり得る中での最も低い割引率を使うべきだと結論付けられている。

つまり、長期で不確実な投資をする際には、現在と未来の価値をなるべく同価値として扱うべきだとしているわけだ。

そして、投資のスパンを短くするにつれて、割引率は最も低い値からはなれて行く。

子供に取って、人生とは長く、将来は遠い。つまり、子供に取っては夢を追うという投資は長期で不確実な物な訳だ。つまり、その投資の割引率はかなり低い物となる。

一方で、大人にとって将来は近く、そのための投資の割引率は比較的高い物となる。

って書いたけど、個人が合理的に投資する保証なんて無いよねと気がついてしまったw

あ、でも大人から夢を追うのはあんま合理的ではないかもって事は言えるか。



えーっとw

よしもう一つ。

Weitzmanの議論はここ数年で幾らかの発展を見せていて、fat-tail issueという物が出て来た。

それは、割引率を計算する時に使う確率密度関数の種類によっては懐疑的な結果が出てしまうという物だ。

Weitzmanの議論を思い出してみる。

割引要素の期待値を求めて、ロピタルの定理を使ってみると、最小の割引率が出ると言うもの。

期待値を計算する時に、もしt-分布の様な確率分布の端に厚みのある分布を用いたらどんな事が起きるのだろうか?

確率分布の端とは、起りにくい事象の確率を表す部分であり、地球温暖化を考える時には最悪の事態の確率を表す部分という事になる。

地球温暖化がもし人類の文明を破壊し、絶滅しうる物であるのならば、それを差し止める効用は無限という事になるだろう。U' = ∞

さて、もしこのfat-tailを使うと、この一見あり得そうにないケースを期待値の計算に含めることになる。

つまり、w*∞ = ∞ を期待値の計算に入れる事になる。確率wがいくら小さくても0で無い限りは期待値が∞になってしまう。

(0.01%*∞ + 99.99% * 0)/2 = ∞

よってfat-tailを使った計算は望ましくない。

Thin-tail(例えば正規分布)を使う場合、U'=∞の確率は0となるので、計算結果は何らかの意味を持つ事になる。

不確実性を扱うケースの場合、サンプル数が少ない時に使うt-分布は望ましくなく、正規分布の方が事実に近い物となると考えられる。


で、もし人間が確率分布とかを使って判断とかしているんだったら、確率分布の形はサンプルサイズによって変化して、そのサンプルサイズは恐らく経験って事になるんだろうなと思うんすよ。

子供は経験が無くサンプル数が少ないのでt-分布つまりはfat-tailを持っている。
だから何にでも希望を抱くし夢も見る。だって期待値が高いんだもん。(あり得なさそうな事象の確率を高く見積もってるから) もしかしたら∞ナノかもしれない。
けど、年を重ね、大人になるにつれてサンプル数が上がり、段々とthin-tailになって行き、あり得なさそうな事や、夢に希望を抱かなくなる。

だから今までやって来た事の続きの様な可能性の高い部分に注目する。

うーん。チーズ。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

専門性という夢。 [世間話]

先日友達とskypeで喋った時のトピックが専門性についてだった。

多分僕はソコソコに専門性のある人間で、そこを除いてみれば多分残るのはゴミみたいな人間性と汚い部屋位だと思う。

そういう特徴のせいか、良く「専門性が欲しい」という相談を受ける。

えー、いやさ。欲しいのは良いけどさ、自分でどんな専門性が欲しいのか決めてから話をしようよ。

専門性の定義をすれば、自分の比較優位がそこにある状態になるのかな?

じゃぁさ、比較優位を生み出す為には何が必要なのかな?

当然そこを修練する為の時間でしょ。(あとは、効率を確保するだけの頭。これは外から持って来ても良い。)

つまり、専門性を得たかったら時間を投入すると言う条件が必ずクリアされなければならない。

さらに、比較優位であるからには、他の人よりも時間を投入する必要がある。(もし、効率が同じであるなら)

という事は競争者の数に比例して投入する時間も多くなる訳だ。

じゃぁそんだけの時間を投入するインセンティブは何処から発生するのかな?

専門性のメリットをPとして、費用を投入時間Tの関数C(T)とする。

P-C(T,a)=インセンティブ

となる。専門性のメリットは人によって違うんじゃね?という議論も出来るけれども、恐らく強い憧れを持っているとかでなければ大して差はないと思うので定数と置く。

で、個人間でインセンティブの大小を変化させているのは費用関数という事になる。

例えば好きな事に時間を投入すれば費用は低い物となる。嫌いなら大きい。

つまり、ある専門性を好きか嫌いか?という選好性(a)によって費用が変わってしまう訳だ。(当然家庭環境とかも入り得るけど)

で、専門性をどれにしたら良いか解らないというのはどういう状況なんだろうか?

それはつまりどの専門性のインセンティブも大して高くないと言う状態なんだと思う。

P_i - C(T,a) = I_i
I_i = I_j < 他の行動のインセンティブ

というかさ、今までやってこなかったって事は専門性への投資がそんな魅力的では無かったって事なんじゃないの?
そこで大きな変化、例えば何らかの理由でaが跳ね上がるとか、環境が変わって時間が余るとか、が無いのであればそれはインセンティブが低いままなんじゃないの?
その条件下で専門性に時間を突っ込んでも不幸になるだけだと思うんですが?


えーと、まとめるとだね。
専門性を得る事というのは他の人との競争になる。
よって時間の投入量と効率が必ず要求される。

専門性の選択で迷う人は、専門性を得ようとする事を止めといた方が良い。
多分競争に勝てないし、その時間を別の事に使う事でもっと幸せになれる。

あとさ、もし専門性のインセンティブが他の行動より大きいなら、多分勝手に活動を始めると思うんですよ。
だから専門性がうんたらとかいう時点でかなり専門性からは遠い、つまりは専門性獲得までに要求される投入時間量が多い、のかと思います。
で、その投入量を確保する為には大きなインセンティブが必要で、それは選好性aに由来する。
で、aが大きいのであれば勝手に活動を始めるはず。

1. now
P-C(T,a) = I < other (indicates T = 0)

2. future
P-C(T,a) = I > other (require large increase in T, if a is constant)

T=T(a) T is a function of preference,a.
so that large T requires some level of a.
However, a is exogenous variable. ( you cant chage it by your self.)
Consequently, T will not be increased unless a increased by shock.

3. as a result
if there is no shock on a
P-C(T,a) = I < other (indicates T = 0)

つまり、aに何らかのショックが無ければこの堂々巡りを抜ける事は出来ない。
多分Pもaの変数で、そのようにモデルを変えても同じ結論になるかと。




ただ、人を使う側はこれとは全く別のメカニズムを持ってる。
会社にしてみれば、その人が働く事によって会社が得られる利益はその人の能力の関数になる。

P(q_i, T) - W(q_i)*T = π(profit)

q_i は分野iにおける能力。高い能力はより高い利益を生み出すと考えられるので、Pとq_iはconcave functionだと考えられる。(非線形で増える。)
Tは労働時間。
賃金Wも能力に比例して上昇するが、上昇はPよりも低い。(もしかしたら線形かも)

つまり、会社にしてみれば働く人がより高いqをどんな分野で持っていても得をする。



あーそうか、ナッシュ均衡なんだね。これ。
会社が雇う為にはある程度の能力が必要になるから、それを付ける為に専門性を持とうとすると。
だから本当は皆が自分の選好性に基づいて専門性を得ようとしなければ皆が幸せになれるから、専門性なんか追うなと書きたかったけど書けないじゃんw

えーうー、うーん。

そーなると、高校生位までに好きな物がはっきりしているという事がとても価値のある事の様に思えるんだけど。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

曖昧さ [世間話]

aとbの間で情報をやり取りする。

aの中にはxという情報が内包されていて、それをbに受け渡す時にそれを受け渡し可能な状態へと変換する。

よってaとbの間を行き交う物はf(x)という関数になる。

この関数をbは受け取り、それを解釈する。しかし、ここでf(x)が必ずしもxに解凍されるという保証は無い。

もしかしたらyという形で解釈するかもしれないし、x+3とかになってるかもしれない。

この関数fは言葉と呼ばれる物で、それは人それぞれ違う。同じ事を説明させてみたら皆様々な言葉で説明しようとするはずだ。

そして、もしf(x)の解凍方法(逆関数)が、その人の言葉の逆関数なのであれば、解凍方法も人それぞれと言う事になってしまう。

じゃぁ説明が上手というのは一体どういう事なんだろう?

説明が上手いという定義を「説明を聴いている多くの人が理解出来る状態」とする。

理解出来るの定義を「聞き手(b)がより正確にxを手にすることができる状態」とする。

あわせると、

「複数の聞き手が、説明f(x)からより正確にxを手にすることができる。」

となる。

じゃあ一体どんな方法を用いればこの条件により近づく事が出来るんだろうか?

取り敢えず思いつくのは、相手の言葉の関数を推定して、上手くxが結果として残る様な説明f(x)を与えるというもの。(f(x)は自分で自在に変えられる物としましょう)

でも、これは個人には使えても集団には使えない。恐らく家庭教師をやっている大学生とかはこの辺が限度なんだと思う。


で、これを集団にするためにはまず集団の言葉の関数を推定(推測)する必要がある。

そして、それらの関数の共通部分を上手く用いてxに近い結果を出すしか無い。

ほかに何か方法があるんだろうか?あ、でも上で出した定義とかが間違っていれば全然あり得るよね。

ちなみに、この集団に対して最適なf(x)を選択するという所にも最大化、若しくは最小化問題があるかと。
えーっと、これ。 min ∑(x-y)^2
yが理解の結果で、yとxの差異を二乗して最小になる様に解けば、最適な説明が得られます。
この時 y_i = g_i(f(x)) となる。

それぞれ(_i)の理解は、それぞれの関数(g_i)に基づいて行われる。
と言う事で以下の最小化問題にまとめられる。
min ∑(x - g_i(f(x) )^2

まぁ計算なんかしなくても分かる結果が幾らかある。
1. 恐らくある程度の人数を切り捨てて説明を行った方が、結果は上昇する。
2. g_iの分布が狭い方が上手く最適化出来て、切り捨てる必要性も薄れる。
3. 人数を増やす程、平均での理解度は落ちる。(多分、これちょっと計算してみないと確証ないw)


でさ、これが現実的に当てはまりそうな問題ってなんだろなー?って考えてたんだけれども、教育以外にあるかな?

まぁいいや、教育に当てはめると、(教師が説明度合いを自分で設定出来るのであれば)成績別で学校やクラスを変えた方が全体としては良い結果が出るし、切り捨ても少ない。
クラスの人数を減らすとコストが上がるけれども、教育の効果が高い。のでどっかに最適サイズがある。
うん、あまりにも普通なんだよねw
これで具体的な数字が出せて始めて普通じゃなくなるんだけど、データないしね。

後は塾とか一般教材とかにも言える事だね。やっぱ教育。うーん。

まぁ良いか。論文読もうw
本当は違う話書くつもりだったんだけどなぁ。

nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

地球温暖化とかのお話。 [世間話]

今学期は本当に地球温暖化関係の事ばかりやってます。

僕の意見を明確にするとですね。

まず個人としては、結構懐疑的。

二酸化炭素が原因ってのもどうなの?って思うし、温室効果ガスが溜った時の影響なんかもどうなの?と思う。

それをどうやって解決するの?って議論をした時には温室効果ガスの削減よりも効率の良い方法があるでしょうよと思う。(例えばgeoengineeringとかね)

だけれども、経済学をやっている身としてはこの部分について考える事は止めないといけない。
なんでかっつーと、経済学ではこの真偽が解らないから。

じゃぁ経済学でやる事って何よ?というと、政府がこの問題を解決しようとした時に一番コストが少なくなる様な方法を考える事なんですよ。

政府が地球温暖化は起きていて、二酸化炭素が原因だからそれをこのくらい減らす。と言ったならば、それを最安で実現出来るプランを建てるのが経済学者のやる事。

だから今学期は個人としては疑いながら(というかだからこそなんだけど)地球温暖化を安く解決する方法に付いて分析していた訳です。


どの程度温暖化を緩和するべきなのか?と言う議論では割引率が非常に重要になる。で、それは9月に日記を書いているのでそっちを読んで下さい。
http://housecat442.blog.so-net.ne.jp/2012-09-14

ちょっとまとめておくと、温暖化を緩和して得られる便益以上にコストを支払っても損するだけなので、便益の計算をきっちりする必要がある。しかし、便益は未来の話なので、割引率を用いる必要がある。ただ、この際効用を割り引くのでラムゼイルールを用いて割り引く。
適切な割引率はWeitzmanのuncertainty approachによると、起こりえる最も小さい値になる。



ゲーム理論を使った京都議定書の分析も結構面白かった。

地球温暖化はグローバルな問題なので、どこかの国が問題解決の努力を行えばその恩恵を何の削減努力も成しに得ることができる。

つまり、フリーライダーのインセンティブがある。

すると幾らかの国に取ってはコストを支払う削減から得られる利益よりもフリーライダーによって得られる利益の方が大きくなる。
それらの国は京都議定書等の枠組みには参加せずに、フリーライドして参加国の削減を享受する。



二酸化炭素排出に税金が掛かった状態に置ける企業間の協力ゲームとかも面白かった。

CO2 taxがあると、taxよりも低いコストでCO2を削減出来る方法があるのであればそれを実行する様になる。
なんちゃらコンバーターを装着するとか、燃費を上げるとかそんなの。

そういった選択肢の中に、他の企業と協力するという選択肢もある。
技術協力だっていいし、輸送手段を合併するのだってあり。(というか良くある)

こうすることによって、他の方法より幾らか安くCO2を削減出来るので利益が上がる。
しかし、その利益をいかにして分配するのかが難しい問題となる。
例えば3社で協力した時に、C社が参加することによって得られる追加の利益がわずかな物しかなければC社に割り当てられる利益は些細な物にしかならない。
会社の数が多くなれば、他の会社と比較されて受け取れる利益の量に格差が生じる。




あとCDMの話とかも面白かった。

先進国が後進国で削減活動を行ったらその分だけ排出権を貰えるよという枠組み。
当然後進国の方が削減しやすいので、コストも低くなる。これは素晴らしいかと。ただ、あまりにも皆がやりすぎたので、最近では排出権の値段が崩れてしまってる。
EUなんかはこの値段を上げる事に興味があるのだけれども、どーするんだか。税金でも掛ける?
結構アリだと思うけど。



で、10月の終わりからはひたすら車の話。
EUでは新車の平均二酸化炭素排出を2020年までに95g/kmにしようという目標があって、それを各会社がどうやって達成しようとしているのか?とか。

ノルウェーは85g/kmが目標で、それを税金によるインセンティブで達成しようとしているのだけれどもどのくらいの税率にするべきか?とか。




ちょっと話が飛ぶのだけれども、今学期を通してすごい不満に思った事が一つ。
何で環境系の団体ってこういう事話さないんだろうね?

学部にいた時にこういったトピックに興味があってそう言ったサークルや団体やらに所属して、こういったトピックに関してぺらぺらと喋ってる友達が結構いたけれども、誰一人としてこういった話はしてなかった。

とりあえず要約すると、みんな文明的な生活を如何に石器時代に戻すかって話をしていた。あとちょっと再生可能エネルギーとか。

僕は正直に言ってこのトピックではそんなにやって行きたく無い。
個人的な見解の話もあるけれども、政策が政治で決定されていて社会科学や自然科学の入る余地がないからだ。
いや、ミクロレベルで観れば税率の計算とか現状分析とかあるのだけれども、マクロの流れを自然科学で決定付ける事は出来ない。

多分1、2年くらい経ったらまた違う事を考えてるのだろうけれども、今はやっぱりそんなに興味は無い。
ただ、問題を理解して、それをモデリングして、どうやったらそれが解決出来るかを考えるのが好きな経済学者に取っては面白い問題なので、さじは投げない訳だけれども。。。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

こーなーそりゅーしょん [世間話]

確実に何回も書いたトピックなのだけれども、特に書く事ないのでもう1回。
あ、あと書いてある事の正確さ云々とかが恐らく無いであろう事は先に言っておきますw


非線形の制約条件付き最適化問題を解く時、答えを探し始める場所によって得られる解が違ってしまうことがある。

例えばもし僕らが足下も見えない程の霧の中で、限られた範囲内に無数に存在する山の中から一番高い山を探そうとする。

その時僕らが出来る事は、全ての方向へ1歩踏み出してみて一番勾配が高い方向へと進む事だ。

それを繰り返す事によっていずれ僕らはどの方向も下りの傾斜を持つ場所、つまりは山の頂上へとたどり着く。

しかしその山が本当に一番高いかは解らない。

もし山が二つしか無い状態で、山Bが山Aよりも高いとする。

1回目は山Aの麓からスタートし、山Aへと登って行く。

そして2回目はスタート地点を変更して山Bの麓からスタートし、山Bを登って行く。

どちらも同じプロセスを実行し、同じ条件の場所で止まった。

しかし高さは違う。

もしスタートポイントを大きく変えなければ、僕らは永遠と山Aを登り続けて一生より高い山Bへとたどり着けない。

つまり、コーナーソリューションにはまり込んでしまう。

僕らが考え事や悩み事をする時、僕らは自分の推察や仮説と(多分あるであろう)真実との誤差の最小化という最適化問題を解いている。

そして大体のケースに置いて僕らはコーナーソリューションへとはまり込んでしまう。

多分これがベストな選択肢なんだとか。

これが一番リスクが低そうだとか。

その解から一歩踏み出してみた所の状況の変化を見て、今のアイデアが一番正しいと推測する。

でも、本当に何かを知りたいとか推測したいと思ったのなら、しないと行けない事は考えるスタート地点を変える事だ。

でも考えるスタート地点を帰る事はとてもコストが高い。

今までのアイデアを1回放棄してみないと行けないし、その見返りとして必ずより誤差の少ないアイデアを得られるとは限らないからだ。

そしてその思考のプロセスは時間を取るので無料じゃない。

ただ、明らかに重要な(つまりは将来に置ける収益とか効用とかを左右する様な)決定をする時にはそのプロセスの為の時間に便益が発生する。

そして僕はこういったプロセスを安いコストで使える様になったら素晴らしいよねと思う。

ここではランダム化は上手い事動いてはくれない。
もし僕らが思考に割く時間をかなり持っているのであれば、ランダムでスタートポイントを選んで考え直す事を何回も繰り返すのは良い手だ。
遺伝的アルゴリズムなんかはこの手の手法を用いている。

しかし、現実には限られた時間内でより誤差を減らせる(高い所へ行ける)スタート地点を見つけなくてはならないので、時間は僕らの味方にはなってくれない。

一つ考えられる方法は、あり得そうな結論からスタートしてみる事だ。
つまり、麓から頂上を探すのではなくて、ちょっとした単純化の仮定を元に頂上を想定してみてそこから麓へと戻ってみるという方法だ。
もしその麓が状況としてアリ(麓の定義が曖昧なのは置いておいてだねw)なのであれば、そのアイデアは解として使えるでしょう。

このあり得そうな結論っていうのを考えるのにもコストが掛かりそうなのだけれども、ランダムで何回も繰り返すよりは遥かに安く済む。
そして、単純化する手順なんかに慣れればそのコストももっと安くなったりするんじゃないでしょうか?



まぁ経済学やってる奴がこういう事言い出すと大抵は、合理的な個人と完全競争を仮定しろって言う話になる訳ですよ。

大体経済学嫌いな人なんかはこの二つの仮定はあり得ないという話をするんですね。
ええ、ごもっとも。合理的な個人なんて恐らくいないでしょう。

でも、その仮定が真実とは違うと指し示せても、その仮定をベースとした分析ツールが全く使い物にはならないという結論には至れないんですよ。
さっきの話に乗っ取って、合理的な個人を想定して山の頂上を仮定して、そこから麓を見つけたとしましょう。

で、人間がちょっと非合理的な側面とかを持っていれば、頂上の場所も違っちゃう訳ですよね。
ここで問題なのは、仮定した頂上が本物と違うと言う事ではなくて、どんだけ離れちゃってるの?って事。
もしとんでもない距離離れていたら、経済学はもっと根本的な見直しを迫られるでしょう。

だけど実際には完全に合理的な仮定を置いても、そんなに酷く現実と乖離した結論なんかを出したりはしない。だから政策を組む時や企業の意思決定なんかに使われる訳で。
現実を100%説明出来る訳ではないでしょ?と言われればイエスなのだけれども、それでもやっぱりツールとしては使えるから問題ないでしょ?というのが言いたい事です。


うん、ずれたなw
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。