瓢箪鯰的な男の雑記帳

心にうつりゆくよしなしごとを そこはかとなく書きつくる そんな雑記帳

久しぶりに読んだ本のお話

「其処に行くと死んでしまった人間というものは大したものだ。何故、ああはっきりとしっかりとして来るのだろう。まさに人間の形をしているよ。してみると、生きている人間とは、人間になりつつある一種の動物かな。」
 ー小林秀雄『無常ということ』

*******************************

 今日はやることもなかったので、なんとなく昔読んだ本を読んでいた。

モオツァルト・無常という事 (新潮文庫)

モオツァルト・無常という事 (新潮文庫)

『無常ということ』は、たまに本棚から引っ張り出してくるお気に入りの短編である。
高校生の頃国語の教員がこれを教材として使ったのが、本書との邂逅である(よく考えたら吉田満の『戦艦大和ノ最後』を教材にするという凄まじい教員だった)。
戦艦大和ノ最期 (1974年)

戦艦大和ノ最期 (1974年)

当時は何を言っているのか書いているのかさっぱり分からず、適当に放り投げてしまったものであるが
あれから20年以上も経つと、同じ本でも違う感情を抱くようになるのが、とても不思議であり新鮮なものである。

*******************************

 小学生の頃だったか、年末のテレビで忠臣蔵を見た時に
なにゆえ大石内蔵助以下四十七人は腹を切らねばならなかったのか、良く分からなかった。
荻生徂徠と思しき人物が、後々討ち入りに行った者たちのことを慮り(忠臣蔵では当然ながら大石内蔵助に義があるように演出される)
死を賜うべきであると滔々と論じ、事態は実際にそのように展開する。

*******************************

 荻生の言い分は、もしこの四十七人を下手に生かしておいて晩節を汚すようなことがあれば、
赤穂事件の美しい物語は汚されてしまうため、ここで敢えて死を賜うことによって
そのような可能性を完全に排除するためである、というものであった。
なるほど、これであれば四十七士は永遠の義士として残り、
そして300年経た現在でも語り継がれている。荻生の狙いは当たったと言えよう。

*******************************

 四十七士が日頃どのような生活をしていたのかは、私にはあまり良く分からない。
四十七人もいれば人倫に悖るようなことをしていた連中もいるであったろうとは思うが
義から死にかけての美しい物語の中でそれらは捨象され、美しい歴史のみが残ってしまった。

*******************************

 しかしそれで良かったのである。
その美しい物語が私たちに余計な思いをさせないから。






 

体系としての経済学と方法論としての統計学②

「私は比較級や最上級のことばを用いたり、思弁的な議論をするかわりに、自分の言わんとするところを数(number)重量(weight)尺度(measure)を用いて表現する」 ウィリアム・ペティ(1623-1687)

********************************

 社会科学(当時としてはそういう意識はなかったろうが)にデータを本格的に持ち込んできたのは、ウィリアム・ペティであることは概ねのコンセンサスを得られるところであろうと思う。
 実験が基本的に不可能な経済学は、科学的であろうとすればどうしても「統計」との間を行ったり来たりするはずであるのだが、
 「一九世紀以降、経済学と統計学の関係はお互いに不幸であったと言わざるを得ない。統計学は経済学に重要な事実資料を提起するものであろう。経済学は統計数字の変動を説明するべきであったにも関わらず、一九世紀以降一九三〇年代マクロ経済学計量経済学の成立まで、両者は殆ど関係を持つことがなかった。スミス以後の古典経済学が重商主義と結びついた政治算術学派を否定して以来、経済学が統計数字を用いることはほとんどなくなってしまった(竹内啓『経済学と統計学のあいだ』P83~84)」
 意外や意外、大恐慌あたりまではこのような形であったようである。

********************************

 人類が自然を理解する「科学」という方法を取得したのは存外新しく、17世紀のニュートンからである。
現実の観測、観測結果を演繹的に説明できるいくつかの諸原理の発見、その諸原理から演繹的に導き出された予測結果と観測事実の突合、これら3つをまとめたのがニュートンであった。

 社会科学においても、1699年にG・キングが穀物の需要関数を原始的な方法ながら推計している(ガウスによる最小二乗法の発明は1800年頃である)。
F・ケネーは重農主義の立場から「経済表」という、今日でいうところの産業連関表の原型を作成している。
太陽系の解明にチコ・プラーエの収集した天文データが重要な役割を果たしているが
(体系はなかったとはいえ)経済学もその初期においては分析対象に対して、データからの接近が試みられていた。
『政治算術』をA・スミスが否定した理由は良く分からないが、A・スミスの道徳としての『国富論』と相容れなかった(A・スミスは『道徳感情論』も記している)ためではないかと、J・シュンペーターは後年言っている。

********************************

 何かしらの経済的な現実を説明したい把握したいというときに、経済学者と統計学者は驚くほど違う方向からアプローチしているように思える。
前者は議論となる諸前提を仮定し現実をモデリングした上で、そこから演繹的に導き出した結論とデータが一致しているか、というアプローチを採っている。
それに比べて統計学者は、関係のありそうな変数同士を取りあえずいくつか持ち込んでみて、グラフ化したり相関係数を取るなどして(細心の注意を払ったうえで)変数間の関係はどうであるかとか、その関係性は安定的か否かであるかとか、なんとなくおぼろげなうちから探索を始めるようである。
同じ問題に対して、右からアプローチするのか左からアプローチするのか、全くもって様相が違うのである。
 このような統計学者的なアプローチは、諸問題の解決の糸口を探ったり、最終的な構造の把握に至る過程では極めて強力である。
それに対して経済学者的なアプローチは、諸問題の構造がある程度把握できた後で他の問題を解決するためには強力な方法であると思う。

********************************

 経済学者的アプローチからすれば統計学者的なアプローチは、ある種の公理系を持たないという意味で「厳密性に欠ける」と思うであろうし
統計学者から見て経済学者的なアプローチは、データという根拠なきままにモデルを組むという点において、地に足がついていない感覚に陥るのではないかと思う。
この両者の懸隔は、どちらが優れている優れてないという話ではなく、アプローチの仕方による性質の違いであって
現実データから保証を得られない前提を持つ経済モデルは意味を為さないであろうし、
「取りあえずあるだけ」のデータは、理論的な何かを帰納的に導き出し得ないであろう。

********************************

 このように考えていくと統計学的なアプローチは問題の構造の把握が終わってしまえばお払い箱のように思われるが
社会問題が今まで途切れたことがないし、これからも途切れないであろうであるから
統計学的アプローチそのものの研究はなされるべきであろうと思う。
今後現出する社会問題は、それ自身が経済的問題であるとか社会学的な問題であるというような名札を付けて現れてくるわけではなく、よってその問題に経済学のツールを用いることが適切かどうか分からないこともある。
このように問題がモヤモヤしてハッキリしない段階においては、やはり統計学的なアプローチは極めて有効であると言わざるを得ない。
そして統計学発達の歴史は、扱うデータの特性の変化と共にあったとも言え(時系列分析などそうであろう)、今後もクセのあるデータが出てくれば分析手法を変える必要性が生じることは言うまでもない。
そしてその積み重ねが、方法論としての統計学の発展そのものになると言える。

********************************

 経済学者と統計学者の間にはまだ溝があると思えることもあるが(「理論なき計測問題等」)、実は問題へのアプローチの方向性が違うだけとしか思えない。
経済学者はより理論を厳密にすべく現実を説明するためにデータの助けを必要とするだろうし、統計学はデータそのものが発展の母体となるのだ。

********************************

 そんなことを思いながら、今宵も適当にVARに変数を突っ込んで遊ぶのである。

体系としての経済学と方法論としての統計学①

第6問:物理学は公理化できるか(『ヒルベルト23の問題』)
困難は分割せよ(ルネ・デカルト

********************************

Twitter上で何気ないやりとりから、学生時代にこんな本を読んだのを思い出したので
ちょっとAmazonでぽちって読み直している。

『統計学と経済学のあいだ』(竹内啓著)
途中ではあるのだが、色々考えさせられたので取り留めもなく筆を執ってみた。

********************************

 経済学は「社会科学の女王」と言われることがあるのだがその理由としては、「科学的方法」をそのままトレースしていることが挙げられるだろう。
科学的方法で重要な考え方の一つとして、複雑な現実をいくつかの要素に還元していくという「要素論」が挙げられる。ニュートンは「運動の法則」を「取りあえず無批判」に受け入れることで、地球上の物体の動きや惑星の動きなどを明らかにしたし、アインシュタイン光速度不変の原則を受け入れることで、特殊相対論の理論体系を構築している。経済学においてもこのような要素として、「ホモ・エコノミクス」という概念に到達した。
経済学がこの「ホモ・エコノミクス」が非人間であるであるとか、そのような合理的な人間はいないという誹りを受けることが多い。このような非難に対しては真摯に受け止めなくてはならない部分もあるが、だからといって「ホモ・エコノミクス」からなる理論体系を全て捨ててしまうというのには、どうしても賛成できない。科学的な分析にに則るならば、どうしても森羅万象をいくつか切り捨てて、簡略された(その理論体系では一旦は無批判に受け入れなくてはならない)抽象概念から出発せねばならないからである。
ユークリッド幾何学が5つの基本的な公準から初等幾何学の伽藍を作っているように、ニュートン物理学もいくつかの諸原理、ワルラス流の経済学も「ホモ・エコノミクス」というある種の原理から出発しているのである。
理論展開の形式を見れば、数学も物理学も経済学も同じ形式をとっていることは強調しておきたい。

********************************

 理論体系の価値は、どれだけ現実世界をその理論で表せるかで決まることは、それほど多くの批判はないと思われる。
最も自由な理論体系は数学で、ルールはそれこそ「なんでもあり」なのだから、面白い定理や役立つ結果が出てくればどのようなルールを設定しても構わない。
事実我々は時間を表すときに、「11+2=1」(11時の2時間後は1時)という体系を用いている。
 逆をいうとルールを決めるにも節操がなければならず、物理学や経済学の場合は現実の現象をある程度近似できることが要求されることは自明だろう。いくらワルラス流の線形の世界が美しいと言って、現実に対して無力であればただの数学的記号を用いた散文に過ぎなくなる。
よく経済学の実証分析を行った論文に「消費=α所得+誤差項」のような回帰式があったとして「符号条件はα>0」などという但し書きがなされていることがあるが、これは「流石に所得が大きければ消費も大きくなってもらわないと現実と合わない」という意味に他ならない。
理論と現実世界のフィッティングは、理論から演繹に弾き出された現実世界の予測値と現実世界におけるデータの実測値の差、あるいはパラメータの安定性によって測られることが多いと思われるが、ここで重要なのが「統計的なものの見方」だと考えている。

(続くかもしれない)

新・シルクロードを観ながら

国破山河在
城春草木深
杜甫『春望』)

**************************

 先日、家の中を片付けていたら
10年少し前に撮りためた「新・シルクロード」が出てきて
ちょっと片付けの手を止めて見入ってしまった。
その時妙な感じがしたので、ここに備忘的に書き留めておく。

**************************

 昭和55年に、NHKスペシャルで「シルクロードをやっていて
それを撮ったVHSテープが自宅にあり、好んでよく見ていた。
悠久とも言えるタリム盆地に、昔ながらのバザールをやっているさまをみて
自分もいつの日か西域に行きたいと思うようになった。
(その後治安が怪しいのと体調の加減で実現してはいないのだが)
歴史が好き、さらに「日本人はどこから来たのか?」を探るのが好きな自分にとって
シルクロードは歴史がそのまま保存されているような錯覚に陥らせてくれて
非常に心地がよかったのだ。

**************************

 タクラマカン砂漠、西端のカシュガル
昔からシルクロードの天山南路と西域南道が交わるオアシス都市だ。
40年前、この交差点は舗装もされておらず土埃の舞う
あまりにも牧歌的な道だった。

 それから30年。
道路は舗装され、近代的なビルが交差点を囲い
日干し煉瓦で作られた家が並んでいた通りは取り壊され
そこには瀟洒な商店が軒を連ねるようになっていた。
町は成長し、より豊かになっていた。

 それを見た時、本音を言うと非常に落胆してしまったのだ。

**************************

 長安の都が戦火に包まれても、ただ在ったのは山河だが
ここタクラマカン砂漠においては、河すらも不変ではない。
タリム川は雪解けの時を待たないと干上がったままであるし
楼蘭を支えたロプノール湖は、その位置を変えて旅人を悩ませた。

 敦煌の仏像、三蔵法師の物語だけを見れば
パミール高原以東のシルクロード仏教徒の道のように錯覚するが
ここは太古より戦乱が絶えない土地で、
目まぐるしく支配者が変わり、それごとに風俗も変わっていたのだ。

**************************

 悠久なるシルクロードとは幻想に過ぎず
絶えず変化するのがシルクロードである。
そこに僕は、勝手に「昨日的な今日」を期待してしまい
それが裏切られたからと言って落ち込むという、独り相撲を取っていたのだ。

**************************

 元来、成長とは変わることと不可分なはずである。
他者に対して豊かになってほしいとは、常に思っているのではあるが
それとは裏腹に変わらないことを望んでいたのだ…。

 この矛盾をどのようにうっちゃるか考えながら本棚を覗くと
学生の頃あれほど愛読したシュンペーターが埃をかぶって、
奥に押し込まれていたのだった。

ラーメン屋にて

 先日外出先で、中途半端な時間をうっちゃるがてら小腹がすいたので、
ラーメン屋の暖簾をくぐった。
食券を買ってそれを差し出してしばらくすると、
ラーメンが「へい!!お待ち!」という掛け声とともに出てきて
私はそれを湯気に隠れるようにすすりはじめた。

 不意にMy foolish heart が耳に入ってきた。
きっと店で有線契約しているであろう。洒落た調べであった。
その後も次々と品の良い曲がかかっていった。

 その時感じたのが、どうにも形容のし難い据わりの悪さである。
自分は現在、脂の浮いた色の濃いラーメンをすすっている腹の出た中年男であり
どう取り繕おうとも、Bill Evans の繊細な調べが似合う主体とは言えないのだ。

 その時はその違和感について不思議にも思わなかったのだが、
ラーメンの汁を飲み干して店を出た時、急に怪しげな気分になってきた。
さっき自分に「据わりの悪さ」を感じさせたものはなんだろう、と。

 よくよく考えてみると、ラーメンをすすりながらジャズを聴いてはならぬという法もなく
中年オッサンが洒落た場にいてはならぬという法もない。
さらに店内は店主と自分しかおらず、誰の目を気にするという場面でもなかった。
でも、やはり据わりが悪いのだ。

************************************

 こうしてみると、人が俗世間のいわゆる価値観から
完全に離れられる時間はあるのだろうかと、そう考えてしまう。
自分は自由気まま、勝手するままにふるまっているつもりでも
「俗世間のそれ」は、地球上のすべてが受ける重力加速度のように
まとわりついて離れないのではないか?
自分自身は勝手気ままにやっているつもりでも、
所詮は釈迦の掌で粋がっている孫悟空でしかないのか、と。

 「まっ、世の中そんなものだよな、、、」という乾いた笑いを自らに浴びせつつ
今宵もジャージ姿で、ショパンの調べに身を委ねるのである。

PISA2006の分析 -親の属性と子の学力④-

前回からかなり時間が経ってしまったのだが、なんてことはない
あまり筆が乗らなかっただけの話である。

前回までの復習。

PISA2006のデータをダウンロードして、日本のデータまで切り出すところまで。

##########PISA2006の読み込み#############
setwd("C:/INT_Stu06_Dec07")	#データのあるディレクトリに移動(Cの直下にあると仮定)
moto<-readLines("INT_Stu06_Dec07.txt")	#データを読み込む
##########ここまで読み込み##########

jpn2006<-subset(moto,substr(moto,16,18)=="JPN") #日本だけ切り出す
kuni<-as.factor(substr(jpn2006,16,18))	#16列目から18列目までを切り出して、factor型でkuniへ代入
summary(kuni)	#日本だけ切り出せているか確認

さて、親の学歴のデータを切り出そう。
コードブックを見ると、379列目が母親の学力レベル、380列目が父親の学力レベルを表しているのが分かる。
381列目が「両親の学力レベル」とあるので、定義を確認する必要がある。
定義が分からないデータは、必ず定義を確認することが肝心だ。

さて、学力レベルがISCEDのレベルであらわされているので
適当なラベルを振ってやることにする。
ソースはウィキだが、レベル2が中卒、レベル3が高卒、レベル4とレベル5Bが難しいが、高専と短大が近い。レベル6は概ね大卒と見てよさそうだ。
レベル4は便宜的に高専、レベル5Bも便宜的に短大としておいて
あとから両方をくっつけても良い。

ちょっと両親の学力の定義を調べてみよう。
多分両親のうち、学力が高い方を選んでいると思われるのだが。。。
高専と短大は短大の方が処理の都合上、レベルが高い【ことにしている】だけである)

mg<-(substr(jpn2006,379,379))	#母親の最終学歴を切り出す
mg<-factor(mg, levels=c(2:6,9), labels=c("中卒", "高卒", "高専", "短大", "大卒", "不詳"))	#ラベル付け
fg<-substr(jpn2006, 380, 380)	#父親の最終学歴を切り出す
fg<-factor(fg, levels=c(2:6,9), labels=c("中卒", "高卒", "高専", "短大", "大卒", "不詳"))	#ラベル付け
rg<-substr(jpn2006, 381, 381)	#両親の最終学歴を切り出す
rg<-factor(rg, levels=c(2:6,9), labels=c("中卒", "高卒", "高専", "短大", "大卒", "不詳"))	#ラベル付け
gakureki<-data.frame(mg, fg, rg)	#学歴をデータフレーム化
head(gakureki, 10)	#gakurekiの頭10行を抜いてくる
   mg   fg   rg
1  高専 不詳 高専
2  大卒 大卒 大卒
3  大卒 大卒 大卒
4  大卒 大卒 大卒
5  大卒 大卒 大卒
6  短大 大卒 大卒
7  大卒 不詳 大卒
8  大卒 大卒 大卒
9  短大 大卒 大卒
10 大卒 大卒 大卒
11 大卒 大卒 大卒
12 短大 大卒 大卒
13 高専 大卒 大卒
14 高専 大卒 大卒
15 大卒 大卒 大卒
16 短大 高専 短大
17 短大 短大 短大
18 短大 大卒 大卒
19 短大 高専 短大
20 短大 大卒 大卒

やはりどちらか学力が高い方を取っているようである。

簡単に集計してみるとこんな感じ

summary(gakureki)
    mg          fg          rg      
 中卒: 247   中卒: 370   中卒: 142  
 高卒: 711   高卒: 782   高卒: 414  
 高専:2010   高専:1498   高専:1680  
 短大:1410   短大: 399   短大: 836  
 大卒:1309   大卒:2416   大卒:2702  
 不詳: 265   不詳: 487   不詳: 178  

親の学力のデータが抜けたので、次は点数のデータを抜いてみよう。

PISA2006の分析 -親の属性と子の学力③-

前回はコードブックや質問用紙を読みながら
使えそうな変数を取るところまでやった。
問題は点数が5つもあるというところの処置。
簡単に5つの平均値を出せばいいじゃん、と思われるかもしれないが。。。

平均は実は扱いにくい変数である

意外と知られていないのが、平均値の扱いづらさである。
平均値のマジックとしてよく知られているのが、「平均貯蓄」である。

【2017年家計調査】みんなの平均貯蓄額は?1820万円
当然「俺の家こんなに貯金ないよ」となるわけだ。

実はこの平均貯蓄は、一部の貯蓄が多い世帯が平均を引き上げてしまっているのだ。
(本文中にも言及があるが)実際に貯蓄額の分布を見てみると、
やはり貯蓄額の多い一部の世帯の影響が大きいことが分かる。
さらにこれは、負債は考慮していないので、貯蓄額は最低でもゼロ円だ。
平均値をある集団の特性を表す統計量だが
単純に平均しただけでは、その集団の特性を表さないことがある。
こちらから松坂大輔投手の
2005年の等級データを入手できる(提供元:(株)データスタジアム)。
平均球速を算出すると約138.1km/hとなって、全盛時の松坂投手からは考えられない程遅い。

ヒストグラムを書いてみよう。

setwd("C:/")	#ディレクトリ移動
moto<-read.csv("松坂球速.csv",header=TRUE)	#データの読み込み
hist(moto$kyusoku,main="松坂投手の球速分布",xlab="km/h",breaks = 18)	#球速のヒストグラムを表示。bureaksの値はいくつか実際に書いて決めればよい

f:id:namazu1945:20170604204726p:plain

明らかに2つ山があり、球速が何かしらの要因に左右されていることがわかる。
野球ファンならすぐにわかるだろうが、球種によって球速は変わってくる。
よって球速の平均値を出すには、全部を無暗に足して割るのではなく
球種で分類して、平均を出すという手間が生じてくる。

・・・なかなか本番の分析が進まないのぉ。。。