瓢箪鯰的な男がR初級者から中級者になるのを記すブログ

掴みどころのないオッサンのR勉強録。目標は中級者。 その他雑記なども

ブログのネタ用データ

さて、ブログのネタになるデータをどうするか思案しているのだが PISA2006のデータが良さそうだ。 まず個人が扱える規模の大きな個別データがある、というのが大きい。 何よりも子供たちに将来の夢なんか聞いていて、データとしてなかなか楽しそうである点が良い。 (コードブックを見ると良い) PISAについての詳細は、こちらをご覧いただきたい。 データのダウンロードの方法は、上記のリンクから Data sets in TXT format (compressed)の下にある Student questionnaire data file (151 MB) こいつを、右クリック→名前を付けて保存 あとは適当なフォルダにこれを解凍するだけだ。 解凍すると700MBくらいのデータになるので要注意。 対応する質問用紙はこれだ。 Questionnairesの下にある Student questionnaireのリンク先である。 ちなみにP23にある、Q30が将来就きたい職を聞いている箇所である。 必要なコードブックはこれだ。 100ページ以上もあるブ厚いものだが、可能ならば紙に出すことをお勧めする。 もしくはマルチ画面で分析ソフトを回す画面とは別の画面に映すと良い。 作業効率が格段に違う。(やはりワシはアナログ人間なのだ) 質問用紙もコードブックも英語だらけ(というか英語だけ)なのだが 読んでみると簡単な英語なので、意外となんとかなる。 TOEIC500点もないワシでもどうにかなる程度なので、是非見てみてほしい。 暫くはこのデータを弄って遊ぶことにしよう。