瓢箪鯰的な男がR初級者から中級者になるのを記すブログ

掴みどころのないオッサンのR勉強録。目標は中級者。 その他雑記なども

PISA2006の分析 -親の属性と子の学力②-

 前回で、データをPCに読ますところまでできた。
さぁ張り切って○○分析を!!!とやりたいところだが・・・

分析の前にやることはたくさんある!!!*1

 まず用意するのは、
〇質問用紙(調査票)
〇コードブック
〇実際のデータ
この3つだ。いくつか本格的に分析にかける前にやるべきことを書いてみたい。


  • 3点セットから分析の内容をおおまかに決める

 ここで大事なのは、緩めに研究内容の枠を設定することである。
ガッチガチに「この変数とあの変数から、こういう分析をしたい」と考えても
実際のデータは、欲しい変数がない場合が多い(特に社会学系)。
従って緩めの枠を想定(ここでは何となく「親の状況と子供の学力」みたいな)しておいて
あとはどんなデータが実際に存在するのか、
存在するデータをみてから、研究の方向を絞り込んでいく。
やっぱりデータが何もないと、手も足も出ないということがあるので。



  • コードブックと質問用紙を見ながら、使えそうなデータを探す

 まず親に関する変数を挙げてみる。コードブック読み読み。
いくつか挙げてみよう。
〇母親の職業
〇母親の就業状態
〇母親の最終学歴
父親の職業
父親の就業状態
父親の最終学歴
〇両親の最終学歴(381行目)
これくらいは使えそうだが、質問用紙には「両親の最終学歴」なんて聞いていないので
この変数は後でどういう定義か後で確認しておく。
 
 ターゲットとなる変数は子供の学力なので、テストの点数を持ってくればよい、…のだが
数学、理科、国語とも、点数が5つある。
数学の点数は657~665列、666~674列、675~683列、684~692列、693-701列、この5つである。
理科も国語も同じ具合だ。さぁどうしたものか。。。

続きはまた次回。

*1:広い意味では分析だけどね