データ変容

 SPSSでは入力されたデータを利用して、値をルールに従って変更したり、計算して新しい変数を作成したりすることができます。

値の再割り当て

 分析によってはコーディングを変更して使用したいデータもあります。このようなとき、一から入力しなおす必要はありません。SPSSでは値の再割り当て機能を使用して、コーディングを変更することができます。

 たとえば、「1:賛成、2:反対、3:どちらでもない」と入力されている場合に、賛成とそれ以外の2群に分けたいとします。この場合は、「3」とコーディングされているものを「2」と再コーディングすればよいのです。また、0〜100点の素点が入力されているものを、80点以上を「1:優」、79〜70点を「2:良」・・・のように分類する場合にも、値の再割り当てが便利です。

 値の再割り当ては、「同一の変数へ」と「他の変数へ」の2つがあります。前者は、再割り当て後のデータを元の変数の値として書き直してしまうものです。ここでは、素データをできるだけ残しておくという発想で、「他の変数へ」についてのみ取り上げます。

 それでは、データ2を使用して、値の再割り当ての練習をしましょう。

 

例題1:「血液型」を「1:A型」と「2:それ以外」に分けましょう。

操作手順

1.SPSSで前回保存したdata2.savを開きます。

2.「変換」-「他の変数への値の再割り当て」をクリックして、「他の変数への値の再割り当て」ダイアログボックスを開きます。

3.変数「血液型[Q3]」を、「入力変数 -> 出力変数」ウィンドウに移動します。「変換先変数」がアクティブになるので、「名前」ボックスに「Q3R」と入力し、「変更」ボタンをクリックします。
(変換先変数の名前はQ3Rでないといけないわけではありませんが、Q3から変換された変数という意味で、習慣的にRを付けています。)

4.「今までの値と新しい値」ボタンをクリックして、「他の変数への値の再割り当て:今までの値と新しい値」ダイアログボックスを表示します。このダイアログボックスで「今までの値」と「新しい値」を設定し、「追加」ボタンをクリックして再割り当てを定義します。今の場合、「今までの値」ボックスの「値」に「1」、新しい値ボックスの「値」に「1」を入力し、「追加」ボタンをクリックします。

5.次に「今までの値」ボックスの「範囲」に「2」から「4」を入力し、「新しい値」ボックスの「値」に「2」を入力し、「追加ボタン」をクリックしましょう。

6.「続行」ボタンをクリックすると、「他の変数への値の再割り当て」ダイアログボックスに戻るので、「OK」ボタンをクリックします。すると、「データビュー」の変数の最後に、新しい変数「Q3R」が追加され、再割り当ての結果が表示されます。

7.データを保存しておきましょう。

 

例題2:「国語[Q5]」から、「1:優、2:良、3:可、4:不可」の評価を作成しましょう。

操作手順

1.例題1と同じ手順で、「国語[Q5]」から新しい変数「Q5R」を作成し、4段階評価に再割り当てしましょう。

2.「他の変数への値の再割り当て:今までの値と新しい値」ダイアログボックスの機能を効率よく利用しましょう。前の定義が残っていたら、「戻す」ボタンを押しましょう。

3.「続行」ボタン、「OK」ボタンを順にクリックして、再割り当ての結果を確認します。

4.データを保存しておきましょう。

 

注意:再割り当てのルール

  先ほどの例をみると、上図のような指定がされていました。これは、「80〜100点は1、70〜80点は2、60〜70点は3、0〜60点は4にします」という意味で記述されています。この場合、80点の人はどうなるのでしょうか?当然80点以上なので「1:優」となるべきですが、同時に70〜80点 にも含まれます。つまり、上から2行の条件の両方に当てはまってしまうので、ちゃんと判断されるのか心配です。でも安心です。SPSSの値の再割り当てのルールでは、上の条件が優先されます。したがって80点の人は、1行目の条件で当てはまったので、それ以下の条件をチェックすることなく、「1;優」と再割り当てが確実に行われるのです。

 

計算

 SPSSでは、「計算」機能を利用して新しい変数を作成したり、変数を利用した計算を行うことができます。

 

例題3:「TOEFL」の得点から「TOEIC」の得点を算出しましょう。

 英語の能力を判定する試験の代表的なものとしてTOEFLやTOEICがあります。この2つの試験は相関が高く、一方の得点から他方の得点を算出することができます。TOEIC得点は、TOEFL得点を3.8921倍し88.21を引いた数を四捨五入(SPSS関数:RND)すると求 められます。これをSPSSの「計算」で表現すると、以下のようになります。

TOEIC = RND(TOEFL * 3.8921 - 88.21)

操作手順

1.SPSSで各自が保存しているdata2.savを開きます。

2.「変換」-「変数の計算」をクリックして、「変数の計算」ダイアログボックスを開きます。

3.「目的変数」に「TOEIC」と入力します。

4.「関数グループ」ボックスの「算術」(または「すべて」でも可)をクリックして、「関数と特殊変数」ボックスの「Rnd(1)」を選択してをクリックします。すると「数式」ボックスに入力されます。キーボードから直接入力することもできます。

5.次に変数ボックスから「TOEFL[Q4]」を選択してをクリックします。数字や演算記号は、「変数の計算」ダイアログボックスの中央に用意されているボタンをクリックして、入力します。キーボードから直接入力することもできます。

6.「OK」ボタンをクリックすると、「データビュー」シートの最後に変数「TOEIC」が追加され、得点が表示されます。

 

ケース選択

 SPSSでは分析に使用するケースを選択することができます。ある条件を満たすケースのみ分析対象としたり、ランダムにケースを選択することができます。

IF条件が満たされるケース

 ある条件に該当するケースのみを選択する場合には「IF条件が満たされるケース」を利用します。SPSSは自動的にフィルタ変数を作成し、条件式を満たす場合は「1」、満たさない場合は「0」が入力されます。そしてフィルタ変数の「1」だけが、分析対象として選択され、選択されなかったケースは、ケース番号に斜線が表示されます。

 

例題4:男性のみを選択しましょう。

操作手順

1.SPSSでdata2.savを開きます。

2.「データ」-「ケースの選択」をクリックし、「ケースの選択」ダイアログボックスを開きます。最初は「選択状況」ボックスの「すべてのケース」が選択されています。

3.「選択状況」ボックスの「IF条件が満たされるケース」をクリックして、「IF」ボタンをクリックします。

4.表示された「ケースの選択:IF条件の定義」ダイアログボックスで、条件「性別 = 1」を入力し、「続行」ボタンをクリックします。

5.「ケースの選択」ダイアログボックスの「OK」ボタンをクリックすると、「データビュー」シートに戻り、男性が選択されたことが確認できます。

選択状態の解除

6.「データ」-「ケースの選択」をクリックし、「ケースの選択」ダイアログボックスを開きます。

7.「ケースの選択」ダイアログボックスの「選択状況」ボックスで、「すべてのケース」を選択し、「OK」ボタンを押します。

  (フィルタ変数「filter_$」はもう不要です。削除するには変数名をクリックして選択し、「delete」キーを押します。