曲線相関?擬似相関?と相関係数と偏相関係数の例題。
目下一生懸命心理統計系の授業資料を作成中なのですが,教材で使うデータ例を探す(作る)のに案外苦労しています。
例えば,曲線相関とか,抽象的には何例か思いついても,実データとして例示するのは難しいんですよね~
必ずしも心理データではないですが,例えば,時刻と列車乗客数とか。U字型の散布図になりそうじゃないですか?じゃあそういうデータを探そう,と思ってもどこを探したらよいのやら。授業ではまた別なものを探して,散布図を提示できましたが,なかなか。
そういうことをやってる中で,記事タイトルの内容を色々含む&公開データで自由に使えるものを発見したので,覚書兼ねて書いておきます。
携帯電話の普及につれて,街中の公衆電話が少なくなったように思いませんか?
ということで,総務省のデータを使って,
公衆電話設備数の推移(平成28年度末時点)
携帯・PHSの加入契約数の推移(単純合算)(平成29年9月末時点)
平成12年度~平成28年度の携帯電話契約数と公衆電話設備数の相関係数を出したところ,r=-0.933 で,予想通り強い負の相関でした。
さらに,加入電話(固定電話)も加えた三つ組みで相関をみたところ(データは携帯電話と同じページ「分野別データ:通信:契約数」からDL),
携帯電話×公衆電話:r=-0.933
携帯電話×加入電話:r=-0.978
公衆電話×加入電話:r=0.865
となりました。
携帯電話と加入電話が強い負の相関なのは,携帯電話におされて加入電話が減っているという最近の実感(携帯があれば固定電話いらないな~)に一致しますが,公衆電話と加入電話は強い正の相関?というのは少し意外でした。
ここで,携帯電話は公衆電話と加入電話どちらにも強い負の相関なので,もしかすると公衆電話と加入電話は携帯電話の影響による擬似相関かもしれないと,携帯電話を制御変数にして,公衆電話と加入電話の偏相関係数を求めたところ,-0.625 で,負の相関となりました。つまり,携帯電話の影響を取り除くと,加入電話が増えれば公衆電話が減るという関係で,まあ自宅で固定電話が使えれば,公衆電話を使う機会少ないと思うので,そういうものかもしれないとある程度納得。
ここまでで,擬似相関と偏相関係数の例題としては結構面白かったのですが,まだ何となく気になったので,H12~H28よりもよりデータを増やす=長期間のデータで見てみたいなと,ぐぐってみましたが,案外なかなか出てこず,あきらめかけたとき,総務省統計局のページがひっかかってきて,昭和60年~平成28年までのデータを確保することができました。
日本の長期統計系列 第11章 情報通信 11-4 電気通信サービスの加入等の状況
S60~H28のデータで,加入電話と公衆電話の散布図を作ってみたら,みょーな形なのにびっくり。
半分右上がり,半分右下がりの逆U字型ともとれるし,何ともいえない感じです。
そこで,時系列を見てみようと,S60~H28の携帯電話,公衆電話,加入電話の二軸の折れ線グラフを作ってみたところ,平成7年からの携帯電話の急増が,何かの区切りになっていそうです。
平成7年といえば,阪神・淡路大震災が発生した年です。
当時,地震発生後,電話回線の輻輳により電話がつながりにくくなったときにも携帯電話は比較的つながりやすかったことから,携帯電話の有用性が認められ普及率が上がったといわれています。
携帯電話は(中略)当時、普及の進展期にあった。この結果、地震発生直後から、被災地では安否確認、緊急通信、受話器はずれ等のため通話量が急増し、電話回線が輻そうしたものの、初期数日、携帯電話は一般電話より通じやすかった
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h23/html/nc143d00.html
兵庫県では、阪神・淡路大震災後、携帯電話に対するニーズが高まり、携帯・自動車電話の加入者の増加率が全国の増加率と比べても大きくなった。
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h23/html/nc143d00.html
平成7年を境に,加入電話や公衆電話に対する,携帯電話の影響の質が変わったとみて,データを分析しなおした方がよさそう,ということで,データをS60年~H6年,H7年~H28年の2つに分けて再分析してみました。
S60~H6:
携帯電話×公衆電話:r=-0.549 弱い負の相関
携帯電話×加入電話:r=0.852 強い正の相関
公衆電話×加入電話:r=-0.663 弱い負の相関
- 家に固定電話があれば,外で公衆電話はあまり使わない
- 昔の携帯電話は,ビジネス利用や一部の富裕層?加入電話と携帯電話の両方持ち?
H7~H27:
携帯電話×公衆電話:r=-0.965 強い負の相関
携帯電話×加入電話:r=-0.963 強い負の相関
公衆電話×加入電話:r=0.852 強い正の相関(携帯電話を制御変数にした偏相関係数は-0.174)
以上,擬似相関&偏相関係数の例題というだけでなく,層別にデータを分けて再検討することも必要という相関係数の総合例題になりました。
よかったよかった。