データ分析:「分けて比べる」と「複数の要素を一緒に並べる」。

昨日書いた記事の続きです。
lionus.hatenablog.jp

その,2つ(以上)の変数の関係性を調べることがデータ分析としてここからの話をすすめるよ!として,クロス集計と平均値の比較に進む作りにしてみました。

https://lionus.hatenablog.jp/entry/2019/12/29/175817

受講生は必ずしも統計学の基礎知識を持っているとは限らない(「心理学研究法」履修の前提条件ではない)ため,いきなり「クロス集計と平均値の比較」は苦しいかと思い,その前にグラフを使ったデータ分析初歩みたいな内容をワンクッション置くことにしました。
データからExcelでグラフを作成して読み取りと考察をするというのは,(情報)リテラシー系の授業の持ちネタとしてずっとやってきているのですが,今回データ分析について検索して出会ったページを見て,
www.dsk-cloud.com

「分けて比べる」と「複数の要素を一緒に並べる」というフレーズを思いつきました。
以前から「分けて比べる」はデータ分析について授業する際にずっと言ってきていたのですが,今回初めて「複数の要素を一緒に並べる」というのを思いつき使ってみることにしました。

まず,「分けて比べる」データ分析とは,1つのデータを,例えば男女など分けて比べて何らかの知見を引き出すものです。
もうひとつの「複数の要素を一緒に並べる」データ分析では,出所の異なるデータを,ある軸,例えば2018年などに揃えて並べて比べるものです。

f:id:lionus:20191230131729p:plain

以下にそれぞれの例を示します。

  • 「分けて比べる」データ分析例

内閣府の「治安に関する世論調査」データより
https://survey.gov-online.go.jp/tokubetu/h29/h29-chiang.pdf
最近の治安に関する認識「あなたは、ここ10年間で日本の治安はよくなったと思いますか。それとも、悪くなったと思いますか。」に対する回答,男女別に分けて比べます。

f:id:lionus:20191230132103p:plain
「よくなった」「どちらかといえばよくなった」が合わせて男性で4割を超えるのに対し,女性では3割にも達しません。反対に「悪くなった」「どちらかといえば悪くなった」が女性では約7割と,男性の5割あまりに対し多くなっています。つまり,女性の方が治安は「よくなった」と思わず「悪くなった」と思う割合が多く,性別による差があります。性別と最近の治安に関する認識に関係があるのではとみることができます。

上記は多肢選択式への回答比較ですが,次はマルチアンサー形式の回答比較例です。
「自分や身近な人が,犯罪にあうかもしれないと不安になる場所」について,あてはまるものすべてを選び回答してもらった結果を,男女別に分けて比べます。

f:id:lionus:20191230132436p:plain
男女ともに「インターネット空間」が6割前後でもっとも多いですが,男女差はあまりありません。2番目の「繁華街」のみ男性の回答が10ポイント多い以外は,不安に思う場所は女性の方が多く回答しています。
「インターネット空間」については,顔の見えないバーチャル空間ゆえに,男女差がほぼないのかもしれない,なぜ「繁華街」だけ男性の回答率が多いのか?とか,回答率は比較的多くはないものの,エレベーターは女性が男性の2倍ほどの回答率で男女差が特に大きく,他人と密室で二人きりになる不安は,やはり女性の方が強く感じるのだなとか,分けて比べてみると色々と考える材料が出てきます。

  • 「複数の要素を一緒に並べる」データ分析

出所の違うデータ,今回は気象庁サイトから2018年月別の平均気温(東京)のデータと
http://www.data.jma.go.jp/obd/stats/etrn/view/monthly_s1.php?prec_no=44&block_no=47662&year=2018&month=&day=&view=
総務省統計局「家計調査」結果データ(家計調査(家計収支編)時系列データ(二人以上の世帯)月・全品目(2015年基準))のうち2018年月別のデータを使います。
https://www.stat.go.jp/data/kakei/longtime/index.html#time

まず,2018年の1月から12月という基準で揃えた,平均気温とアイスクリーム・シャーベットの購入金額を折れ線グラフで一緒に並べてみました。

f:id:lionus:20191230133646p:plain
気温が上がればアイスも上がり,気温が下がればアイスも下がる相関関係がありそうなことが分かります。

次は,上記のアイスをビールの購入金額に差し替えてみた折れ線グラフです。

f:id:lionus:20191230134030p:plain
気温が上がればビールも上がる,気温が下がればビールも下がる。アイスと同様に気温とビールも相関関係がありそうですが,12月は気温が下がるのに,ビールがぐっと増えていて,逆の動きになっています。どうもビールは気温と相関関係があるだけでなく,忘年会やお正月準備などの季節イベント要因も影響がありそうです。

といった感じで,上記気温とアイス&ビールについては散布図と相関関係について説明してもいいかな~と思っていたのですが,内容分量が膨れ上がってきそうなので,今回はとりあげないことにしました。