jSTAT MAPを使ってみる

gaccoの「誰でも使える統計オープンデータ」でちょっと勉強してみた*1ので,jSTAT MAPにユーザ登録して,少々使ってみました。
自分でデータを用意しなくても,登録されているデータ(=国勢調査結果など)で人口総数のレベルなどでグラデーション表示された地図グラフがプロットできるのはなかなか面白いです。
しかし,そこから一歩進んで,人口総数や65歳以上人口×何かをかけあわせて見ようとすると,なかなか難しいです。
かけあわせて見たい「何か」の外部データを用意するのが結構大変なのですよね。
その「何か」の外部データは,

  • 完全な住所(所在地)が入っている
  • 緯度経度データが入っている

いずれかの条件を満たす必要があります。
また,もともと国勢調査データが備えつけであるといっても,外部から国勢調査のデータ,例えば市町村別になっている何かを読み込ますということも,ちょっとできなさそうでした。
jSTAT MAPは地図ゆえデータ量が大きい→サーバに負荷が掛かる→日本全体とか大きな範囲には対応していない→市町村別といった粒度の比較的大きいデータは受け付けない?
ただ,これはまだ私が使いこなせていないだけであって,勘違いしているかもしれませんので,間違っていたらすみません。

まあともかく,
「誰でも使える統計オープンデータ」講座で出てきた以外の使い方をしてみようと,同じく講座内で誰でも使える自治体オープンデータ例として出ていた京都市オープンデータポータルサイトから,京都市営地下鉄の駅情報&最近の乗降客数のExcelファイルをダウンロードして,
駅別乗降客数×人口総数250mメッシュ(国勢調査データ)
の地図グラフを作ってみることにしました。
前述のように,駅情報を外部データとしてインポートさせるには,何らかの位置データが必要だったので,まず,地下鉄駅の「住所」データがないか探したのですが,どうもはっきりしなくて,断念しました。
次に緯度経度ですが,どうすれば??とぐぐってみたら,
住所やランドマークから緯度経度を求めてくれる,Geocodingというサイトを見つけ,これで各駅ちまちまと検索→緯度経度をインポート用csvファイルにコピペしました。
次に,jSTAT MAPへのインポートなのですが,マニュアルを見ると,緯度経度は「経度」「緯度」の順番に,末尾の2列にしておく必要がありましたので,そのように整え,インポートしてみたのですが,なかなかうまくゆきませんでした。
マニュアルを再度見ると,データの2行目に,文字列データの列はS,数値データの列はNと入れると書いてあったので,修正後トライするも,また失敗。数値データに文字列が含まれているとかエラーが出ます。
csvファイルはExcelで編集していたのですが,どこかに半角スペースでも含まれているのかと,検索してみましたが,それは無し。
ではではと,テキストエディタcsvを開いてみると,乗降客数の後ろに半角スペースが含まれていました。何でだ~
それらをすべて削除して,再度インポートしてみましたが,また,数値データに文字列が含まれていますとのエラー。
もともと京都市サイトからDLしたままでバリアフリートイレ設置の有無など,ちょっと余分な要素が残ったままだったので,思い切ってそれらの項目をバッサリ削除して再度インポートしてみたら,何とか無事通りました。
京都市営地下鉄の各駅の乗車(黄)・降車(緑)×H27国勢調査による250mメッシュ人口総数(赤が濃いほど人口多)の地図です。
f:id:lionus:20170726004811p:plain
人口が多いからといって乗降客数も多いとはいえないように見える一方,阪急,JR,近鉄といった他社線乗換駅の乗降客数が圧倒的に多いです。
つまり,あちこちの各人最寄駅から阪急,JR,近鉄といった他社線に乗り換えるというパターンがはっきり見て取れるようです。
だからといってそれは,分かり切ったことじゃないかと言われそうですが(^^;)

*1:受講時期が遅かったため,毎回の確認テストの提出期限を過ぎていて,受講のみで修了証は出ない