2013/09/03

眠っていたデータを目覚めさせよう! 今注目のオープンデータ活用法

目次

眠れるデータ オープンデータ

オープンデータとは:公的機関が保有している情報のうち、だれもが利活用できるデータを公開することをいいます。情報を公開することで、データを二次利用できるようなファイルシステムにより、地域の課題や問題意識が共有され、新しいガバナンス(共治)の可能性が拡がっていくことが期待されています。
(引用:流山市オープンデータトライアル

これまで、公共施設の位置情報や施設情報の公共データは、その施設を保有している国や地方自治体が独自に管理してきました。

ですが最近、この公共データを税金で作られた市民全体の財産であると捉え、インターネット上で誰もが自由に利用出来る形で公開することにより、公共データを活用した新事業の創出や官民協働の公共サービスを実現し、経済の活性化が図られることが期待されています。

つまり、

「データあるのに使わないなんてもったいない!使っていいから何かサービス作ってよ!」

ということです。

総務省としても2013年4月9日に情報通信白書(平成22~24年版)についてオープンデータ化するなど、国を挙げてオープンデータ戦略を行っていることがわかります。

ビッグデータとの違い

  • 「オープンデータって初めて聞いた!」
  • 「ビッグデータって聞いたことがあるんだけど、語感が似てない?何が違うの?」

という方が多数いると思います。
最近耳にする機会の増えたビッグデータと、今回紹介するオープンデータの何処が違うのかについて説明したいと思います。

オープンデータもビッグデータの一部ではありますが、以下の表の様な違いがあります。

ビッグデータとオープンデータの違い
ビッグデータオープンデータ
活用の目的 大量データを収集・分析することにより、新たな知見を発見する。(一般的に「事業に役立つ知見を導出するためのデータ」との側面が強い。) 行政が保有するデータを二次利用が可能な形で公開し、社会が効果的に利用し、新たな価値を創造する。
普及の背景
  • ・ストレージ・CPUの性能UP
  • ・クラウドコンピューティングの普及
  • ・大規模データ分散処理ソフトウエアの登場
  • ・インターネットの普及
  • ・行政情報の電子化
活用事例
  • ・レコメンド機能(アマゾン)
  • ・「インターナビ」の走行データを道路整備に活用 (ホンダ・埼玉県)
  • ・窃盗犯罪防止システム(米.サンタクルーズ市)
  • ・AED設置場所一覧(鯖江市、流山市)
  • ・避難所等一覧(鯖江市、流山市)
  • ・町丁別人口(鯖江市、流山市、会津若松市等)
  • ・税金はどこに行った?(OKFJ。横浜市データ利用)

(引用:奈良市ビッグデータとオープンデータの違い(270KB)(PDF文書)

このように、ビッグデータは主に民間企業が保有しているデータを指し、オープンデータは行政が保有するデータを指します。

大きな違いとしては、ビッグデータはデータを収集・分析することで、商品開発や販促活動へ活用するのに対し、オープンデータは公開することで新事業やサービスの創出を図ることが挙げられます。

ビッグデータにはこのような利用方法があるようです。
参考リンク:ビッグデータを読み解き個人旅行者の動きを解析

オープンデータを推進している団体

現在では、福井県鯖江市、千葉県流山市などの一部の自治体が、公共データをオープンデータとして公開することを積極的に推進しており、北海道室蘭市でも近日中に公開する動きがあるようです。
着々と全国各地の自治体に取り組みが広まってきています。

ここでは、千葉県流山市を例に、公開しているデータを以下の表にまとめました。

流山市が公開しているデータ一覧
公開しているデータ ファイル形式
AED設置場所 RDF/CSV/EXCEL
避難場所等 RDF/CSV/EXCEL
災害用井戸 RDF/CSV/EXCEL
公共施設所在地
・(コミュニティ施設) CSV/EXCEL
・(生活関連施設) CSV/EXCEL
・(保健施設) CSV/EXCEL
・(福祉施設) CSV/EXCEL
・(子育て施設) CSV/EXCEL
・(教育施設) CSV/EXCEL
・(青少年施設) CSV/EXCEL
・(勤労者施設) CSV/EXCEL
・(環境・清掃施設) CSV/EXCEL
・(スポーツ施設) CSV/EXCEL
・(文化施設) CSV/EXCEL
・(公園) CSV/EXCEL
・(消防・防災施設) CSV/EXCEL
・(水道施設) CSV/EXCEL
・(市役所・出張所) CSV/EXCEL
・(すべての施設) RDF/CSV/EXCEL
赤ちゃんほっとスペース(授乳・おむつ替えスペース) CSV/EXCEL
ゴミの収集日 CSV/EXCEL
ゴミの分別・処分方法 CSV/EXCEL
野外活動要貸出備品 CSV/EXCEL
文化財 CSV/EXCEL
流山100か所めぐり CSV/EXCEL
桜の名所 CSV/EXCEL
フィルムコミッション CSV/EXCEL
(CM編) CSV/EXCEL
(ドラマ編) CSV/EXCEL
(映画編) CSV/EXCEL
(その他編) CSV/EXCEL
駐輪場 RDF/CSV/EXCEL
部署の所在地・連絡先 CSV/EXCEL
公共施設Wi-Fi設置場所 RDF/CSV/EXCEL
年齢別・男女別人口比 EXCEL
町丁字別人口 EXCEL
字・郵便番号 CSV/EXCEL

また、首都圏の鉄道各社は公共交通情報のオープンデータ化を推進するとした情報も出てきており、今後は公共交通機関にもオープンデータ化の流れが広がっていくことが期待されています。

参考リンク
NHK:交通オープンデータで何が変わる?
MONOist:首都圏の鉄道会社ら、公共交通情報のオープンデータ化を推進する研究会発足

目覚めさせよう オープンデータ取得法

ではオープンデータを実際に取得してみましょう。
流山市のスポーツ施設の情報はCSV形式とEXCEL形式で公開されていますが、今回はCSV形式を利用します。

PHPを利用してCSV形式のデータを取得するソースコードがこちらになります。

<html>
<head>
<title>csv read </title>
</head>
<body>
<table border="3">
<?php 
$fp = fopen("http://www.city.nagareyama.chiba.jp/dbps_data/_material_/localhost/shisetsu_sports.csv","r");

while(!feof($fp)){
	$str = fgetcsv($fp);
	print "<tr>";
	for($i=0;$i<7;$i++){
		$str[$i] = mb_convert_encoding("$str[$i]","UTF-8","SJIS");
		print "<td>{$str[$i]}</td>";
	}
	print "</tr>";
}
fclose($fp);

?>
</table>
</body>
</html>

PHPの記述自体は簡単なものですね。 流山市のスポーツ施設情報
http://www.city.nagareyama.chiba.jp/dbps_data/_material_/localhost/shisetsu_sports.csv
にアクセスして、データを取得し、表としてHTMLに出力しています。

256列のうち、利用するデータは8列目までなので、8列目までのデータを取得しています。

また、文字コードがSJISなため、UTF-8に変換しています。

ローカルサーバ上でしか動かないので、ローカルサーバが無いという方はこちらを参考にローカルサーバを構築し、ファイルを実行してみると

このように情報が取得できます。

データ利用元:流山市オープンデータトライアル

今回はスポーツ施設の情報を取得するだけですが、これを応用し、他のデータやアプリと組み合わせて利用することで、新しいサービスを生み出すことが出来ると思います。

他の自治体でも各種データが公開されているので、活用方法を考えながらデータの取得を試すのも面白いかと思います。

まとめ

いかがだったでしょうか。オープンデータの活用法はアナタのアイディア次第で無限に広がっていきます。
オープンデータを活用したサービスやユーザーが増加することで、もっと多くの国や自治体、企業が参加することでしょう。

ちなみに、流山市ではWEBアプリコンテストとして、アナタのアイディアやアプリを募集しているので、我こそは!と思うプログラマーの方は応募してみてはいかがでしょうか。

流山市WEBアプリコンテスト(募集期間:平成25年8月19日(月)から10月18日(金)午後5時まで)
http://www.city.nagareyama.chiba.jp/10763/018001.html>