英国の土地登記所の公開データを解析する
この例では,過去25年間ほどに渡る英国での所有地の取引すべてを含むデータ集合に対してデータ解析を行う.これはかなり大きなデータ集合であり,英国における住宅市場についての興味深い情報を含む.
英国の土地登記所のデータは,オンラインで無料公開されている.このデータは,ここに記載される指示に従って,PostgreSQLサーバに簡単にロードすることができる.
これをEntityStoreとして登録する.
いくつの記録があるかをすぐに見ることができる.
2400万を超える行の3GBを超えるデータである.
最も地価が高い都市を計算する.
Interpreterを使って,これらの都市がどこにあるかを調べることができる.
これらの位置を地図上に描く.
大きな外れ値Gatwickがある.そこで何が起こっているのかを調べる.
Gatwickには非常に少ないデータ点しか含まれていないようである.データにフィルタを掛けて,100個を超える取引があった都市だけに絞る.
それらの位置を地図上に示す.
これらの都市はすべてロンドンの郊外である.年の経過とともに値段の変化を調べ,ロンドン郡について詳しく見てみる.
それを国の残りの地域と比べる.
ロンドンは,2008年の景気後退でも他の地域と比べるとあまり影響を受けなかったことが明らかである.