表の画像をCSVに変換する
この例では画像処理機能を使って,表の画像を簡単に操作できるCSVファイルに変換する方法を示す.
この表の縦線と横線はセルの背景色よりも濃い.FindPeaksを使ってこれらの格子線の位置を検出する.getGridLines は行および列の格子座標をそれぞれ含む2つのリストのリストを返す.
画像はこれらの座標に基づいて分割することができる.一旦画像が分割されると,TextRecognizeがクリーンアップも含む難しい部分を行う.
これでこのデータはCSVにエキスポートできるようになった.CSVデータをインポートするとき,数値は自動的に解釈されるため,ヘッダ付きのDatasetが構築できる.
まず完全なデータをインポートする.
1行目のアメリカの人口をもとの画像と比較する.
すべてのデータが合致しているようである.残りのデータも合っているかどうかを調べるためには,すべての列を最初の行を除いて合計し,合計と最初の行が合致するかどうかを見るとよい.
正確に合致している.