Wolfram言語

表の画像をCSVに変換する

この例では画像処理機能を使って,表の画像を簡単に操作できるCSVファイルに変換する方法を示す.

この表の縦線と横線はセルの背景色よりも濃い.FindPeaksを使ってこれらの格子線の位置を検出する.getGridLines は行および列の格子座標をそれぞれ含む2つのリストのリストを返す.

画像はこれらの座標に基づいて分割することができる.一旦画像が分割されると,TextRecognizeがクリーンアップも含む難しい部分を行う.

これでこのデータはCSVにエキスポートできるようになった.CSVデータをインポートするとき,数値は自動的に解釈されるため,ヘッダ付きのDatasetが構築できる.

まず完全なデータをインポートする.

1行目のアメリカの人口をもとの画像と比較する.

すべてのデータが合致しているようである.残りのデータも合っているかどうかを調べるためには,すべての列を最初の行を除いて合計し,合計と最初の行が合致するかどうかを見るとよい.

正確に合致している.

関連する例

de en es fr ko pt-br zh