将表格图像转换为 CSV 格式
此范例演示如何使用图像处理功能将表的图像转换为可轻松操作的 CSV 文件。
在此表中,水平和垂直网格线比单元格的背景更暗。FindPeaks 用于查找这些网格线的位置。getGridLines 将返回包含行和列网格坐标的两个列表的列表。
然后可以基于这些坐标对图像进行分割。一旦图像被分割并进行一些小的清理,TextRecognize 就可以完成繁重的工作。
此数据现在可以导出为 CSV。导入 CSV 数据时,会自动解释数字,您可以使用标头构建 Dataset。
首先,在继续之前导入完整数据。
现在,您可以将美国人口的第一行与原始图像进行比较。
看起来这里的所有数据都匹配! 要检查其余数据是否也匹配,您可以获取除第一行之外的所有列的总和,并查看它们是否匹配。
事实证明他们完全匹配!