[表格扫描OCR]快速扫描识别并获取表格图⽚内容[免费]
我们常常会拿到⼀些别⼈拍照发给我们的表格。也许⼀开始我们仅仅是想知道表格⾥⾯的内容就可以了,但当我们拿到表格以后可能我们就会有更⾼的要求了,我们也许想把这个表格也打印出来。但⼜不想打印那个歪歪扭扭的表格贴在床头或者墙上。那么我们就会想到OCR识别了。
可惜,好多⼯具虽然都提供了识别功能,但对表格的识别都是⾮常的尴尬,要不就识别不了(识别结果⾥⼀堆堆的乱码),要不就是只能识别表格中的⽂字,把活⽣⽣的表格拆的七零⼋落,惨不忍睹啊,最终还是需要⼀个个把⽂字拷贝粘贴到⾃⼰⼿动画好的表格中,如果表格内容多了,想哭的⼼都有!!
⼀、发现免费的OCR
某天我也需要⼀个表格,这个时候怎么办呢,我的想法是快速得到⼀张标准的表格。我想到了腾讯的OCR在线表格识别,⽹址如下:
简单的介绍⼀下腾讯的表格在线识别功能,它包含以下五个⽅⾯的表格识别功能:
通⽤⽂字识别:通⽤印刷体识别、通⽤⼿写体识别、英⽂识别,⼆维码识别等
卡证⽂字识别:提供⾝份证识别、银⾏卡识别、名⽚识别、营业执照等
票据单据识别:增值税发票识别、船票出租⽕车票识别、机票运单识别等
汽车相关识别:驾驶证识别、⾏驶证识别、车牌识别、车辆 VIN 码识别
⾏业⽂档识别:表单表格识别、体检报告识别、检验检查单识别、算式识别等
⼆、我们来试试识别功能
我这⾥采⽤的就是第五类,⾏业⽂档识别,上传了⼀张课表,效果如下:
腾讯汽车图片
我们选择“⾏业⽂档识别”,然后在左下⾓选择上传照⽚则可得到右边的课表。当然,这⾥有些不完美的地⽅就是表格的斜线识别,这个估计是个永远的伤痛,毕竟在word或者Excel中这个斜线都是不好弄的,有的word或者excel的⽔平不⾼的⼈,估计画都画不出,就更谈不上让软件来识别并还原了。
三、如何获取⽹页上的识别内容
虽然我们得到了这个表格,我们不能让它停留在⽹页上,我们需要把它放到word或者excel中去。这⾥应该是关键步骤了。
1、双击识别结果四个字使其为选择状态
2、按shift键,拖动表格滑条到最下端,确保选择表格所有⽂字,如下图
3、打开excel,粘贴内容,如下图
上⾯的图,我们稍加整理就是我们需要的原图表格了。当然,你也可以在得到上述⽹页版表格内容后⽤专门的软件直接抓取表格内容,或者⽤excel中的从⽹页获取表格来获得,但实际按照笔者的试验,都没有上述拷贝粘贴的粗暴⽅法来的直截了当。
最重要的是,这⾥所有的功能都是免费的哦!
感谢腾讯,感谢微软,感谢CCTV,感谢中央⽓象台,提供这些现成的免费的功能。我是⼀个从来不舍近求远的⼈,有现成的功能就先⽤起来再说。