利用python提取一串字符中的汉字
事情缘由
闲来无事翻了翻电脑,找到了去年在政府实习的时候敲的几行简单却很实用的代码,当时正值人口普查准备阶段,需要我们把所有的住户给划分好区域标好姓名,这听起来简单,划分区域就跟抠图一样,标名字就是打字呗,但是做起来却真的是枯燥乏味,毕竟好大一个乡镇多少住户哇。于是想来先去区域肯定要自己手画的,但是名字可以不用自己一个个打,正巧当时的主任给了一份其他的区域住户图,只不过上面还标着其他符合,于是我灵机一动,先用OCR软件把图中所有字符提取出来,然后过一遍自己的程序把住户名字(也就是汉字给提取出来)。OCR软件网上一大堆就不去细说了,下面就分享一下代码和功能
功能介绍
- 1.双击打开保存好的demo.py文件,可以直接Ctrl+V粘贴文字,也可以
手打
- 2.回车即可看到提取好的文字,并且文字自动复制到了剪切板上

相关代码
1 | import re |