文字识别
from ascript.ios.screen import Ocr
从屏幕图像中识别文字
百度V3
Ocr(
rect: tuple = None,
pattern: str = None,
confidence: float = 0.1,
image=None,
image_file: str = None).paddleocr_v3()
- 参数
参数 | 类型 | 是否必填 | 说明 |
---|---|---|---|
rect | list | 否 | 圈定屏幕范围 |
pattern | str | 否 | 正则表达式 |
confidence | float | 否 | 可信度,默认0.1 |
image | PIL.Image | 否 | 要识别的图片,默认屏幕截图,如果file参数不为空,则优先使用file |
image_file | str | 否 | 要识别的图片路径,优先权大于image参数 |
- 返回值
文字结果字典[]
文字结果字典属性:
text 识别到的文本
rect 识别到的范围
center_x,center_y 识别的文字中心点坐标
confidence 可信度
- 示例
from ascript.ios.screen import Ocr
res = Ocr(rect =[42,153,641,694]).paddleocr_v3()
if res:
for r in res:
print(r['text']) #打印出文本
print(r['rect']) #范围
print(r['center_x'],r['center_y']) #识别范围
print(r['confidence']) #可信度
TomatoOCR
第三方作者的OCR,识别精度高.
该ocr为付费插件,具体资费请联系https://www.52tomato.com
from ascript.ios.screen import TomatoOCR
TomatoOCR.find_all(license: str,
model_path: str,
mode="dev",
rec_type="ch-3.0",
box_type="rect",
ratio=1.9,
threshold=0.3,
return_type="json",
binary=0,
run_mode="slow",
ocr_type=3,
bitmap=None,
file=None,
capture=[],
text="",
texts="",
remark="",
http_interval_time: int = 28800):
参数
- license:(必填)许可证,官网https://www.52tomato.com
- model_path: 模型路径
- mode: "dev"
- rec_type:(可选) 模型类型,默认 ch-3.0,除此之外还有 ch-2.0, ch, cht, japan, korean
- box_type | 可选 | 调整检测模型检测文本参数- 默认"rect": 由于手机上截图文本均为矩形文本,从该版本之后均改为rect,"quad":可准确检测倾斜文本
- ratio | 可选 | 调整检测模型检测文本参数 - 默认1.9: 值范围1.6-2.5之间,可调整文本检测框大小
- threshold | 可选 | 识别得分过滤 - 默认0.1,值范围0.1-0.9之间
- return_type | 可选 | 返回类型 - 默认"json": 包含得分、坐标和文字;"text":纯文字;"num":纯数字;自定义输入想要返回的文本:".- ¥1234567890",仅只返回这些内容
- binary |可选|增强型二值化,值范围0-255,搭配测试应用使用
- ocr_type |可选|默认为3;type=0 : 只检测 type=1 : 方向分类 + 识别,截取单行文字识别; type=2 : 只识别,截取单行文字识别;type=3 : 检测 + 识别;
- run_mode |可选|默认为slow;slow : 小图上速度稍慢准确率稍高; fast : 小图上速度稍快准确率稍滴;
- bitmap、file、capture:三选一,其中file为图片路径;capture为截图区域,例:[0,0,300,100]
- text|可选|找字,返回的是找字的中心点坐标[x,y],找不到返回“”空字符串,真实值请加上截取图片的前两个值
- texts|可选|找字,返回的是所有找到的字的数据
- remark|可选|添加备注,可以在控制台中设备列表查看
使用案例
# 使用案例
from ascript.ios.screen import TomatoOCR
res = TomatoOCR.find_all("22fe21448bb74b549bb87ca37b52f444|Y8DEOAVUKO3XGJH3V7T5BHBM", model_path=R.res('lib'))
print(res)