Skip to main content

文字识别

from ascript.ios.screen import Ocr

从屏幕图像中识别文字

百度V3

Ocr(
rect: tuple = None,
pattern: str = None,
confidence: float = 0.1,
image=None,
image_file: str = None).paddleocr_v3()
  • 参数
参数类型是否必填说明
rectlist圈定屏幕范围
patternstr正则表达式
confidencefloat可信度,默认0.1
imagePIL.Image要识别的图片,默认屏幕截图,如果file参数不为空,则优先使用file
image_filestr要识别的图片路径,优先权大于image参数
  • 返回值

文字结果字典[]

文字结果字典属性:
text 识别到的文本
rect 识别到的范围
center_x,center_y 识别的文字中心点坐标
confidence 可信度
  • 示例
from ascript.ios.screen import Ocr
res = Ocr(rect =[42,153,641,694]).paddleocr_v3()
if res:
for r in res:
print(r['text']) #打印出文本
print(r['rect']) #范围
print(r['center_x'],r['center_y']) #识别范围
print(r['confidence']) #可信度

TomatoOCR

第三方作者的OCR,识别精度高.

该ocr为付费插件,具体资费请联系https://www.52tomato.com

from ascript.ios.screen import TomatoOCR
TomatoOCR.find_all(license: str,
model_path: str,
mode="dev",
rec_type="ch-3.0",
box_type="rect",
ratio=1.9,
threshold=0.3,
return_type="json",
binary=0,
run_mode="slow",
ocr_type=3,
bitmap=None,
file=None,
capture=[],
text="",
texts="",
remark="",
http_interval_time: int = 28800):

参数

  • license:(必填)许可证,官网https://www.52tomato.com
  • model_path: 模型路径
  • mode: "dev"
  • rec_type:(可选) 模型类型,默认 ch-3.0,除此之外还有 ch-2.0, ch, cht, japan, korean
  • box_type | 可选 | 调整检测模型检测文本参数- 默认"rect": 由于手机上截图文本均为矩形文本,从该版本之后均改为rect,"quad":可准确检测倾斜文本
  • ratio | 可选 | 调整检测模型检测文本参数 - 默认1.9: 值范围1.6-2.5之间,可调整文本检测框大小
  • threshold | 可选 | 识别得分过滤 - 默认0.1,值范围0.1-0.9之间
  • return_type | 可选 | 返回类型 - 默认"json": 包含得分、坐标和文字;"text":纯文字;"num":纯数字;自定义输入想要返回的文本:".- ¥1234567890",仅只返回这些内容
  • binary |可选|增强型二值化,值范围0-255,搭配测试应用使用
  • ocr_type |可选|默认为3;type=0 : 只检测 type=1 : 方向分类 + 识别,截取单行文字识别; type=2 : 只识别,截取单行文字识别;type=3 : 检测 + 识别;
  • run_mode |可选|默认为slow;slow : 小图上速度稍慢准确率稍高; fast : 小图上速度稍快准确率稍滴;
  • bitmap、file、capture:三选一,其中file为图片路径;capture为截图区域,例:[0,0,300,100]
  • text|可选|找字,返回的是找字的中心点坐标[x,y],找不到返回“”空字符串,真实值请加上截取图片的前两个值
  • texts|可选|找字,返回的是所有找到的字的数据
  • remark|可选|添加备注,可以在控制台中设备列表查看

使用案例

# 使用案例
from ascript.ios.screen import TomatoOCR
res = TomatoOCR.find_all("22fe21448bb74b549bb87ca37b52f444|Y8DEOAVUKO3XGJH3V7T5BHBM", model_path=R.res('lib'))
print(res)