现在的 AI 文字识别的技术里,有多少是继承了 OCR 的技术?还是说直接跳过了它

2023-05-30 13:48:33 +08:00
 kylebing

在 AI 没有兴起之前,OCR 技术应该是差不多的机械判断,根据相似程度选择最佳匹配字符。
那么现在的 AI 有没有用到 OCR 技术,或者说原来的 OCR 技术有没有助力 AI 相关的技术?

还有一个问题是,现在电脑端微信收到图片后,能直接选择图片中的文字,这个技术就是如何实现的?
是微信服务端处理的还是客户端这边处理的?

1410 次点击
所在节点    问与答
8 条回复
cpstar
2023-05-30 13:54:52 +08:00
打开任务浏览器,WeChat 子进程赫然一个 TecentOCR
lakehylia
2023-05-30 14:03:01 +08:00
说个冷知识:腾讯的 OCR 有过滤的,命中了黑名单的图片,你识别不出来文字的哦
beimenjun
2023-05-30 14:05:23 +08:00
OP 这种属于技术名词指代都没搞清楚吧……

AI 是一个泛指,是广泛概括各种研究和开发领域的术语,核心目标是通过使机器模仿人类智能行为,并实现人类智能一些方面完成一些任务。

OCR 属于计算机视觉( CV )的应用,计算机视觉是 AI 的一个重要分支。
Tink
2023-05-30 14:08:22 +08:00
ai 不是人工智能吗,跟 ocr 没关系吧
Tink
2023-05-30 14:09:25 +08:00
如果非要说有关系,传图总结提炼文字大意算是有点吧
kylebing
2023-05-30 14:21:10 +08:00
vicalloy
2023-05-30 14:24:51 +08:00
如果你的 AI 指的是机器学习,那“几乎”完全没有关系。
现在基于机器学习的文字识别和传统的 OCR 是完全不同的技术体系,“几乎”不存在任何相似性。

这里用“几乎”是因为一些识别前可能需要对图片做一些预处理,比如将彩色图片转成灰度图片等。
另外基于机器学习的代码,核心代码的代码量都非常的小。感兴趣的话可以找个简单的自己看看。
manasheep
2023-05-30 14:28:48 +08:00
OCR:光学字符识别是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。

你用 AI 也绕不开光学这部分啊,只是识别算法进化。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/944177

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX