百度AI开放平台——教学视频——基础视觉

AI百科4个月前发布 快创云
69 0

OCR(Optical Character Recongnition):图像文字识别——让计算机和人一样看图识字的人工智能技术。

OCR API接口整体架构图

算法架构:

系统架构:

文字识别服务–性能数据

深度学习算法——>数千万PV产品群——>千万级别训练数据——>深度学习算法

语种支持:支持中、英、日、韩、葡、德、法、意、西、俄等十国语言

系统性能:平均耗时500ms

支持产品线:手机百度、百度钱包、百度糯米、百度外卖、百度翻译、百度贴吧、百度推广、涂书笔记、百度地图、百度图片搜索等

文字识别服务–技术优势

公开数据集指标:ICDAR竞赛5项世界第一

OCR功能介绍

通用OCR:多项ICDAR指标世界第一,支持10多种语言的识别,识别率90%以上。

身份证OCR:可识别所有字段,对倾斜、暗光、曝光、阴影等异常情况稳定性好、识别准确率高达98%以上。

银行卡OCR:可准确识别所有主流银行卡,识别率高达98%以上。

(Demo入口:​​​http//ai.baidu.com​​​)

现有的通用OCR技术无法找到“字段名”和“字段值”的对应关系。

使用字段之间的相对位置关系,结合百度强大的NLP技术,实现“字段名”和“字段值”的匹配输出。

1.全场景——用户自主定义识别模板,轻松适配所有场景。

2.简单易用——界面花的模板制作过程,5min即可完成一个模板的制作。

3.更智能——对旋、扭曲的图片进行智能的图片矫正。

​​http//abcinstitute.baidu.com/pages/index.html#/video/?courseId=&elementId=222-e9c7-4f6b-82de-bea1071d2837&userId=25&groupId=8&_k=kgn6cb​​

​​http//abcinstitute.baidu.com/pages/index.html#/video/?courseId=&elementId=e8d488d5-474e-4b90-97c6-754e000c8e80&userId=29&groupId=4&_k=c3tdur​​

© 版权声明

相关文章