清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

案例名称

银联商务OCR文字识别平台项目

案例简介

银联商务引入译图智讯OCR智能识别平台及多项核心识别能力,并作为“银商大脑2.0”的核心之一,实现了对文档、票据、卡证的关键信息自动识别录入,为商户服务、智慧城市建设、普惠金融等领域提供了数智化识别解决方案。

译图智讯与银联商务深度合作,打造了自主可控的文字识别能力基石,满足了“新支付”中各业务场景的定制化、多元化需求,使企业针对新场景新需求也具备快速响应文字识别能力,助力企业业务释放劳动力,降低风险。

合作

创新技术/模式应用

创新模式:

银联商务文字识别项目应用的文字识别平台,集OCR识别、NLP自然语言处理、深度学习、智能文档处理等多项核心技术研发,是多种识别模块于一体、可自主进行模型管控的识别平台,包含文档通用识别、表格识别、卡证识别、票据识别等全品类识别产品,其识别服务具有多场景、多应用、多部署方式、高精度、高速度、高稳定性的特点与优势。

通过提供管控平台、模型推理端源码,企业可根据模型结构、推理过程及其它功能,实现OCR识别模型的自主可控,研发属于自己的OCR识别能力,并共同进行技术创新,探索OCR识别的更多可能性。

识别平台

创新技术:

译图智讯OCR识别平台深度学习技术的应用,使OCR识别性能得到了跨越式的升级。深度学习OCR借助神经网络可模仿人脑机制对图像、文本等数据进行分析,更加可靠、快速地完成海量样本的训练,得到近似专家能力的最优模型,同时在低质量图像、生僻字、非均匀背景、多语言混合等复杂场景中实现了高效精准的识别与分类。

图像分类

NLP智能提取技术的研发,实现了文档图像的关键信息分析和提取,可自动从非结构化信息中提取目标数据,可满足所有文本的关键信息提取需求。通过模型管控,企业可通过少量样本,高效完成模型的标注训练,自定义创建提取模型。

训练过程

训练平台

通过不断技术创新,译图智讯OCR识别产品性能一直处于行业领先地位,识别率高于99%,识别平均耗时低于200ms,并可针对证件更新进行快速响应推出新产品。

银联商务部署OCR识别平台之后,一方面可以整合资源,向总公司各部门、各分支机构,以及外部合作单位,提供公有云接口输出或者本地化部署服务;另一方面可以助力金融业务办理流程的降本增速,提升业务能力,提高客户体验感。

项目效果评估

业务痛点:在财务报销、商户入网、远程开户、用户注册等场景中,存在海量的卡证、票据、表单、合同需要审核,这些纸质资料易丢失、损坏,不易保存和传递,在传统管理方式中,企业一方面采用人工录入的方式进行信息审核、存档、业务办理,但因内容较多、需录入字段繁杂,并且常含有表格、印章等复杂因素,还要面对模糊不清、光斑折痕、倾斜旋转等低质量图片,人工操作面临着耗时长、易出错、风险高、成本高的问题;一方面使用图片的形式进行存储,导致系统里都是非结构化文档,无法检索并且不易传递,对后续的相关工作造成诸多不便。

解决方案:引用OCR识别平台后,通过计算机代替人工操作,实现了全票据、人证、车证、企业证件、各类文档的信息自动识别、自动分类、自动录入,可将纸质文件的数据信息转换成计算机可编辑的结构化数据,工作人员只需上传文件即可实现一键识别、一键录入、一键分类,节省了95%以上的工作量。针对关键字段审核难题,也可通过关键点的标注训练,进行关键词的提取审阅和系统录入,真正做到对文档凭证的高效管理,提高了业务办理流程的电子化、数据化能力,使得用户业务办理更便捷、更安全、更高效,节省的人力时间成本可创造更多价值。

效果数据:应用OCR文字识别平台代替人工操作后,一秒钟可完成三张卡证的识别审核,单页文档识别只需要2-3秒,业务办理审核效率提升几十倍,新商户入网达200多万家。如今,银联商务布设的百万级海量终端已全面拥抱互联网,实体服务网络覆盖中国大陆所有地级以上城市及港澳地区,并拓展至96%的县域,在线上和线下的支付场景中形成了完整的服务能力。

项目牵头人

陶坚坚 项目经理

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。