清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

案例名称

OCR审单平台,打造OCR“训管用”综合服务体系

案例简介

广西北部湾银行OCR审单平台项目旨在通过OCR+NLP技术充分挖掘行内非结构化图像数据的应用价值,构建模型训练+模型管理+模型应用OCR服务体系。通过平台输出模型训练、管理、应用综合能力,高效响应行内凭证、单据、票据、合同等文件OCR识别模型样式多、更新迭代快需求,推进OCR模型在智慧运营、智慧信贷、智慧办公等方面落地应用,助力非结构化数据赋能业务流程再造,加快全行数字化转型进程。

创新技术/模式应用

广西北部湾银行OCR审单平台包括模型训练平台、模型集中管理平台、模型应用发布3大模块,对OCR模型“训”“管”“用”“优”全生命周期开展管理及应用。

一、OCR+NLP训练平台,降低模型研发门槛。OCR审单平台内置算法类型覆盖90%以上银行业务场景的非结构化影像及文件类型,包括但不限于业务单据、单证、票据、合同类长文本等,以深度学习网络对各类银行业务单证的原始图像进行特征学习。平台支持锚点、KV、NLP模型构建方式,提供全流程可视化操作界面,行内业务人员可自主完成固定版式、非固定版式OCR模型开发、训练、调优。

二、自动预标注,提升数据标注质效。OCR审单平台支持以传统数据导入人工标注方式进行训练数据标注。此外,平台基于内置高性能预训练模型,实现通过模型对导入样本数据进行预标注处理,预标注处理后的数据可进行手工调整标注结果,数据标注人员仅通过核对预标注结果即能完成数据标注工作,大幅度提高数据标注人员的工作效率,进一步确保数据标注结果的准确性。

三、统一管理,降低模型维护成本。OCR审单平台可对存量及新增模型进行集中管理及发布,实时监控各OCR模型调用情况,提供统一对外接口供行内各关联系统调用,以可视化图表形式展示不同渠道、不同模型调用情况,打通OCR模型使用壁垒,降低OCR模型复用及迁移成本。

四、自主设置规则,拓展模型应用场景。OCR审单平台支持可视化配置比对规则,实现以图形化的操作完成识别结果的逻辑处理,输出规则比对结果可直接供下游系统使用,替代用户对不同识别结果初步的逻辑处理工作。平台配置低代码模块,即用户可根据实际业务建模需要,将多个模型通过可视化托拉拽的方式将模型串并联组合应用,实现“一模型,多功能”。

五、用训一体化服务,满足新业务缺样本场景及模型自动化迭代的需求。OCR审单平台通过与行内业务系统打通,搭建生产数据回流机制。用户可按需选择将实际工作流中识别错误的源文件,或全部参与识别的源文件回流至平台,通过系统之间交互收集模型优化样本数据,满足缺样本场景下模型迭代升级需求。同时,平台支持对少量真实样本学习生成虚拟数据,采用真实+虚拟数据混合训练模式完成OCR模型开发。

项目效果评估

广西北部湾银行OCR审单平台项目通过降低图像识别模型研发门槛,综合提升行内OCR模型应用及管理能力,实现模型训练低门槛、数据标注高效率、模型开发降成本、模型管理成体系、场景应用高响应的应用效果。

一、提升模型自研能力,降低开发成本。OCR审单平台引入了国内领先的深度学习框架和图像识别算法,降低图像识别技术应用门槛。依托平台,用户可进行数据标注、模型训练、模型后配置等操作自行完成定制化单据、凭证OCR识别模型训练与开发,一定程度上缓解传统依赖外部合作方进行OCR识别模型开发局面,可节约80%模型购置费用,降低新场景下的OCR模型研发成本。同时,平台支持生成虚拟样本,最少只需提供1张样本即可生成虚拟数据样本,多渠道响应缺样本场景下OCR模型开发需求。

二、缩短模型应用周期,提升对应用场景支撑效率。银行业务单据凭证具有种类多、样式更新快等特点,采用自训练模式进行OCR识别模型开发,能够迅速响应文档格式内容更新后的OCR识别需求,在原模型基础上进行增量训练即可完成模型版本更新。通过自研模式开发应用OCR模型周期缩短至2周,配合关联改造,训练模型约4周即可投产使用,模型应用效率提升3倍以上,大幅度缩短新OCR模型研发周期。

三、训、管的统一管理,构建了一体化的管理及应用闭环。一是在模型训练支撑的基础上,OCR审单平台建立将对行内各个OCR图像识别模型进行统一管理,提供OCR模型调用统一出入口,并为所纳管的识别模型提供试用及接口文档更新储存模块,便于业务人员和技术人员进行效果评估与开发对接,实现模型集约化管理和简易复用的应用效果。二是平台支持数据回流,通过场景应用实践,不断回流数据至训练平台,形成训练及数据闭环,不断提升模型识别率。三是OCR审单平台提供可视化实时监控界面对模型运行情况进行跟踪,分析模型识别效果,模型管理人员通过界面及时掌握模型运行情况。

四、贴合场景应用的平台服务,高效响应了业务场景的应用。OCR审单平台内置可视化配置规则集模块,提供界面便于用户以可视化配置的操作完成识别结果初步逻辑处理,通过系统进行规则判断可替代识别结果简单人工校验比对工作,由纯人工核验模式转化为人工复核模式,减少了简单重复工作流程中的人力投入,同时提高了识别结果应用的精确性,信息录入及使用效率提升300%以上,拓展OCR能力在各应用场景的深度应用。

项目牵头人

粟尉廷 数字金融管理部总经理

项目团队成员

周锋、姜雄飞、谢彦、郭健、肖卓、黄丹、杨维、韦韵、黎雯雯

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。