清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

在这个科技飞速发展的时代,数字化浪潮席卷而来,其中,人工智能应用场景的构建成为新的科技焦点,“AI驱动的虚拟数字人”应用场景正在加速落地,逐步向互联网、文旅、金融、快消、汽车等领域加速渗透,为人工智能行业的发展带来更多想象力。

6月6日,在世优科技波塔发布会现场,世优科技韩光明作为代表,重磅发布了世优科技AI数字人多模态交互系统——波塔。“世优波塔”以技术革新突破AI交互桎梏,核心能力持续提升,升级大模型应用、系统工程和开放接口等功能及能力,打造更有温度的AI,开启下一个数字时代新纪元。

把握市场机遇

重新定义AI时代虚拟数字人

自2023年世优BOTA1.0发布以来,该创新技术产品获得了客户广泛的青睐。韩光明表示“在过往的一年中,我们成功实施了众多融合AI与数字人技术的前沿项目,有在政务展厅中讲解的数字讲解员、有在学校作为助教的AI数字教师,还有医院智能指引、数字主播自动带货等案例”,据统计世优波塔AI数字人正与数万用户产生联系。通过这些实践,不断优化算法以实现更加流畅自然的语言交流、自动化识别与响应能力,逐步深化了对AI驱动的交互式数字人解决方案的理解与应用方式。

在此基础上,世优科技对自主研发的AI数字人系统提出了新的要求,不仅要能检索思考、回答问题,还要像真人一样做到主动交互问询,实现从多轮对话、主动对话再到启发式对话的跨越,并保证互动对话的高效、精准程度。

本次推出的世优波塔,以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。世优波塔同时支持3D数字人和2.5D数字人,搭配个性化的声音服务,为不同客户不同场景应用提供满意的交互形象支持,不仅有大量的公共形象和声音供用户选择,同时也提供个性化定制能力。

世优波塔AI数字人能够更好地与用户进行沟通与连接,满足用户信息获取与情感交流的需求,帮助企业提升工作效率和用户服务体验。世优波塔不仅是技术积累与项目实施的重大成果,更是我们在推动“AI+数字人”技术迈向更高层次成熟度与商业化进程中的重要里程碑。

突破技术瓶颈

开启人工智能应用场景新篇章

为了能够帮客户实现“AI+大模型”的端到端应用场景融合,世优科技持续进行技术迭代与优化,不仅在算法层面不断突破,同时在模型部署、性能优化及用户体验上,确保高效、稳定地将人工智能成果转化为可落地的解决方案,旨在构建一个高度灵活且可扩展的AI应用框架,从而助力企业级用户把握“AI+多模型”的先机。

●          优化3D表情生成算法,让数字人拥有更丰富的表现力

世优科技对3D表情生成的算法结构和算法工程,进行总体优化提升,让单个数字人头部拥有182个精细控制点,这一设置超越了传统基于20个音素的系统或52个基本混合形状的方法,182个控制点可以提供更准确的控制能力和更丰富的面部表情捕捉,促进了面部动画的真实感与表现力,特别是在微妙表情的传达上。

同时进一步提升效率与响应速度,目前可以达到在1秒之内完成20秒音频输入推理工程,这一成果不仅保证了AI数字人在实时交互应用中所需的高速反馈,还降低了资源消耗的低成本。

●          将大模型和小模型能力相结合,打造功能搭建AGENT平台

为了弥补大模型在特定应用场景下的能力不足,世优波塔运用了多模型基座,搭配大量小模型能力,打造了功能强大且简便易用的功能搭建AGENT平台,可以发挥不同模型的优势特性和不同模型之间交叉验证,以更轻量化和更高效的能力,快速实现业务流程的搭建和实现,使得交互正确率达到98%。

在增强检索方面,世优波塔利用大语言模型进行问题泛化处理和文档嵌入,并且进行元数据的补充与分类,在检索时自动化关联合并数据,更高效地帮助用户找到最匹配或最新的结果数据。

●          开放接口并优化工程,和业务系统进行快速集成

为了降低数字人交互系统的成本,支持全终端的本地化渲染方案,相比云渲染的方式,渲染成本直线降低60%左右,同时为了让整个交互体验更流畅,世优科技进行了大量的工程优化和策略优化,把端到端的响应时间控制在1.5-2s以内,保证自然交互的流畅程度。

作为一个智能化交互系统,波塔的API平台,把播报和对话控制、指令识别、业务流程定制、内容编排、动画编排等能力作为接口开放出来,使得波塔能够和现有业务系统进行快速集成。

赋能千行百业

让每个人都拥有独属的AI助手

世优波塔支持数字大屏、AI数字人一体机、PC端以及H5小程序等多种应用终端,同时支持私有化部署等集成方案,满足不同客户的需求,利用数字化产品,来增强数字人的智能性、互动性和真实性,从而为客户打造更加沉浸、个性化的数字体验。目前,世优波塔正以3D、2.5D数字人形象,担任前台接待、数字客服等身份,为政企客户提供更新颖、更卓越的用户服务体验。

在政务服务领域,世优波塔AI数字人为政府机构提供智能化咨询与讲解服务,实现政务信息精准传达、公共服务高效办理,显著提升政务服务的质量与效率,同时增强民众的数字化服务体验;

文化旅游领域中,世优波塔化身成为数字导游或文化解说员,为游客提供沉浸式文化旅游体验,通过复现历史人物、讲述地方故事、导览景区风光,不仅促进了文化的数字化传播,还提升文旅景区前沿的数字化服务;

教育培育方面,世优波塔作为智能教学助手,承担学科知识展示讲解、语言练习伙伴的角色,在校史馆、多功能教室等地,为师生创造更加生动、互动的学习环境;

而在医疗卫生领域,世优波塔提供导医导诊、智能陪诊、用药提醒、智能指引等“一站式”贴心服务,提高了医疗服务的便捷性,同时保障了医疗信息的准确传递与隐私安全。

此外,在直播、互联网、金融、传媒等行业,世优波塔AI数字人也都展现了其作为前沿人工智能技术的优势,在推动行业智能化转型、提升服务效能与用户体验方面的巨大潜力与价值。

世优科技的波塔产品,是人工智能时代的多模态人机交互界面,让技术的温暖触达每一个细微之处,它不仅是一个技术革新的标志,更是实现了产业链纵向整合的典范应用,通过AI数字人全栈技术解决方案,加速传统行业的模式创新与服务升级,为经济体系的全面数字化升级铺设坚实基础。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。