清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

当Waymo于2023年8月在旧金山推出时,很少有人认为它会在共享出行市场占据重要份额。然而15个月后,Waymo在旧金山所有共享乘车服务中的占比达到22%,与成立13年的Lyft相当。

同样,许多业内人士起初并不指望自主代理能在银行业获得青睐,更不用说自主语音代理。然而,就像Waymo一样,我们预计不久后,我们将迎来一个企业和消费者可以“高枕无忧”地让金融服务自动运行的世界。

金融服务占全球所有联络中心总支出的25%,每年的业务流程外包(BPO)支出超过1000亿美元,覆盖的应用包括通过语音生物识别验证消费者身份,以及通过呼叫中心管理复杂的客户问题等多个方面。即使在ChatGPT推出之前,许多银行也在尝试语音自动化:例如美国银行的语音代理Erica在2022年前实现了10亿次互动。

语音人工智能不仅达到了与人类同等的水平,在某些情况下,它甚至更胜一筹

如今,语音人工智能的发展正处于一个激动人心的时代拐点。语音代理可以满足高峰期的需求,全天候为客户提供服务,使用客户喜欢的语言进行沟通,而且运营成本仅为人工的几分之一。例如,一位来自菲律宾的移民需要办理汽车贷款,她每个工作日从上午9点工作到下午5点。现在,她不需要请假来回答问题,而是可以在周末用她的母语塔加拉族语与无限耐心的人工智能代理交谈。早期的数据表明,与人工客服相比,一些客户更喜欢与人工智能对话:想象一下,每次你打电话时,总是会有同一个客服人员为你提供服务,而且对你的每次互动都有完美的记忆。

2024年,人工智能语音模型层的一系列技术进步为模型达到延迟和情感方面的最低阈值铺平了道路,从而得到了更广泛的应用。例如,ChatGPT高级语音模式增加了互联网搜索功能,而谷歌推出了带有原生音频的Gemini 2.0。

在这些核心模型改进的基础上出现了几家公司,它们将基础架构要求抽象化,并提供工具让语音代理快速可靠地启动和运行,例如ElevenLab的对话式人工智能,而Vapi、Retell和Bland等平台则可以管理第三方语音到文本(STT)模型、LLM和文本到语音(TTS)模型的协调。然而,随着初创公司和企业用例达到一定规模,越来越多的公司开始使用自己的基础设施堆栈,包括模型协调(如Pipecat)、电话(如 telynx)、评估和测试(如Coval)以及用于知识检索的定制数据库(如Pinecone)。

表1 金融服务中的新兴语音用例

信息来源:美国劳工统计局

语音代理要在金融服务领域取得成功需要具备哪些条件?

金融业的语音代理要想取得成功,就必须掌握行业特有的细微差别,例如:

  • 合规性和监管要求:与人工客服一样,金融领域的语音客服也需要遵守严格的监管要求,包括对投资建议的限制。由于存在金融犯罪和欺诈的可能性,语音代理还需要建立额外的或多步骤的客户验证流程,尤其是在语音克隆变得越来越容易的情况下。
  • 自定义集成和部署:在金融领域构建代理的团队可能需要浏览内部部署,并从一系列需要自定义集成的传统记录系统中访问数据。
  • 特定领域的知识:代理需要在特定行业术语和行话的语料库中接受培训,并广泛涉猎各种金融产品(如支票、储蓄、投资、信贷和抵押贷款)。

我们相信,语音人工智能未来将成为金融服务领域一个重要的组成部分,并以额外工作流程和新的人工智能原生记录系统等形式取代下游传统软件。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。