清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

分享嘉宾|李喆 爱分析合伙人兼首席分析师

AI Agent在企业内的落地方式

首先展示的是一张整个大模型市场的全景地图,里面分别围绕基础层、模型层、中间层及应用层这几个层面展开。这张全景地图是为了让大家更明确,尽管AI Agent最早在大概今年五、六月份时就已经被提及,国外也出现了许多针对AI Agent趋势的实际落地场景和案例,但就AI Agent含义而言,从企业用户、厂商以及学术界的视角来看,定义其实是有所不同的。

在企业用户落地AI Agent的具体实施方案上,我们将其大致分为两类。

第一类是与整体大模型能力建设密切相关的。对于许多企业用户来说,他们认为大模型可以应用于多种场景,因此在考虑多场景应用时,如果进行重复的建设,就可能导致大量资源的浪费。因此,他们往往会从中台或能力层次的角度来考虑整个大模型的运用。例如,我们最近与一家股份制银行进行深入交流时,他们就明确表示,明年预计将在六到七个特定场景中使用大模型,因此他们在未来必须考虑构建大模型整体能力。

此外,我们与另一家头部餐饮企业进行交流时,对方也表示模型训练方和规划方面早有行动,他们计划在几十个应用场景中使用大模型能力,而这类企业需要考虑的是同样是整体能力的建设。在这其中, Agent其实就是中间层的一项关键工具,因为其应用场景涉及到多个环节,如问答、数据分析、流程开发等等。对于他们来说,要解决这个问题,不能单纯地针对某个点,而是需要系统性地思考,因此他们往往会在整个大模型能力中作为中间层去考虑。

第二类是Agent具体的应用场景,例如问答、运维管理、客服、数字人等,以及Agent与RPA结合用于流程自动化,或者是担任招聘助理、人力资源助理、财务助理。

这两方面实则指代了企业用户在部署大模型时的不同方向,但需要特别注意的是,AI Agent究竟是被视为一种能力建设,还是一个具体的应用场景建设呢?

打造Agent中台,建设大模型能力

先说能力建设应该如何考量。我们目前看到,未来大家的方向仍将着重于构建一个以AI Agent为基础的中台或具备系统性能力的整体结构,这是基于我们所看到的一些金融场景的落地案例,以及与不同企业沟通交流的过程中所总结得出的结论。

Agent架构的重点在于四个方面的关键因素,即长短时记忆,相关配置工具、整体实现路径规划,以及最终执行,这也是构成整个AI Agent架构的核心组件。因此围绕整个组件进行思考,底层能力必然需要依赖大模型的支持。在大模型中,我们不会明确区分是通用大模型、商业大模型还是训练的专属大模型,这些都是底层大模型的一些能力,对于Agent来说也需要考虑实施不同模型的路由以及模型的调用。

在能力组件层面,AI Agent会涉及诸多工具,这其中包含各种通用的能力组件,例如多模态检索、内容生成,以及在数据分析中处理Text to SQL、Text to Chart、Text to BI等,这些都是我们所观察到的常见能力组件。实际能力组件的种类非常丰富,根据实际观察,在Hugging Face中提到的能力组件就多达二三十种。

在记忆组件层面,基本上目前核心技术主要依赖向量数据库及实时数据库以赋予Agent特定的记忆功能。

在技术层面来看,AI Agent借鉴了传统RPA机器人与整个体系的构建思路,即从单个设计,到整体执行及各执行环节的实现,以及与用户端的互动环节,都与RPA原先的理念相似,因为RPA原来也涉及到开发、运行和一体化管理。这些实际上构成了我们所说的AI Agent的中枢能力的核心。这也是面向于不同的业务场景当中,怎么样去实现Agent中台和上层应用场景之间调用关系的方法。

以上是我们目前所观察到的基于AI Agent的整体结构及其核心能力,如何构建整个AI Agent的中枢平台,以及在实际应用中的各种实施方法。当然,许多企业并不一定真正需要去完全建立平台,一方面是资源的投入较大,包括底层计算能力的投入,以及相关的产品工具的投入;另一方面需要投入大量的人力资源,即需具备NLP领域深厚经验的团队,他们至少曾参与深度学习项目,这样才能更好地构建和完善体系。

因此在这个过程中,我们不推荐大多数企业直接去做这样的建设,而是更建议注重实际应用。

AI Agent未来应用场景规划

接下来讲讲针对具体应用场景的设计,当我们面对某一应用场景时,应如何进行AI技术的实践。在此阶段,我们将场景价值大致分为体验类、降本类、增收类和变革类

变革类是指产生新的商业模式并带来新的业务收益,增收类则指增加现有收益,体验类和降本类则较为明确易懂。需要着重指出的是,尽管降低成本并增加收入以及完成变革是更大的价值所在,但在当前阶段,对于许多公司,例如金融行业的银行、保险和证券以及消费类企业,无论他们是品牌商还是零售商,只要他们面向C端用户,并且存在线上化业务,那么体验类价值的比重就会相当之高。

其实,体验类场景一个极大的益处在于,它能够通过构建特定场景来收集更多的用户交互数据。换言之,通过提高用户体验,最重要的价值便是生成大量的交互数据。许多公司在收集个人用户数据时面临诸多挑战,尤其是对于那些在一方数据建设方面落后的企业,他们可能并不具备大量的历史数据沉淀,但体验类场景却能赋予他们获取更多所需的用户交互数据的机会。

在年限这个维度上,我们主要考虑的是技术的成熟度和应用端的成熟度。拿刚才提到的Agent四个能力里面的记忆举例子,除了采用线上数据库来实现外,许多国产大模型与GPT4相比实际仍存在较大差距,此外在一些多模态检索能力上仍然有一定的不足。以及在进行规划和去做整个任务的分解时,对大模型的推演能力要求也是相当高的。

因此,像销售赋能、实时预测等诸多领域中,无不包含着大量的推理过程和任务分析的需求,尽管大模型已得到广泛应用,其实现程度仍然有待提高,一方面是技术需要继续提升,另一方面更重要的是,Agent其实也是一种比较好的去发挥大模型价值的实践方式。实际上,在产品与具体解决方案的策划层面,我们需要投入更多的设计资源,这无疑是一个巨大的局限因素。

在上面图片中标注的这些领域中,我们发现当前实用性较强且被频繁调用的功能,主要集中在办公助理领域,即在行政办公场景中担任助理的角色。其次是知识库问答,特别是在IT部门内部的知识库问答或知识库助手的开发和运维方面表现尤为突出。

然而将其扩大至整个公司层面时,部分应用的表现则相对较差。其中的关键原因在于,企业自身的数据质量、标签的体系化建设,以及是否建立了规范的知识库等因素,这些都是限制因素,而非模型本身的问题。这些是我们预计未来将具有较大发展潜力的领域。再往上去看,无论是面对系统还是面向制造业并拥有大量互联网设备的运维管理,均是我们目前认为的重要发展方向。而更高级的领域,如客服领域,无论是面对接待场景还是电话外呼场景,都有望直接为企业带来收益。

同时我们认为数据分析的价值也极高,因为从短期来看,其有助于满足管理层和业务部门的各种指标看板和自助式分析的需求,而从长期来看,它能极大地提升运营效率。换句话说,如果企业层面有明确的统一指标,同时基于这一指标所有团队都能紧密关注,那么将会显著提高整个公司的管理效率。这就意味着,上下对目标和目标的拆解有了更加明确和清晰的认识。

因此数据分析所体现的价值更为重大的是,它能够促使公司建立更加完善的数据文化。在此过程中,能够进一步提升管理层在做出决策时所依赖的数据量。而另一方面,当管理层设定了某些策略和方向时,也能够通过各种指标层层拆解并加以贯彻执行,所以数据分析所具备的价值程度实际上要比我们先前预估的高出许多。

继续往后看,无论针对零售场景的导购赋能,或是一些面向B端场景的销售赋能,都无疑将是未来创造收入增长的重要部分之一。例如,借助于Agent,原本能力较为普通的初级人员就可以变得更具专业水平,这本身就是一种极为重要的销售赋能,能够带来更大的价值。我们认为这实际是一种流程的智能化,有助于降低人员在流程中可能出现的误差,从而有效提升整体流程效率。

同时,像虚拟导购等实时预测领域落地时间靠后的一个原因是,目前在零售端进行销量预测的工作并不尽如人意,其背后实际上是需要企业有大量的行业Know-how和知识;而另一方面,还需要积累大量的历史数据才能做好整个实时预测工作。尽管目前这一技术处于发展初期,但它确实显现出了理想的应用场景。

从规划角度来看,明年的规划中,我们认为如上述提到的这些方向均可直接落地,并且阶段性能产生较好的成效。

然而这里需要重点强调的是,即使在上扬期,在大家强调价值的同时仍需控制期望值。因为当前来看,诸如数据分析、问答形式等,即使大家提高对它的期望,即期望能够在业务管理人员或决策层层面实现替代人力的功能,也是相当不现实的。因为在现阶段,它更多地还是在提效层面发挥作用,就是能够使原本能力一般的人得到极大提高,虽然他们无法成为经验丰富的专业人士,但至少可以提升为中等水平,同时也能很大程度上去提升工作的效率,但不太可能说直接去面向原来的场景替代人的工作。很多时候我们控制预期,是为了不要让一件好的事情因为预期过高,最后因为结果而彻底会否定这件事情的价值,它一定是一个循序渐进的过程。

AI Agent在招聘场景的落地实践

最后,我们以办公领域招聘场景下某猎头企业为例,再聊聊Agent在单一场景下的落地方法。整个过程分为三个阶段,我认为这三个阶段基本上是具有可行性且相对可靠的。该企业的第一阶段是一个任务,第二阶段则是基于该任务的Event,第三阶段,实际上是一个贯穿整体的流程。

理论上实际的落地过程需要经过这三个阶段,第一阶段其实是从单个任务点上去提高效率,比如在该案例中,如何与需求方进行有效沟通,如何精准总结JD并确立清晰的人物画像,这些都是在单个具体业务点上能迅速产生效果和价值的环节。接着,第二阶段是针对第一阶段,也就是在流程中最重要的一环,比如如何清晰阐述需求。然后再到第三阶段,将整个招聘流程串联起来。

实际上,在完成第三阶段时,我们就可以对现有流程进行适当的改造。因为当单点能力得到提高,原有的流程推进模式是因为其中所有的环节都是依靠人力去一步步实现的,但是现在转变为依托于Agent与人力共同合作以达到协同工作的方式来推动,现有的流程便有很大的改进潜力。

因此总的来说,我们建议在每个单独的场景中,首先要找出那些能立即产生效果且能够直观提高效率的任务点,然后基于流程本身,进行环节的拆分,最后实现整个流程的智能自动化。

这是我们看到的AI Agent在特定场景下的落地时间,其他诸如数据分析、客服、问答等领域,也可以依照这套思维逻辑一步步地去细分,最终实现整体的落地实施。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。