导航
行业动态

金融大模型战事逼近“最后一公里”

发布时间:2023-11-25 03:43:30 来源:bandao半岛体育

  11月23日,清华大学博世AI教授朱军在腾讯金融云新智能技术峰会上说,随技术的代际更迭,未来的AI将是与人类相仿、高效的多模态智能处理机,颠覆内容生产和交互方式,孕育着巨大的科研、工程和商业潜力。

  目前,多模态已经渗透到了各类垂直大模型。例如,在金融大模型里,最常见的客服系统,在一开始构建知识库的时候,只能支持文本知识库的启动构建,但加入多模态后就可以对复杂的图文,视频类的内容做知识库的构建。在最后终端输出、给客户的回答时,不但可以用文本的方式回答,也可以用视频,还可以跟数字人结合,用语音的方式回答问题。

  在迈向多模态的道路上,金融大模型呈现出怎样的发展特点和趋势?腾讯云高管在昨日演讲和媒体群访中提到的三句俗语,或能给出一些答案。

  “杀鸡不要用牛刀”意思是不要盲目追求大参数的大模型,毕竟对自己最合适的才是最好的。

  “大力出奇迹”很好地指出了算力的重要性和基础性,即便大型金融机构会自主研发大模型,但在底层算力方面,仍需和技术厂商合作。

  “最后一公里”则是腾讯云在金融领域面对最多的需要解决的情况,即腾讯云提供金融行业的大模型,客户提供他的数据及专业场景,双方一起做最后一公里的精调——生成一个客户专属行业大模型,来解决金融机构面临的具体问题。

  从实际情况去看,金融大模型要立足场景和高质量数据,追求效率和成本的最优解,因此并不是参数越大越好。

  腾讯云总裁邱跃鹏表示,当大家想到大模型的时候会想去追求大参数,但通过实践发现,在非常多的场景中,一定要很关注ROI,有些成本很高,不是每家企业都能承受。如果用了小参数,随之算力要求也降低,但又能很好地解决场景需求,这给了我们很多的启示。

  “在场景中去裁减到最对自己最合适参数的模型,才能真正在未来商业应用中跑通整个ROI,让企业的经营效率提升。”

  邱跃鹏表示,尤其是金融行业有如此大的规模,如果找到比较合适的解决方案,就可以让整个行业在很多场景中的效率提升5%到10%,这放在金融的大行业中,意味着巨大的财富价值创造。所以,在这一个方面,希望跟各方共同探索,真正做好大模型和金融场景的结合。

  为了打造专业合规的金融行业大模型,腾讯云通过预训练、金融领域垂类任务精调、强化学习的方式,持续积累和强化金融行业大模型。在通用能力的基础上,腾讯云金融行业大模型解决方案具备金融领域知识推理、研报撰写、智能舆情等专业下游任务能力。

  算力属于新型基础设施,它是数据中心的服务器通过对数据来进行处理后实现结果输出的一种能力。算力与算法、数据一起构成AI发展的三大基石。

  今年以来,大模型、人工智能加快速度进行发展,促使算力需求大爆发。据《人工智能2.0时代的公共智算服务发展指南》显示,截至2023年6月,全国已投运的智算中心达到25个,在建的智算中心超过20个,算力规模持续保持全球第二。年初发布的《数字中国建设整体布局规划》明确“2522”的整体框架,提出打通数字基础设施大动脉、畅通数据资源大循环,足以可见算力的重要性。

  在金融行业训练一个典型场景模型,一般是十亿到百亿级别,目前很少做千亿级的模型。像百亿级别任务需要几十张卡集群并行训练,带宽要求也是达到TB级,并且对存储Tbps要求也非常高。腾讯云已推出的HCC高性能计算集群作为大模型的算力底座,可以非常好地支撑大模型的训练。

  邱跃鹏提到,从腾讯的角度来讲,不仅仅提供了混元模型API的能力让大家去用,在整个基础算力端,腾讯也一直在服务中国众多的大模型公司,像百川、智谱等都在用腾讯的算力做大模型训练。

  只有夯实算力底座,再通过提供模型工具、深入业务场景,才能大力推进金融领域的智能实践应用。

  目前,金融机构布局大模型主要有哪些路径?在金融大模型的应用领域,大型金融机构和中小金融机构有何区别?腾讯云高管在群访中回答了这些问题。

  毋庸置疑,人工智能的发展是爆炸式的。腾讯云副总裁胡利明表示,大模型的诞生使金融机构能快速拥有无数个可以复制、成本非常低、优秀的“大学生”。加上在金融领域专业数据的训练,大模型将全面重塑金融服务对客的体验以及升级内部运营的效率。国内非常多的金融机构,尤其是头部的机构和行业的科技公司都在积极探索和拥抱大模型。

  另一方面,技术的发展实在太快了,作为金融机构,从零开始训练一个大模型的代价非常高。从初期的大量高质量的准备到预训练、精调、强化学习、能力增强、系统整合、部署发布等技术门槛额成本都非常高,所以行业落地还是基于头部开源的大模型或者在头部厂家的大模型基础上进一步进行该领域的数据加载以及训练。

  腾讯云副总裁、腾讯云智能解决方案负责人王麒介绍称,在整个大模型生态的产品货架上,腾讯云提出MaaS体系,从最底层的算力支持、计算网络存储等等,再到上面的通用大模型,然后在通用大模型的基础上,再去预训练出一个行业专属的金融大模型。在行业专属的金融大模型的基础上,再加上行业的数据做精调,最后再变成客户的专属大模型。

  王麒说,整个金融大模型的产品体系是由下往上走的,不同的金融公司能够根据自身的投入成本以及场景复杂度,选择在不同的点去切入自己的金融行业大模型。

  像比较大的金融企业,有比较好的保障,也有持续的投入,更多可能选择往底层方向去走,甚至会构建自己的模型。但是,像算力集群、计算网络存储这些底层基础设施方面,一般来讲不会再去触到这层,而是选择跟腾讯云这样的专业云厂商一起合作。

  在部署方式上,大的金融企业是私有化方式,当然如果不涉及到比较深入的客户交易数据,可能会用公有云,涉及到敏感的数据,可能会用团体云或者私有化的方式去部署。私有化的情况下,一定会对模型做必要的裁减,在能效比方面寻求一个最优的选择。

  另外,考虑到金融行业更多是对数据及场景的管理,所以大的金融企业更多会和厂商合作进行模型的训练,事实上厂商在模型上面有独特优势。

  在这个基础上,腾讯云发现面对最多的也是这样的一种情况,即腾讯云提供金融行业的大模型,客户提供他的数据及专业场景,双方一起做最后一公里的精调——生成一个客户专属行业大模型,来解决金融机构面临的具体问题。

  至于中小金融机构,大多是在关注和观望,可能会根据头部机构的场景试点落地的情况,然后再选择跟随的策略。比如和行业内的技术公司像ISV合作,通过向对方提供自身特色的数据和样本,获取快速构建的真正匹配的模型。

  王麒表示,在未来大模型的发展下,厂商和金融机构会做分工,厂商更多会去做底层的技术构建,以及在安全合规上面进行能力建设。金融机构更多是把握数据的安全性以及最后的场景落地。

  腾讯作为模型和工具链的提供方,可以用百亿参数的小模型来解决金融企业的问题。上文提到,其实并不是每个金融企业都能够花几百万来构建一个大模型。所以,成本对他们来讲是很重要的一个因素。在这样的一个过程中,腾讯云的优点是它能提供一个小模型来解决问题。

  在安全合规方面,大模型是一个严谨、低容错率的行业,尤其在金融行业,所以它需要一个标准来进行评测。腾讯云也率先考虑到这一点,今年9月与中国信通院等机构发布了国内首个金融行业大模型标准《面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型》。

  谈到未来行业模型的整个生态,王麒表示,我国做底层通用大模型的企业应该会慢慢的少,因为这是一个深水区,需要多年的技术积累。所以,最后应该是少数几家头部厂商能做底层大模型,更多的合作伙伴则加入进来做精调的部分,即做好最后一公里的数据精调,来解决最后企业真正的问题,最后实现落地。

首页 产品中心 联系我们