金融业如何用好大模型?度小满CTO许冬亮:需解决三大挑战
【资料图】
新浪科技讯8月24日下午消息,在北大光华管理学院联合度小满举办的金融大模型技术与应用论坛上,度小满CTO许冬亮指出,大模型让机器具有了常识,懂得了逻辑,学会了创作,让人和机器能以更自然的方式互动,通过与周边工具的结合,大模型已经具有了通用人工智能的雏形。金融行业是高价值行业,数字化基础好,高度依赖数据和技术,是大模型落地应用的高潜场景。对于中小金融机构,在大模型的浪潮里,他们也有机会通过应用创新,来加快自身的数字化和智能化进程,跨越数字化鸿沟。
现阶段,如何在金融领域发挥大模型的能力,许冬亮认为还有三个挑战需要解决:
第一个挑战是通用模型能力不能满足金融场景需要。首先是通用大模型本身精度不够,当前大模型原生的幻觉问题、可控性问题和可解释性问题都限制了生成内容的准确性和可控性,而金融又是一个对精准性、可控性要求很高的行业;其次是通用大模型金融知识的缺失;再次是大模型更新迭代困难,金融是高时效的,模型必须能够实时跟踪金融市场的变化和趋势。
第二个挑战是大模型如何高效植入现有业务场景。一个团队既要懂业务场景的know-how,又要理解大模型的使用方法,而且还需要具备比较强的工程能力,这样才有可能选择出适合应用大模型的场景,高效地将大模型嵌入到实际业务流程。
第三个挑战是大模型应用于金融业中产生的安全合规和隐私保护问题。金融本身是一个高合规要求的行业,大模型又是具有颠覆性的新技术,我们对它的风险还没有完全了解,随着大模型落地的不断推进,如何平衡大模型落地收益和潜在合规风险,会是一个越来越突出的问题。
如何解决大模型在金融行业落地应用的这些难题,许冬亮认为每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要,“科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域的训练,然后做私有化的部署和应用”。
今年5月份,度小满开源了国内首个千亿级中文金融大模型“轩辕”,“轩辕”在金融领域任务评测中全面超越了市场上的主流开源大模型,开源以来已经有上百家金融机构申请试用。
据度小满数据智能部总经理杨青透露,度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下的能力大幅提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据,对金融问题回答更加专业、准确;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能够处理更长的金融报告、研究和分析。(文猛)