点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“轩辕”来了!国内首个千亿级中文金融大模型宣布开源
首页> 科技频道> 综合新闻 > 正文

“轩辕”来了!国内首个千亿级中文金融大模型宣布开源

来源:光明网2023-05-26 21:23

  近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

  在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

  为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

  BLOOM(Big Science Language Open-science Open-access Multilingual)是2021年由 1000 多名志愿研究人员在一个名为“大科学 BigScience”的项目中创建,2022年7月12日正式发布。BLOOM 拥有1760亿个参数(决定输入数据如何转换为输出内容的变量),稍多于拥有 1750 亿个参数的 GPT-3。BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。相比Meta发布的130亿参数的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更占优势。

  目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。 下载地址:https://github.com/Duxiaoman-DI/XuanYuan

  度小满CTO许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。

  作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后,对金融机构有何意义?

  许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

  据悉,度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了“吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 第二艘国产大型邮轮计划3月20日出坞

  • 北京至雄安新区开通定制快巴

独家策划

推荐阅读
分享几个故事,一起走进地球科学的世界。
2026-03-16 18:39
工业和信息化部、财政部、国家发展改革委日前印发《关于开展氢能综合应用试点工作的通知》。通知提出,通过城市群试点,将氢能应用场景由燃料电池汽车向交通、工业等具备条件的多元领域拓展。
2026-03-17 09:35
图为3月16日在北京航天飞行控制中心屏幕上拍摄的神舟二十一号乘组航天员工作的画面。据悉,张陆已累计进行6次舱外活动,成为目前在舱外执行任务次数最多的中国航天员之一。按计划,飞行任务期间还将实施航天员乘组出舱活动,持续开展相关科学实验与技术试验。
2026-03-17 09:35
OpenClaw类智能体出现有标志意义,但仍需从严把控安全风险,未雨绸缪引导科技发展向上、向善。
2026-03-17 09:34
近日,“今明两年或成历史最热年份”“地球或将迎超级厄尔尼诺现象”等相关话题冲上网络热搜,引发公众广泛关注。“总体来看,今年下半年赤道中东太平洋处于厄尔尼诺状态的可能性较大,但目前尚无法准确预测其具体形成时间和总体强度。
2026-03-17 09:34
水利部水文司司长刘志雨介绍,2015年9月,水利部和自然资源部按照“统一布局、分工协作、避免重复、信息共享”原则,联合启动实施国家地下水监测工程。未来十年,国家地下水监测站网将更加科学、全面、精准地守护国家水资源安全,为精打细算用好水资源,从严从细管好水资源提供坚实保障。
2026-03-17 09:34
该学院依托浙江大学建立,旨在积极推动全球发展倡议落地见效,切实破解全球发展进程中的瓶颈性难题,有效凝聚多方智慧与力量,推动各国共同发展。
2026-03-16 12:35
他们用郭守敬望远镜光谱数据锁定目标对象,结合盖亚空间望远镜的高精度天体测量数据拼出基本“轮廓”,再用EBHIS射电巡天数据勾勒出星团周围的气体环境。他还公布了星团中最亮恒星的精确坐标——赤经01:50:46.6和赤纬+56:25:25.8,供天文爱好者定位追踪。
2026-03-16 09:32
不久前发表在《细胞》的研究,可能是张保才研究员与老师周奕华研究员科研生涯迄今“最高光”的时刻。张保才就在这一年到遗传发育所攻读博士,机缘巧合地进了这个新课题组,成为周奕华的“开山弟子”。
2026-03-16 09:31
回顾过去一年,“AI仿冒名人带货”“职业弹幕人”操控舆论、“大数据杀熟”等新型骗局取代传统假货,成为投诉“重灾区”。
2026-03-16 09:28
记者从中国航天科技集团获悉,2026年3月15日21时22分,我国在太原卫星发射中心使用长征六号甲运载火箭(又名长征六号改运载火箭),成功将遥感五十号02星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-03-16 09:27
酷暑难耐,即便身着薄衣,人还没动,汗先下来了。邹如强介绍,为验证实际调温效果,团队还将相变纤维织造成衣,并进行了多场景真人穿戴测试。
2026-03-16 09:21
多牵头国际大科学计划  牵头组织实施国际大科学计划,是中国推动世界科技创新、应对全球共同挑战的重要路径,也是深度参与全球科技创新治理、加快建设科技强国的战略举措。
2026-03-13 10:03
12日,十四届全国人大四次会议表决通过了《中华人民共和国生态环境法典》。非洲“绿色长城”毛里塔尼亚国家署官员艾莎·穆罕默德·布哈里·娜迪称赞说,生态环境法典体现了中国系统性应对生态和气候问题的“长期坚定承诺”。
2026-03-13 10:02
谈及国际深海矿产开发局势,孙黎表示,当前全球深海采矿虽处于试验阶段,但各国布局势头迅猛,竞争日趋激烈。潘越建议,司法应该向社会积极传递“损害必偿、犯罪必究”的清晰信号,为海洋经济高质量发展清淤护航。
2026-03-13 10:12
当春风拂过河套平原,“沉睡”一冬的黄河“醒了”。
2026-03-13 10:08
3月12日,十四届全国人大四次会议表决通过《中华人民共和国生态环境法典》。根据代表意见,法典中增加了关于鼓励和引导使用再生水、推进生活节水的规定,并对未经批准擅自取用地下水的违法行为提高罚款上限。
2026-03-13 10:04
助力人与自然和谐共生  “十五五”时期,推进长江经济带发展、黄河流域生态保护和高质量发展,是一项重要工作。
2026-03-13 10:03
光明日报北京3月12日电 记者张晓华12日从国家航天局获悉,天问三号火星取样返回任务通过前期的技术攻关和深化论证,相关关键技术均取得突破性成果,工程主线正在开展初样研制,计划今年转入正样研制阶段,各项工作进展顺利。
2026-03-13 10:02
电子的单向开关,奠定了现代信息社会的基石。“在单原子层厚的石墨烯上,刻出一个大小精确、形状不对称的孔,无异于在头发丝上雕巨型画作。
2026-03-13 10:01
加载更多