点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“轩辕”来了!国内首个千亿级中文金融大模型宣布开源
首页> 科技频道> 综合新闻 > 正文

“轩辕”来了!国内首个千亿级中文金融大模型宣布开源

来源:光明网2023-05-26 21:23

  近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

  在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

  为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

  BLOOM(Big Science Language Open-science Open-access Multilingual)是2021年由 1000 多名志愿研究人员在一个名为“大科学 BigScience”的项目中创建,2022年7月12日正式发布。BLOOM 拥有1760亿个参数(决定输入数据如何转换为输出内容的变量),稍多于拥有 1750 亿个参数的 GPT-3。BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。相比Meta发布的130亿参数的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更占优势。

  目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。 下载地址:https://github.com/Duxiaoman-DI/XuanYuan

  度小满CTO许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。

  作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后,对金融机构有何意义?

  许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

  据悉,度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了“吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 宁夏同心:黄河水润枸杞红

  • 重庆:“健康夜市”义诊活动为群众健康服务

独家策划

推荐阅读
在6月18日至20日举行的2025年世界移动通信大会(上海)(MWC上海2025)上,一系列新技术、新产品、新应用集中亮相。
2025-06-20 10:21
每年春天,在南半球夜空的指引下,数十亿只布冈夜蛾会向南迁徙1000公里,到达澳大利亚的阿尔卑斯山脉。
2025-06-20 10:21
厦门大学柔性电子(未来技术)研究院教授梁亮亮团队联合新加坡国立大学教授刘小钢团队,在镧系元素掺杂光子雪崩上转换纳米晶研究中取得进展。
2025-06-20 10:21
几十万年前,不只是我们“毛茸茸”的祖先在奔跑、狩猎、生火,还有许多其他“人类亲戚”也栖居在地球上。
2025-06-20 10:21
记者从上海海洋大学获悉,该校水产与生命学院、上海海洋大学eDNA工程中心张玮研究小组在四川稻城海子山保护区的从前措,完成了一次令人兴奋的“生命寻宝”——发现并命名了一种全新的藻类。
2025-06-20 04:40
大力弘扬“爱国、创新、求实、奉献、协同、育人”的科学家精神
2025-06-19 19:13
在生命起源的奥秘中,胚胎发育始终是深受关注的谜题之一。研究发现,在小鼠胚胎发育到7.75天时,胚内、胚外层交界处出现一个独特的信号“洼地”——器官原基决定区(PDZ)。
2025-06-19 10:00
高校学术共同体是科学家精神的培育者、践行者、传承者,以科学家精神引领学术共同体文化建设、以制度机制创新推进科学家精神转化为学术共同体的行动自觉,必将推动高校充分发挥人才和科技优势,在实现高水平科技自立自强、全面提高人才自主培养质量中做出积极贡献。
2025-06-19 09:58
今年麦收期间,各地积极应对高温炎热和多轮大范围降雨天气影响,高效调度机具,强化部门协作,加强服务保障,全力组织抢收,努力做到适收快收、应收尽收。
2025-06-19 09:56
干细胞储备耗竭及其引发的组织再生与稳态维持能力下降,是机体衰老和衰老相关疾病的关键特征。
2025-06-19 09:56
设立20多年来,创新研究群体项目有力支持了一批优秀学术带头人自主组建、带领研究团队开展创新性的基础研究。
2025-06-19 09:55
今年以来,DeepSeek“破圈”跻身全球人工智能大模型“顶流”,人形机器人加速进入多个应用场景……
2025-06-19 09:53
海洋给人的传统印象,一是资源取之不尽、用之不竭,二是靠天吃饭。渔民们世世代代出海撒网,找鱼靠经验、收成靠运气,虽然要受天气、季节、水文等的影响,却从不担心无鱼可捕。
2025-06-19 09:57
(记者魏依晨)记者6月15日从江西婺源森林鸟类国家级自然保护区获悉,该保护区与上饶师范学院生命科学学院在多样性调查中发现了昆虫新属新物种——桂刺蛾。上饶师范学院生命科学学院院长郭连金介绍,基于线粒体编码的细胞色素C氧化酶I(COI)基因的分析表明,桂刺蛾属为单系群。
2025-06-18 10:23
几年前,我开始使用聊天机器人ChatGPT时,还觉得离通用人工智能(AGI)很遥远。我发起的研究项目正是围绕上述情况展开的,并希望构建一种只有智能,没有自我、没有目标,并且具有极有限行动能力的AI。
2025-06-18 10:22
揭示了蚂蚁的演化历史和蚂蚁社会系统的演化机制,并系统解析了推动蚂蚁社会行为、社会分工、社会组织结构演化的关键基因。
2025-06-18 10:20
“一个20平方米大的水池,他在那边赶,我在这边捞,下网好几次,才捞上来两条鱼。2022年底,东星斑养殖遇到严重的病害,特别是一批鱼连续10多代近亲繁殖造成品种退化,存活率低,市场效益不好。
2025-06-18 10:19
“当那些紫花的、圆粒的、矮茎的、皱荚的豌豆在园中悄然生长,孟德尔杂交实验里的一个个豌豆性状仿佛穿越时空,跃然眼前。这种遗传背景修饰主效突变的机制,为理解复杂性状背后的表型可塑性与遗传调控层级提供了一个生动案例。
2025-06-18 10:18
此外,团队还首次捕捉到热流下声子的“非平衡态”:在界面附近约3纳米的狭窄区域,声子分布明显偏离了平衡状态。”   高鹏进一步说,当电子显微镜化身为洞察原子热浪的“超级温度计”,人类对微观世界的热操控正迎来前所未有的清晰图景。
2025-06-17 10:04
“此次发布的新产品,正在无人机物流、农林植保、紧急救援、城市空中交通等多个低空经济示范场景中进行前期测试。 欣旺达从消费电子电池领域的全球重要供应商起步,在全球动力电池装机量榜单上跻身前十,并在储能领域成为中国企业全球电芯出货量排名前十的厂商。
2025-06-17 10:03
加载更多