点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“轩辕”来了!国内首个千亿级中文金融大模型宣布开源
首页> 科技频道> 综合新闻 > 正文

“轩辕”来了!国内首个千亿级中文金融大模型宣布开源

来源:光明网2023-05-26 21:23

  近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

  在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

  为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

  BLOOM(Big Science Language Open-science Open-access Multilingual)是2021年由 1000 多名志愿研究人员在一个名为“大科学 BigScience”的项目中创建,2022年7月12日正式发布。BLOOM 拥有1760亿个参数(决定输入数据如何转换为输出内容的变量),稍多于拥有 1750 亿个参数的 GPT-3。BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。相比Meta发布的130亿参数的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更占优势。

  目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。 下载地址:https://github.com/Duxiaoman-DI/XuanYuan

  度小满CTO许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。

  作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后,对金融机构有何意义?

  许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

  据悉,度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了“吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平同俄罗斯总统普京会谈

  • 俄罗斯总统普京抵达北京开始访华

独家策划

推荐阅读
近日,中国工程院院士、西安电子科技大学教授段宝岩率领团队自主研制的一对多动目标微波无线传能地面验证系统取得重大突破,在百米级距离实现了千瓦级的直流输出功率,直流—直流传输效率达到20.8%,波束收集效率高达88.0%。
2026-05-20 09:42
5月18日,随着“雪龙2”号凯旋,中国第42次南极考察圆满落下帷幕。
2026-05-20 09:37
逛一座馆,见证玻璃工业百年变迁。参观工业博物馆,一件件展品记录的是中国制造的发展史,是从落后到并跑、领跑的奋斗史。让我们以工业博物馆为支点,撬动工业旅游这个大市场,以工业文化涵养制造强国建设。
2026-05-20 09:34
近日,中国科学院天津工业生物技术研究所(以下简称天津工生所)糖生物合成与绿色制造攻关团队的研究成果被期刊接收。
2026-05-20 09:27
天津市河西区陈塘庄街道社区的医生向我们反馈,预警模式实现了高危人群的精准干预,社区脑卒中发病率与复发率明显下降。
2026-05-20 09:16
“雪龙2”号极地科考破冰船18日抵达上海,这标志着中国第42次南极考察圆满结束。
2026-05-19 09:54
5月18日,中国第42次南极考察圆满结束。中山大学共有4名老师参与本次任务——大气科学学院教授韩博,遥感科学与技术学院副教授梁琦、叶玉芳、王绍银。
2026-05-19 09:53
“琅琊”海洋大模型现已在国家海洋环境预报中心部署测试运行,实现实景应用。这意味着,这个从青岛走出的AI模型,开始真正为国家海洋预报工作贡献力量。
2026-05-19 09:52
打破传统学科分立格局,发挥工科见长优势,以工程需求催生基础研究、以基础研究赋能工科升级。
2026-05-19 09:50
如今,人工智能正在深刻改变着各行各业。多所大学已将人工智能通识课纳入培养方案,面向全体学生开课
2026-05-19 09:49
在5月15日发表于《细胞》的一项研究中,科学家将从菠菜中提取的光合作用系统移植到小鼠眼中,它能够将光转化为携带能量的分子,从而有效抑制炎症。新加坡国立大学的生物纳米技术专家邢阔然(音)和同事开展的这项研究受到了海蛞蝓的启发,后者能够从藻类中窃取光合作用的机制。
2026-05-18 09:19
标志着奶山羊生物育种迈入世界前列。
2026-05-18 09:14
每一针疫苗、每一瓶点滴,在进入人体前,都必须跨过一道生命红线。
2026-05-18 05:15
利用场景化教学将教室小课堂延伸向社会大课堂,让思政教育“走新”更“走心”。
2026-05-18 05:15
近年来,在应对全球气候变化、保障粮食和重要农产品稳定安全供给基础上,我国积极推进农业农村减排固碳,系统构建气候韧性农业科技战略体系,
2026-05-18 04:05
“九章四号”被应用于高效求解高斯玻色采样任务,其计算速度相比当前全球最快的超级计算机快1054倍(即量子优势比为1054),成功建立了国际上最强的量子计算优越性。
2026-05-15 03:15
夏粮收购是全年粮食收购的首战,对于保护种粮农民利益、维护粮食市场平稳运行、保障粮食稳定安全供给具有重要意义。
2026-05-15 03:25
5月14日,我国首座海上移动式多功能措施平台“海洋石油283”(又称“增产一号”)从青岛西海岸新区启运
2026-05-15 03:25
5月14日11时,朱雀二号改进型遥五运载火箭在东风商业航天创新试验区发射升空,运载火箭全程飞行正常,二子级进入预定轨道,飞行试验任务取得圆满成功。
2026-05-15 03:15
自然资源部13日发布的最新找矿成果显示,西藏罗布莎矿区新增铬铁矿资源量73.83万吨,实现矿山深边部找矿突破。找矿团队还在西藏东巧地区首次评价沉积型铬铁矿,新增伴生铬铁矿矿石量114.63万吨,拓展了我国铬铁矿找矿空间。
2026-05-15 02:55
加载更多