点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:全球最大规模人工智能巨量模型“源1.0”问世
首页> 科技频道> 综合新闻 > 正文

全球最大规模人工智能巨量模型“源1.0”问世

来源:光明网2021-09-28 19:20

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  光明网讯 9月28日,浪潮人工智能研究院在京发布全球最大规模人工智能巨量模型“源1.0”。“源”的单体模型参数量达2457亿,超越美国OpenAI组织研发的GPT-3,成为全球最大规模的AI巨量模型。当天,来自国内相关领域的院士、专家围绕AI巨量模型创新与应用进行深入研讨。

  据介绍,源1.0模型参数规模为2457亿,训练采用的中文数据集达5000GB,相比GPT3模型1750亿参数量和570GB训练数据集,源1.0参数规模领先40%,训练数据集规模领先近10倍。

  “源1.0”在语言智能方面表现优异,获得中文语言理解评测基准CLUE榜单的零样本学习和小样本学习两类总榜冠军。在零样本学习榜单中,“源1.0”超越业界最佳成绩18.3%,在文献分类、新闻分类,商品分类、原生中文推理、成语阅读理解填空、名词代词关系6项任务中获得冠军;在小样本学习的文献分类、商品分类、文献摘要识别、名词代词关系等4项任务获得冠军。在成语阅读理解填空项目中,源1.0的表现已超越人类得分。

  在对“源1.0”进行的“图灵测试”中,将源1.0模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨,测试结果表明,人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。

  巨量模型的发展备受关注。斯坦福大学李飞飞教授等人工智能领域知名学者近期在论文中表示,这类巨量模型的意义在于突现和均质。突现意味着通过巨大模型的隐含的知识和推纳可带来让人振奋的科学创新灵感出现;均质表示巨量模型可以为诸多应用任务泛化支持提供统一强大的算法支撑。

  源1.0中文巨量模型的发布使得中国学术界和产业界可以使用一种通用巨量语言模型的方式,大幅降低针对不同应用场景的语言模型适配难度;同时提升在小样本学习和零样本学习场景的模型泛化应用能力。

  浪潮人工智能研究院表示,“源1.0”将面向学术研究单位和产业实践用户进行开源、开放、共享,降低巨量模型研究和应用的门槛,有效推进AI产业化和产业AI化的进步,切实为国家在人工智能研究创新和产业发展作出贡献。(战钊)

[ 责编:蔡琳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 今日腊八,来一碗家乡的腊八粥

  • 多彩活动迎腊八

独家策划

推荐阅读
褚智勤团队联合香港大学教授林原、北京大学教授王琦、南方科技大学助理教授李携曦,开创了一种金刚石剥离技术,可获得超薄且超柔韧的金刚石膜——它就像一张纸一样可以卷起来。
2025-01-07 09:56
科技创新是引领经济社会高质量发展的第一动力。唯有高效、顺畅地推动科技成果转化,才能让知识资本真正成为发展的不竭动力。
2025-01-07 09:51
澳大利亚国立大学6日发布消息,该校研究人员领衔编撰的《2024年全球水监测报告》显示,2024年全球气温再创纪录,全球水循环出现变化,导致更多极端天气、严重洪水与干旱。
2025-01-07 09:50
安徽工业大学教授曾杰、教授刘明凯和中国科学技术大学副教授李洪良合作,验证了一种通过界面锚定策略精准调控单原子之间距离的通用方法。
2025-01-07 09:47
全球质量最高的现代栽培种甘蔗高度复杂基因组被绘制,为今后甘蔗功能基因的挖掘提供了重要基础性支撑。
2025-01-07 09:46
人工智能技术快速发展所掀起的澎湃汹涌浪潮,在深刻改变人的存在和生活方式,给人类带来极大便利的同时,也打破了传统人机关系的界限,给人类的存在和交往带来了新的伦理挑战和道德困境。
2025-01-06 02:50
在大浪淘沙的过程中,怎样让领先的科技成果及早被市场了解?怎样让实验室成果实现大规模量产?怎样让成熟的成果匹配到合适的企业?连接科研与市场两端的技术经理人被列入“十四五”紧缺人才开发目录,技术经理人队伍建设尤其令人关注。
2025-01-06 02:15
受日冕物质抛射活动影响,2025年新年第一天,即北京时间1月1日11时开始,到1月2日2时,地球出现明显地磁活动,其中1月1日23时至2日2时发生了全球地磁指数(Kp指数)为8的特大地磁暴。
2025-01-06 09:49
中国水稻研究所稻米质量安全评估创新团队通过系统分析我国十几年来稻米食味数据后发现,育种遗传改良、田间管理优化等措施不断改善提升我国稻米食味品质。
2025-01-06 09:48
聚变工程堆中心螺管系统的建成,不仅能为未来聚变堆提供良好的实验条件,同时也为低温、材料、凝聚态物理、超导应用等其他领域提供一流的大型测试平台。
2025-01-06 09:47
经过168小时满功率连续运行考核,全球最大华龙一号核电基地、由中核集团旗下中国核电投资控股的漳州核电1号机组正式投入商业运行,标志着华龙一号批量化建设取得重大进展。
2025-01-03 09:31
社交网络的去中心化推动着信息平权,使人人都有麦克风。但这并不意味着人们可以发布虚假错误的信息。科普信息的发布与传播不能被流量为王和眼球效应所裹挟,而应坚持科学性、合法性。
2025-01-03 09:27
记者2日从中铁(上海)投资集团有限公司(以下简称“中铁上投”)了解到,全球首台高压射流—机械联合破岩盾构机“山大号”于近日在济南轨道交通6号线东仓站始发。
2025-01-03 09:22
当下,人工智能的火热让人们对其有了深刻的体会。尽管许多人并不完全了解人工智能的工作原理,但一提起人工智能,自动驾驶汽车、智能交互机器人、机器狗、无人机等已广为人知的应用便浮现在人们脑海中。
2025-01-03 09:19
实现高质量发展要靠科技创新培育新动能。如期全面建成社会主义现代化强国关键看高水平科技自立自强,进一步全面深化改革、推进中国式现代化必须大力推进科技创新。
2025-01-03 09:18
闸门开合,水涨船高。2025年1月1日,长江三峡通航管理局发布数据显示,2024年三峡枢纽通过量达1.59亿吨,连续三年突破1.5亿吨大关。其中,三峡船闸运行10000余闸次,通过量1.54亿吨;三峡升船机运行4700余厢次,同比增长5.1%。
2025-01-02 09:33
波澜壮阔的海洋中,更多宝藏正待发掘,深海油气资源就是其中的宝藏之一。深海区域有着丰富的油气资源,如今已成为全球油气资源的主要接替区。
2025-01-02 09:31
在数字化飞速发展的时代,我们产生和需要存储的数据量呈爆炸式增长。传统的存储方式,如硬盘、磁带等,正面临存储容量有限、维护成本高以及存储设备寿命短等诸多限制。
2025-01-02 09:30
长期以来,科学界普遍认为这两种记忆在大脑中可以协同工作。然而,当两种记忆产生冲突时会发生什么?
2025-01-02 09:29
量子计算正加速发展!2024年12月上旬,谷歌公司推出其最新量子芯片Willow。几天之后,我国科研团队在预印本网站arXiv发布了“祖冲之三号”的相关成果。
2025-01-02 09:29
加载更多