点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能从“大炼模型”到“炼大模型”
首页> 科技频道> 综合新闻 > 正文

人工智能从“大炼模型”到“炼大模型”

来源:科技日报2021-04-12 09:47

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

  写小说、和人聊天、设计网页、编写吉他曲谱……号称迄今为止最“全能”的AI模型GPT-3,当然远远不止会这些。作为2020年人工智能领域最惊艳的模型之一,GPT-3无疑把超大规模预训练模型的热度推向了新高。

  3月下旬,我国首个超大规模人工智能模型“悟道1.0”发布,该模型由智源学术副院长、清华大学教授唐杰领衔,带领来自清华大学、北京大学、中国人民大学、中国科学院等单位的100余位AI科学家组成联合攻关团队,取得了多项国际领先的AI技术突破,形成了超大规模智能模型训练技术体系,训练出包括中文、多模态、认知和蛋白质预测在内的系列超大模型。

  已启动4个大模型开发

  据悉,“悟道1.0”先期启动了4个大模型研发项目:以中文为核心的超大规模预训练语言模型文源、超大规模多模态预训练模型文澜、超大规模蛋白质序列预测预训练模型文溯,以及面向认知的超大规模新型预训练模型文汇。

  唐杰介绍,文源拥有26亿参数,文澜则为10亿,文溯是2.8亿,文汇则达到了百亿以上。虽然相对于GPT-3的1750亿参数而言还有差距,但“接下来会有更大的模型”。

  目前,文源模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,在中文生成模型中达到了领先的效果。

  “目前这些模型既有一些交集,但也存在明显差异。文源的重点是在中文和跨语言,未来也会加入知识;文澜的重点主要是图文;文汇则更多地瞄向认知。”唐杰表示,认知是人工智能技术发展的趋势和目标,关系到机器是否能像人一样思考这个终极问题。

  “下一代人工智能技术的发展方向一定是认知。”据唐杰介绍,在作诗任务中,目前文汇已经通过了图灵测试。从算法的角度上来看,文汇能通过图灵测试的关键在于“生成”,而不仅仅限于“匹配”,这种生成能力是多样的。

  被问及为何会选择这4个预训练模型项目时,唐杰说,这是综合考虑了国内外同行的相关工作、国内人工智能发展的现状、团队人员构成、北京区域优势等作出的决定。“当时GPT-3刚发布不久,悟道团队认为首先要对标其卓越的少样本学习能力,同时还要做出差异化,做短、中、长3个阶段的布局。于是,中文版GPT-3即清源CPM(文源的前身)应运而生,这是短期布局。之后,文源要向中英文模型乃至多语言模型发展,这是中期布局。最后走向认知智能,这是长期布局。”唐杰说,与此同时,国内顶尖的企业人才、学术人才和自然科学人才所组成的团队给了项目巨大的想象空间。

  大模型有大智慧

  自2018年谷歌发布BERT以来,预训练模型逐渐成为自然语言处理(NLP)领域的主流。

  2020年5月,OpenAI发布了拥有1750亿参数量的预训练模型GPT-3。作为一个语言生成模型,GPT-3不仅能够生成流畅自然的文本,还能完成问答、翻译、创作小说等一系列NLP任务,甚至可以进行简单的算术运算,并且其性能在很多任务上都超越相关领域的专有模型。

  以GPT-3为代表的超大规模预训练模型,不仅以绝对的数据和算力优势取代了一些小的算法模型,更重要的是,它展示了一条通向通用人工智能的可能路径。在此背景下,建设国内的超大规模预训练模型和生态势在必行。

  在唐杰看来,为了提高机器学习算法的效率,改变传统的行业布局,过去几年,大家拼命做模型,导致模型越做越多。然而,一般的模型训练效果并不如人意,花了大量财力精力却达不到理想的训练效果,“为了优化效果、提高精度,模型越来越复杂,数据越来越大,很多公司的能力不足以应对这种状况,效率越来越低。”唐杰举了个例子,小炼钢厂往往条件简陋,能炼钢,但质量不好。大炼钢厂买得起设备、花得起电费,炼出的钢质量就好,大模型就是大炼钢厂,它可以获得大量数据,并把数据清洗干净,提升算力,满足要求。

  与此同时,“小模型可能只需要几个老师和学生就能完成算法的设计,但是大模型的每一层都要找专人来做,这样可以把模型的设计和训练精细化,模型设计也从单打独斗变成了众人拾柴。”唐杰说。

  小团队将成最大受益者

  据唐杰透露,团队目前正在跟北京冬奥会合作,开发可通过文本自动转成手语的模型,“医疗方面我们的主要方向是癌症早筛,如上传乳腺癌图像,找到乳腺癌相关预测亚类,通过影像识别宫颈癌亚类等。”

  而谈到“悟道1.0”的发展,唐杰坦言,目前还存在需要持续攻关的问题。一是模型能否持续学习的问题,即能否不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。就目前来看模型还需要调整,其效果还有待加强;二是面对一些复杂问题,目前模型还无法回答;三是万亿级模型的实用性问题,即如何在保证精度的同时压缩模型,从而能让用户低成本地使用。

  “这是一个全新的产业模式。原来大家数据上云、算力上云,现在模型上云。”唐杰说。

  他认为,人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

  唐杰表示,随着超大规模预训练模型系统的开放,小团队是最大的受益者,大家不必从零开始,预训练基线智能水平大幅提升,平台多样化、规模化,大家在云上可以找到自己所需的模型,剩下的就是对行业、对场景的理解。这将给AI应用创新带来全新的局面。

  唐杰透露,“悟道1.0”只是一个阶段性的成果,今年6月将会有一个规模更大、水平更高的智慧模型发布。届时,模型规模会有实质性的进展:模型会在更多任务上突破图灵测试,其应用平台的效果也会更加让人期待。(崔 爽)

[ 责编:蔡琳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 心系种植发光热

  • 候鸟翔集黄河之滨

独家策划

推荐阅读
27日,记者从广州大学获悉,该校与中国科学院、同济大学、美国宾夕法尼亚州立大学等高校科学家合作发现,位于火星北半球乌托邦平原南部的“祝融号”着陆区,其地下10—35米深处存在多层倾斜沉积结构。
2025-02-28 09:51
2月27日15时08分,长征二号丙运载火箭在酒泉卫星发射中心点火升空。
2025-02-28 09:50
北京大学常林研究团队与中国科学院空天信息创新研究院合作,成功开发出世界首款光子时钟芯片,可将芯片上的时间调控速度提升100倍。
2025-02-28 09:47
在宇宙中,有一类神秘天体——流浪行星
2025-02-28 09:46
从市场监管总局获悉,国际电工委员会近日正式发布由我国牵头制定的养老机器人国际标准。
2025-02-28 09:44
国际数据库事务处理性能委员会(TPC)近日宣布,阿里云PolarDB云原生数据库以远超原纪录的性能,登顶TPC—C基准测试排行榜,以每分钟20.55亿笔交易和单位成本0.8元人民币的成绩,刷新该榜单性能和性价比两项世界纪录。
2025-02-27 09:15
当物质处于地球上最低温度、最高压力等极端条件下,可能出现怎样的“超能力”?物态调控是物理学研究造福人类社会的重要途径,科学家对于物理世界极限的探寻从未停止。
2025-02-27 09:37
记者26日从中国科学院西北生态环境资源研究院获悉,该院敦煌戈壁荒漠研究站柳本立研究员团队以退役风机叶片为原料,成功研发出新型防沙材料,为循环利用退役风机叶片提供了新的解决方案。
2025-02-27 09:22
为学生量身定制学业规划、24小时解答疑难问题,为研究人员查找资料……“DeepSeek+高校”的智慧教学研究场景正在北京部分高校实现。AI浪潮已至,智慧校园是大势所趋,但AI与教育的融合仍有赖于师生素养提升、技术适应性及相关制度的建设完善。
2025-02-27 09:18
根据美国航天局最新测算结果,一颗编号为“2024 YR4”的小行星在2032年12月22日撞击地球的可能性已基本排除,撞击概率已降至0.004%。美航天局表示,小行星“2024 YR4”不再对地球构成重大威胁,它为天文学家提供了宝贵的机会来测试行星防御科研和预警流程。
2025-02-27 09:16
26日,全国规模最大、总投资最大、新能源占比最高的“沙戈荒”新能源外送基地电源项目——青海省柴达木格尔木东沙漠基地电源项目在青海格尔木开工。
2025-02-27 09:24
为加快补齐农村地区公共充换电设施短板,进一步释放新能源汽车消费潜力,财政部办公厅、工业和信息化部办公厅、交通运输部办公厅日前联合发布《关于开展2025年县域充换电设施补短板试点申报有关工作的通知》,明确2025年计划支持75个试点县改善充电基础设施。
2025-02-26 09:52
中国第四十次南极考察队利用我国自主研发设备,成功钻穿545米厚的冰层及冰岩夹层,获取了连续冰芯样品和基岩样品。拉斯曼丘陵地区位于伊丽莎白公主地冰盖末端,是东南极冰盖的溢流区之一。
2025-02-26 09:51
青藏高原高山特有物种是什么原因导致的?中国科学院青藏高原研究所生态系统功能与全球变化团队汪涛研究员联合瑞士巴塞尔大学、中国科学院西双版纳热带植物园和北京大学研究人员,
2025-02-26 04:20
近日,记者从吉林大学获悉,该校联合中山大学组成科研团队,发现了高温高压下石墨经由后石墨相形成六方金刚石的全新路径,并人工合成出高质量六方金刚石块材料,
2025-02-26 04:20
马家窑文化距今4000年的彩陶罐、红山文化神秘的陶塑人像、殷墟妇好墓出土的铜圆斝、山东滕州前掌大西周遗址出土的彩绘漆器……不同材质的文物是如何被修复的,又是如何被考古学者破译出古人留下的种种信息,复原出他们的生活图景?走进中国考古博物馆推出的“妙手活千秋——科技考古与遗产保护经典成就展”,答案就藏在其中。
2025-02-26 04:25
共筑数字童年新生态”为主题的“未成年人手机防沉迷座谈会”在京召开。李国强指出,沉迷手机不仅可能会导致视力损伤、睡眠障碍、颈椎问题等生理健康问题,还容易引发社交焦虑、注意力不专注等问题。
2025-02-25 09:34
自然资源部海洋战略规划与经济司24日发布的《2024年中国海洋经济统计公报》显示,过去一年,我国海洋经济呈现强劲发展势头,经济总量再上新台阶,首次突破10万亿元,达105438亿元,比上年增长5.9%,占国内生产总值的比重为7.8%。
2025-02-25 09:32
当前,我国大学生群体普遍来自独生子女家庭,在成长过程中通常得到父母及长辈的全方位关照,从而导致他们生活自理能力相对薄弱。
2025-02-25 09:31
2025年是“十四五”规划的收官之年,是巩固拓展脱贫攻坚成果同乡村振兴有效衔接5年过渡期最后一年,做好“三农”工作对全局发展至关重要。
2025-02-25 09:30
加载更多