点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:超级大脑!AI大模型有望重塑信息产业格局
首页> 科技频道> 人工智能 > 正文

超级大脑!AI大模型有望重塑信息产业格局

来源:经济参考报2022-01-06 15:58

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  《经济参考报》记者近日调研获悉,AI(人工智能)大模型相当于“超级大脑”,正成为人工智能“新高地”。AI大模型有望实现人工智能从感知到认知的跃迁,重新定义人工智能产业模式和产业标准,给部分产业带来重大变革。我国有较大的AI大模型应用市场,但发展过程中面临部分技术薄弱、人才稀缺、成本高昂等多重挑战,亟须对相关技术研发和产业布局加以引导和支持。

  “学富五车”的“超级大脑”

  ——“不开心的话可以听点开心的歌,看看喜剧,也可以去运动,或者好好休息一下。”

  ——“心情不好是一种很正常的情绪,所以不用太过自责。”

  针对“今天心情不好应该怎么办”这一问题,一个人工智能平台以不同的“人设”,给出了不同的回答。通过网址链接进入该平台,在“人设问答”区随机输入问题,机器可支持和扮演不同“人设”,对问题给出多角度答案。该平台正是基于AI大模型打造而成。

  创新工场首席科学家、北京澜舟科技创始人周明介绍,AI大模型也称人工智能预训练模型,将海量数据导入具有几亿量级甚至十万亿量级参数的模型中,机器通过做类似“完形填空”等任务,深度学习数据中蕴含的特征、结构,最终被训练成具有逻辑推理和分析能力的人工智能。

  通俗地说,AI大模型相当于做了无数套关于各领域知识练习题、模拟题的“超级大脑”,深谙各领域知识内在逻辑和解题思路,既能理解人类世界的知识体系,也可能产出新的知识。

  2018年起,人工智能进入“大模型时代”,由重复开发、手工作坊式人工智能,即“一千个应用场景就有一千个小模型”的零散、低效局面,走向工业化、集成化智能的全新路径,以一个大模型“走天下”,为通用人工智能带来曙光。比如,为生产智能音响,各个品牌竞相开发各自的AI小模型,未来各品牌只需在同一个AI大模型基础上开发即可。

  “以前是‘碎片化’的人工智能,针对不同的应用场景要开发不同的模型。作坊式开发对资源、成本造成较大消耗,且效率低下。未来在各垂直领域落地时,只需基于一个大模型,对其参数进行微调即可,这样就打造出了具有通用性质的人工智能。”华为云人工智能领域首席科学家、国际欧亚科学院院士田奇介绍,AI大模型将重新定义人工智能产业模式、产业标准,甚至产业伦理。

  受访者举例介绍,以前的小模型就像“偏科的机器”,只学习针对特定应用场景的有限数据,“举一反三”能力不足,一些智能产品被用户调侃为“人工智障”的情况时有发生。而AI大模型则学习了各行各业各类数据,成为具备良好的知识迁移能力的“通才”,适用领域更广,产出内容质量更高,更加智能。

  同时,周明指出,大模型的发展并非一味追求参数量大,而是聚焦模型的高性能,“在让大模型学习和掌握更大量数据的同时,尽可能让大模型参数相对轻量化,在‘减负’的同时提高能效。”

  可分饰多角 应用场景广泛

  自动问诊、产品营销、小说续写……由于懂得人类语言,且具备细分行业专业知识,一个AI大模型可分饰多角,它做得了医生,当得了作家,胜任得了情感博主,从事得了电商客服……

  AI大模型行业适用范围广,在医疗、金融、零售、气象、新闻传播、文学艺术等领域具有广泛应用场景。周明介绍,在大模型中输入关键词、主题、文本风格等控制属性后,即可生成满足约束条件的文本内容,可用于产品营销文案写作、电商智能客服等。在金融等领域,大模型通过抓取行业数据,自主完成筛选、分析,并自主撰写生成行业报告,辅助从业人员做决策。

  田奇介绍,AI大模型已应用于国网电力部门的日常线路检测。“以前要识别各种电力传输线上的缺陷,需要针对每一类缺陷单独做一个小模型,有几百种缺陷就要做几百种模型,现在利用一个大模型就可完成各类缺陷的识别。”

  值得注意的是,AI大模型目前的技术进步,是人工智能从感知向认知演进的关键环节。清华大学计算机科学与技术系副教授刘知远表示,古今中外一切文章、资料,都可作为训练大模型的数据。通过分析并“内化”海量知识,不仅让智能产品拥有更高性能,如机器翻译更加准确、机器写作更加生动有逻辑;还能品读人类情感,用于情感标注。此外,“它可能识别到‘弦外之音’,甚至有希望发现人类未曾掌握的知识。”

  这一技术的发展,也可能给部分产业带来重大变革。周明说,未来将产生新一代搜索引擎。“目前大部分搜索引擎是基于关键词识别,只将库里已有的包含关键词的结果‘搬运’给用户,而基于大模型的新一代搜索引擎,通过理解人类语言,可以自主生成回答,且支持文字、图片、音频、视频等多模态搜索。”

  田奇表示,新一代搜索引擎具备创作能力,比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物,搜索引擎也可根据描述生成相应照片。

  多重发展难题待解

  当前,美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业,国内的华为、阿里巴巴、百度等大型企业,以及高校、科研机构也加入研发赛道。AI大模型正成为人工智能“新高地”。

  记者调研了解到,从技术上讲,国内AI大模型已初步成熟,下一步将聚焦行业推广,并结合具体问题对模型进行迭代。田奇预测,AI大模型的大规模应用“可能还需要两到三年时间”,且未来AI大模型还有望集纳于芯片上,更方便落地应用。

  专家指出,我国有较大的AI大模型应用市场,在应用领域具有优势,但发展过程中也面临一些挑战。

  刘知远介绍,很多核心技术目前仍然掌握在发达国家手中,训练AI大模型需大量GPU(图形处理器)芯片,但当前国产GPU芯片技术相对薄弱。同时,我国在算法上的原始创新能力也有待提升。

  多位受访者表示,目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数,与国外相比,我国相关领域高水平基础人才培养力度有待加强。

  此外,训练大模型需要较高的电力成本、设备成本等,很多中小企业、科研单位囿于高昂成本,无法搭建拥有充足算力的机房,面临算力不足的问题。

  多措并举抢占“新高地”

  多位专家表示,AI大模型有望实现人工智能从感知到认知的跃迁,将更高效地赋能AI产业化和产业AI化。相关技术研发和产业布局引导、配套支持政策、合理监管等举措能否有效落地至关重要。

  首先,推进AI大模型标准化。受访专家指出,大模型的训练过程具有高能耗的特点,制定标准后,许多工作可基于已经开发的标准化大模型进行适配和二次开发,无需每次从头训练,以降低能耗。同时,大模型发展的过程中,也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险,对用于训练模型的源头数据等做好规范,有利于规避相关风险。国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准。

  其次,适当开放训练数据。受访者表示,训练大模型需要海量数据,出于对数据的隐私、安全等方面的担忧,一些领域难以获取数据,形成数据孤岛。建议在国家机构监管和宏观把控的前提下,各方数据能够对白名单企业、机构、高校适当开放,在确保数据安全使用的同时,增强我国AI大模型实力。例如,医院等机构适当开放数据,将有利于训练更懂医疗的大模型,赋能健康医药领域发展。

  再次,鼓励算力共享。记者调研了解到,目前只有部分大企业能够负担超大模型训练所需的算力成本。受访专家呼吁,可引导具有强算力的人工智能“国家队”,为更多中小微企业、科研单位提供大模型训练所需的算力支撑,可探索合理付费的算力共享机制,共同促进技术的发展和资源的节约。

  最后,加大原始创新引导和支持。多位专家指出,我国应加强研发力度,同时加强针对模型框架的基础创新研究,引导更多科研单位、高校积极培养相关人才,鼓励更多社会力量加入这场信息革命的浪潮。(记者乌梦达 赵旭 )

[ 责编:肖春芳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 彭丽媛会见德国伯乐中文合唱团师生代表

  • 明前茶飘香

独家策划

推荐阅读
见证大国底气从“核”来
2024-03-29 14:15
人工智能可以取代人力勾绘农作物地块,快速完成耕地识别,工作效率相比人工作业提升数十倍。在他看来,我国在星上智能处理和地面遥感AI大模型技术上同步发力,推进人工智能遥感技术发展,太空中的卫星将变得越来越“聪明”。
2024-03-29 09:36
3月27日发表于《自然》的一项分析预测,融化的冰盖正在减缓地球的自转速度,以至于下一个闰秒将被推迟3年。论文作者之一、美国斯克里普斯海洋研究所地球物理学家Duncan Agnew说:“融冰足以使海平面上升,以至于我们可以看到地球自转速度受到了影响。
2024-03-29 09:33
3月28日,小米汽车的价格“谜底”揭开,小米SU7提供九种颜色可供选择,售价21.59万起
2024-03-29 17:17
胡新立表示,研究团队将进一步探讨生理性乳酸水平变化对机体代谢的意义,以及恶病质中骨骼肌萎缩与乳酸的直接关系。
2024-03-29 09:31
近日,日本小林制药保健品事件持续发酵。小林制药此前表示,该公司的红曲原料中可能含有导致消费者出现肾功能不良状态的非预期成分。小林制药出产的红曲原料除用于自家生产保健品外,还出售给其他公司,用于酿酒及食品制造等。
2024-03-29 09:22
朱雀三号可重复使用垂直起降回收验证火箭在酒泉卫星发射中心圆满完成试验任务。2023年12月,蓝箭航天朱雀二号遥三液氧甲烷运载火箭在酒泉发射中心圆满完成发射任务,将三颗商业卫星顺利送入预定轨道。
2024-03-29 09:30
记者28日从南京大学获悉,由该校物理学院杜灵杰教授领衔的国际团队利用极端条件下的偏振光散射技术,在砷化镓量子阱中对分数量子霍尔效应的集体激发进行了测量,在世界上首次观察到引力子激发,即引力子在凝聚态物质中的新奇准粒子。
2024-03-29 08:38
世界卫生组织27日发布新闻公报说,已启用“冠状病毒网络”(CoViNet),以促进和协调全球的专业知识和能力,及早准确地检测、监测和评估新冠病毒、中东呼吸综合征冠状病毒和其他可能新出现的冠状病毒。
2024-03-29 08:38
万兆元年,谁来领航?是更智慧AI,是更领先的Advance,是刷新极限的速度,还是升级多维的体验?中国移动5G-A商用发布会,重新定义数智新时代,邀您共同见证!3月28日15:00-16:00
2024-03-28 12:36
作为中国大科学装置之一,高能同步辐射光源是由中国科学院、北京市共建的怀柔科学城大科学装置集群的核心装置。
2024-03-28 09:54
2022年8月15日,国际天文学联合会小天体命名工作组发布公告,将国际永久编号为192353号的小行星命名为“王大中星”。围绕大学的根本任务是育才造士这一核心要义,王大中归纳并紧抓建设一流大学的三大要素:大师、大楼和大学精神。
2024-03-28 09:34
坎潘特强调,最新观测表明,精确的星震学技术可用于探测表面温度低至4200℃(比太阳表面低约1000℃)的矮星,为天体物理观测开辟了一个新领域。这一最新结果表明,星震学技术有望详细表征这些恒星及其宜居行星的细节,而精确确定附近冷矮星的年龄对于阐释系外行星上发现的生物特征可能至关重要。
2024-03-28 09:33
记者从自然资源部3月27日召开的例行新闻发布会上获悉:今年是极地考察40周年,自然资源部将开展一系列活动纪念这一重要时间节点。7月北极黄河站建站20周年时,在黄河站举办招待会、研讨会等相关活动,中国第四十一次南极考察期间将在长城站、中山站举行招待会、研讨会等相关活动,“雪龙”号、“雪龙2”号船停靠外港时举行公众开放日活动。
2024-03-28 09:32
联合国教科文组织执行局27日批准18处地质公园列入世界地质公园网络名录,其中包括中国的6个地质公园,分别是长白山世界地质公园、恩施大峡谷-腾龙洞世界地质公园、临夏世界地质公园、龙岩世界地质公园、武功山世界地质公园、兴义世界地质公园。
2024-03-28 09:31
据介绍,除了服务于中国探月工程四期,后续鹊桥二号中继星还可为国内外月球探测提供中继通信支持。
2024-03-28 09:25
涂白防虫、修剪树枝、引水灌溉……每当春天到来,在祖国西北边陲新疆托里县老风口,生态造林工作就紧锣密鼓地开始了。
2024-03-27 10:22
今年我国纪念“世界水日”“中国水周”的活动主题为“精打细算用好水资源,从严从细管好水资源”。
2024-03-27 10:21
在齐齐哈尔市甘南县宝山乡巨宏村,村民苑忠国正在准备春耕,多年来通过参与县里的培训,春耕物资的采购对他来说已是轻车熟路。
2024-03-27 10:20
在开展调查监测,评估新污染物环境风险状况方面,《行动方案》提出建立化学物质环境信息调查制度、建立新污染物环境调查监测制度、建立化学物质环境风险评估制度、动态发布重点管控新污染物清单等具体措施。
2024-03-27 10:18
加载更多