点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能辅助科研要从可用走向可信
首页> 科技频道> 人工智能 > 正文

人工智能辅助科研要从可用走向可信

来源:科技日报2023-12-04 09:29

  未来,人工智能或将帮助科研工作者跳过文献检索、粗读的过程,直接找到需要的文献,大幅提升科研工作者的文献阅读效率。

  对于科研工作者来说,检索、阅读文献是一项费时费力的工作。在大模型发展如火如荼的今天,以其为代表的人工智能正渗透进人们工作生活的各个角落,科研领域也不例外。

  日前,阿里巴巴发布了基于Transformer架构自主研发的千亿参数级夸克大模型。据介绍,该大模型可用于科研资料收集、文献快速阅读与翻译、创作润色等场景。

  不仅是阿里巴巴,科大讯飞股份有限公司(以下简称科大讯飞)、腾讯等企业,也都推出了用于辅助科研的大模型产品。这一系列产品的问世,正悄然改变着科研工作者的工作方式。

  大模型已进入科研领域

  今年初,ChatGPT的走红掀起了语言大模型热潮。人们可以随心所欲地提出问题,大模型总会给出答案。这股风很快也吹到了科研领域。ChatGPT发布后不久,一款名为txyz.ai的应用插件在科研圈中受到追捧。

  这是一款借助ChatGPT的强大理解能力,专门用来阅读科研文献的插件。用户可以直接将论文全文上传至该应用,并提出相应解读要求,它便能够以最快速度对用户提出的问题予以回答。

  即使没有下载论文全文也没关系,txyz.ai支持对论文预印本网站进行检索。用户可以只提供一个论文ID序号,txyz.ai就会自动检索、学习该论文,并根据用户需求给出回答。不仅如此,用户还能以聊天的方式与其进行对话,就论文中的内容提出各种问题。

  视频网站哔哩哔哩知名科普博主严伯钧是txyz.ai的忠实用户,他时常在各类科普视频中使用txyz.ai来协助解读论文。在他看来,txyz.ai给出的论文解读准确率已经非常高,具备很强的实际应用价值,可以帮助科研工作者更加高效地检索、阅读文献。

  “txyz.ai无法解读的情况当然也会有。”严伯钧表示,以他的使用经验来看,向txyz.ai提出的问题必须是一个能被回答的“有效问题”,“如果问题问得太细、太深,或者过于刁钻古怪,那么它就会直接告诉你,无法回答”。

  但必须承认的是,在大模型迅猛发展并逐渐进入千行百业的今天,专门针对科研领域的大模型产品仍然不算多,且大多数是试验性质的产品。

  不久前,科大讯飞在发布最新版本的讯飞星火认知大模型V3.0时,也一口气发布了12个面向行业的专用大模型。其中便有联合中国科学院文献情报中心共同研发的、面向科研工作者的科技文献大模型,以及基于该大模型的应用产品——星火科研助手。这也是国内为数不多的专门为科研工作推出的大模型产品。目前,星火科研助手有成果调研、论文研读、学术写作三大功能。

  浙江大学第一附属医院图书馆工作人员以“大语言模型”为关键词对星火科研助手进行了试用。在“成果调研”板块,星火科研助手在检索到的1251314篇文献中遴选了167篇文章进行分析,给出了关于大语言模型的概述。其还可以进一步从遴选的167篇文章中勾选最多30篇文章,据此生成综述。

  星火科研助手的论文研读功能则采用当前大语言模型通用的问答模式,可默认生成论文摘要、方法、结论等主要信息;用户也可以就自己关心的论文内容进行提问,科研助手会根据文章内容进行回答。其学术写作功能则主要聚焦科研文章的翻译与润色,目前支持中英文互译,也可以对研究人员撰写的英文文章进行润色。

  须保证内容真实且专业

  由于技术原因,大模型有时会出现编造信息、“一本正经地胡说八道”的现象。这种现象在业内被称为AI幻觉。生活中,人们在和大模型聊天时,如果出现了AI幻觉,人们可能会一笑了之;但若AI幻觉出现在追求严谨精确的科研领域,后果可能就会很严重。

  科大讯飞北京研究院执行院长、科技文献大模型研发负责人伍大勇表示,研发科技文献大模型,核心难点就在于保证其内容的可信性和专业性。“一方面,这要依靠高质量的论文数据;另一方面,在模型预训练和监督微调方面也需要下功夫。”伍大勇说。

  他介绍,科大讯飞通过与中国科学院文献情报中心合作,在合规的情况下获取了丰富的科技文献数据,并对数据进行了去重、去噪等处理,以提升数据质量。“星火科研助手采用中国科学院文献情报中心提供的论文接口来进行论文检索。此外,我们还使用了基于论文知识库的检索增强和知识增强策略。这些都使大模型生成的结果有据可依。”伍大勇表示,这些措施从技术上保证了星火科研助手回答结果的准确性,也尽量避免了大模型出现AI幻觉。

  同时,伍大勇表示,针对科技文献服务的各个场景,星火科研助手研发团队还邀请专业团队,对大模型训练数据进行监督微调,以提升星火科研助手在科技文献服务上的性能表现。“例如在成果调研和论文研读功能上,我们采用大模型结合知识图谱和知识库的策略,以保证产品输出的内容有据可依。在学术写作上,我们针对学术翻译和学术英语润色专门进行了大模型监督微调,以达到比通用翻译和校对产品更强的专业性。”伍大勇说。

  或能激发科研工作者更多灵感

  虽然目前尚未有太多人工智能产品被应用于科研领域,但已有学者对人工智能进军科研提出了反对意见,认为这会让科研工作者变得懒惰。在严伯钧看来,科研工作者在应该“懒惰”的地方“懒惰”,反而可以节省出更多时间用在更有价值的工作上。

  阅读文献前首先要进行文献检索。为此,科研工作者往往需要搜寻大量文献,在此基础上对部分感兴趣的文献进行粗读,以进一步判断哪些是自己真正需要的文献。这是实打实的“体力活”。严伯钧认为,在这种情况下,借助人工智能工具帮助科研工作者跳过检索、粗读的过程,以更高效的方式直接找到需要的文献,可大幅提升科研工作者的文献阅读效率。

  虽然可以借助大模型等工具来检索阅读文献,但严伯钧也不否认读原文的价值。“原文当然要读,但并不一定是每篇都要读。更加精准地定位到需要的文献后再进行精读,是更加高效的方式。”

  伍大勇同样表示,研发星火科研助手的初衷在于帮助用户快速了解论文核心内容,提高论文研读效率,让科研工作者能够把更多精力花在更为重要的实验验证等工作上。“辅助提升科研效率是科技文献大模型的关键和目标,但科研工作所需要的灵感、思路、逻辑推理、实验验证、创新与探索等仍离不开科研工作者发挥主观能动性。”

  事实上,除了能够辅助阅读文献,人工智能已经在多个科学研究领域带来实际成果。例如在预测蛋白质结构方面,人工智能产生的成果已经远超人类过去工作的总和。严伯钧认为,这种需要大量计算、反复试错的工作,正是人工智能的强项,人类应与其形成合理分工,拥抱新技术。

  谈及未来人工智能可能给科研工作带来的改变,严伯钧认为,目前的文献阅读、翻译润色等功能,可能只发挥了人工智能在科研工作领域潜力的1%。在他看来,当下科研发展正呈现出细分化的趋势,一位学者往往只深耕于某一科研领域,而人工智能的跨界思维模式未来或能给科研工作带来一些改变。“或许人工智能可给科研工作者带来更多跨领域、交叉学科的原创性启发,激发科研工作者更多想象力。”(记者都 芃)

[ 责编:肖春芳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 欣欣,你在哪里——缅甸地震中国力量救援纪实

  • 现场视频!解放军台岛周边开展联合演训

独家策划

推荐阅读
近期,多地智慧农业建设传来佳绩,草莓巡检机器人、长臂喷雾机等打破了大众对农业的传统印象,数据要素在助力乡村全面振兴中正发挥越来越重要的作用。推动农村电商发展,支持农村电商平台建设,帮助农民通过电商渠道销售农产品;利用数据分析市场需求,打造电商特色品牌,提高农产品竞争力。
2025-04-02 10:07
2月19日,凌晨3时的机房,敲完最后一行代码,中国海油所属中海油田服务股份有限公司(以下简称“中海油服”)深海深层地震数据成像处理技术研发团队负责人刘金朋如释重负。物探船作业时,利用拖缆产生地震波,对海底地层进行“CT扫描”,并实时完成震源和检波点数据采集。
2025-04-02 10:06
引力波被形象地比喻为“时空的涟漪”。为了更精准地认证透镜引力波,胡彬团队与宁波大学蔡荣根院士将目光瞄准宇宙中更为微小的尺度——星系中的致密天体。
2025-04-02 10:05
冰凌花能够早早绽放,成为东北“报春第一花”,是因为其特殊的生长节律和物候机制  草长莺飞,全国多地春意正浓。冰凌花还具有重要的生态价值,能为昆虫提供早春时节稀缺的花蜜和花粉,成为传粉昆虫不可或缺的食物来源。
2025-04-02 10:01
发挥新型举国体制优势,前瞻规划、协同发力、接续攻坚,中国创新将在“一张蓝图绘到底”中破浪前行  作为尖端科技的代表,芯片是我国受外部冲击较大的领域之一。发挥新型举国体制优势,前瞻规划、协同发力、接续攻坚,中国创新将在“一张蓝图绘到底”中破浪前行。
2025-04-02 10:00
3月30日,2025中国网络媒体论坛“坚持主流价值导向 推动算法向上向善”主题分享会在广西南宁举行。主题分享会上发布了“算法向善”南宁宣言,重点互联网企业代表集体签署。
2025-04-01 09:46
目前全球6G研发已从概念探索进入关键技术攻关阶段,中国围绕2030年实现6G商用这一目标加速布局。
2025-04-01 09:50
AI医疗只是辅助手段。
2025-04-01 09:48
31日,在2025中关村论坛年会“重大科技成果发布活动”上,由北京金融监管局联合市科委、中关村管委会、市经济和信息化局、市委金融办共同指导,全国首个商业航天保险共保体组织——“北京商业航天保险共保体”正式发布,助力北京商业航天加速发展。
2025-04-01 09:47
3月31日,“南海二号”钻井平台在惠州19-6油田海域进行钻探作业。
2025-04-01 09:45
2025中关村论坛年会重大成果专场发布会31日举行,围绕“四个面向”发布19项重大科技成果,展现了我国在前沿科技引领、开源开放合作、创新驱动发展等方面的成效。
2025-04-01 09:41
现场发布2024中国正能量网络精品征集展播活动结果,与会领导为中国正能量十佳网络精品代表、突出贡献单位颁发荣誉证书和纪念牌。
2025-04-01 09:48
主题分享会上发布了“算法向善”南宁宣言,重点互联网企业代表集体签署。
2025-04-01 09:47
今年以来,我国以DeepSeek为代表的大模型企业通过算法优化、有针对性的训练和开源生态协作,在使用“缩水版”GPU芯片的情况下,将千亿参数模型训练成本压缩至同类模型的1/10,走出了一条从粗放式算力堆砌向内生式效能提升的新路径。
2025-03-31 10:21
“联合科研团队初步确定,青龙山恐龙蛋化石普遍表现出特殊排列规律,如常见同层埋藏的恐龙蛋3至5枚一组排列成微微弯曲的弧线,多组弧线近平行展布。
2025-03-31 10:03
由西湖大学孵化的西湖仪器,日前成功实现12英寸碳化硅衬底激光剥离自动化解决方案,大幅降低损耗,提升加工速度,推进了碳化硅行业降本增效。
2025-03-31 10:02
日照两城河口国家湿地公园,一群绿头鸭在水面上自由飞翔。
2025-03-31 10:01
3月28至29日,作为2025中关村论坛年会的重要组成部分,中关村国际技术交易大会“全球高校科技成果转化促进大会”在北京工业大学举行。
2025-03-31 09:59
2025中关村论坛年会于3月27日至31日在北京举办,以“新质生产力与全球科技合作”为年度主题。其中将举办碳达峰碳中和科技、世界绿色设计等论坛,为新质生产力发展注入绿色动能。
2025-03-28 03:30
日前,我国自主研制的最大直径盾构机“沧渊号”成功下线,将承担世界最长公路水下盾构隧道——海太长江隧道工程左线掘进任务。大海古称“沧渊”,海太长江隧道横跨长江入海口,全长39.07公里,其中过江隧道长11.185公里,最大埋深超75米,计划于2028年建成。“沧渊号”开挖直径达16.66米,整机总长176米,总重量超5650吨,再创国产超大直径盾构机新纪录。
2025-03-28 04:00
加载更多