正在阅读:阅读率与人工稿件基本持平 机器写作正逐渐被接受
首页> 科技频道> 综合新闻 > 正文

阅读率与人工稿件基本持平 机器写作正逐渐被接受

来源:科技日报2019-12-10 09:47

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  近几年,机器写作不再是纸上谈兵的技术,已然渗透到了我们的生活之中。今日头条、腾讯、百度、360等公司,以及新华社、南方都市报、第一财经等传统媒体单位均开展了机器写作技术的研究与应用。

  不久前,在北京大学科技成果发布会暨北京市科技成果转化统筹协调与服务平台系列项目路演中,北京大学计算机科学技术研究所研究员万小军的AI写作机器人颇受关注。

  据介绍,这项成果已应用于多家媒体单位,研发单位与各媒体单位合作推出了小明、小南、小柯等多款写作机器人,各类机器人已经自动撰写新闻稿件十万多篇。

  除了新闻写作,还能应用于这些领域

  机器写作,又称自然语言生成,是自然语言处理领域的重要研究方向和研究热点之一, 也是人工智能走向成熟的重要标志之一。

  目前,机器写作在传媒、出版、文娱、广告等多个行业均具有广阔应用场景。欧美等地较早成立专注于机器写作技术应用的多家公司,例如ARRIA、AI、NarrativeScience等基于行业数据,通过机器写作生成行业报告或新闻报道,从而节省大量人力。同时,不少国外知名媒体单位纷纷采用机器写作技术进行新闻稿件创作,以节约人力成本,提高效率。

  “与人类作者相比,机器写作具有效率高、时效性好、覆盖性强、无偏见等优势。今日头条的线上测试表明,机器人撰写新闻稿件的阅读率与人工稿件的阅读率基本相同,这说明机器稿件的质量不错,能够被广大用户所接受。”万小军告诉记者。

  万小军说,我们希望计算机同时具有读与写的能力,除了掌握阅读和理解语言文字的本领之外,还能够掌握文字创作的本领,从而像人类一样写出高质量的文字作品,例如新闻资讯、报告、诗歌、小说、作文等。

  然而,计算机不能凭空写作,必须根据所输入的数据与素材进行创作。据介绍,根据输入的不同类型的信息,计算机一般采用不同的写作方式进行创作。例如,计算机根据输入的结构化数据(报表、RDF数据等)进行文字创作,从而能够生成稿件。这是目前机器写作应用的主要方式,适用于天气预报、医疗报告、赛事简讯、财经报道等文本的生成。

  万小军介绍说,近几年机器写作除了用于撰写新闻、报告等实用型文本之外,还被用于创作古诗、现代诗、散文等文学作品,例如微软小冰、清华九歌等系统分别能够创作现代诗和古诗,在文字表现形式上的总体效果还不错,但在意境上有所欠缺。

  深度学习生成模型,但还难保准确性和可读性

  近几年,深度学习发展迅速,机器写作技术也受到其深刻影响。

  据万小军介绍,基于深度学习技术进行文本生成,不依赖于模板或规则。然而,这样的写作方式虽然在研究上取得一定进展,但目前还不能保证所生成稿件的准确性与可读性,难以满足很多应用场景下对稿件的质量要求。此外,深度学习生成的模型训练需要大量的平行语料,而在很多领域内较难获取到这样的大规模语料。

  计算机根据已有的文字素材(例如已经发表的新闻)进行二次文字创作时,能够基于已有稿件创作出不一样的稿件,主要依赖于两类自然语言处理技术:自动文摘与文本复述。其中自动文摘用于对单篇文本或多篇文本进行内容提炼与综合,形成摘要或综述。

  万小军指出,多文档自动文摘比单文档自动文摘更具有挑战性,原因在于不同文档内容的冗余性、片面性与弱连贯性。因此,对多篇新闻报道进行长篇综述生成极其困难,其研究团队在这方面进行了尝试,提出基于段落排序与融合的方法为多篇新闻报道进行综述生成,取得一定效果。

  文本复述则用于对现有文字进行改写,在主题与意思基本不变的前提下产生另一种文字表述,从而避免原文照抄,也可实现文本风格化的目的。文本复述可以看作是一种单语言机器翻译问题,因此在平行语料充足的前提下,各种统计机器翻译方法(包括神经网络机器翻译)均可应用于此问题。但现实中却难以获得大规模的此类平行语料,因此针对文本复述的研究需要另辟蹊径,最新的研究主要集中在如何有效利用少量的平行语料和大规模的非平行语料进行复述模型的学习。(华 凌)

[ 责编:蔡琳 ]
阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “世界屋脊”上的特色春运

  • 第三届冬季青年奥林匹克运动会闭幕

独家策划

推荐阅读
据悉,去年国内地震正式速报平均用时572秒,比2018年减少88秒;自动速报平均用时111秒,比2018年减少22秒;自动速报震级平均偏差0.21级,相比2018年精度提高22%。
2020-01-23 09:23
目前,关于下地幔的异常主要由地震波速表征,因此,开展俯冲洋壳在下地幔温度和压强条件下的波速特征研究具有关键意义。俯冲洋壳可以很好地解释下地幔下部的高速异常体和在整个下地幔发现的散射体。
2020-01-23 09:22
买买买,看似一个简单的行为,殊不知,在决定买这个而不是那个的过程中,大脑神经活动可能比预想得更加复杂。此前,有研究指出,“大脑前额叶皮层的神经元负责编码选择项的估值”,也就是说,人们在选择购买某物时,大脑的前额叶皮层发挥了至关重要的作用。
2020-01-23 09:22
在地球历史中,曾经发生过重大的生态系统和环境的突变,导致了多次生物大灭绝事件。利用古生物数据库重建地质历史全球生物多样性模式,揭示地球生命的演化历史,以及与环境变化之间的关系,可以为了解当前的地球生物多样性危机提供重要启示。
2020-01-23 09:20
除草剂目前在农业生产中广泛应用,但常会“误伤”农作物。近期,中科院合肥物质科学研究院吴正岩研究员课题组研制出一种防护剂,如同“植物护甲”,可通过红外线和紫外线照射切换功能,让植物“智能”地选择吸收肥料但“避开”除草剂。
2020-01-23 09:19
“在藏北的伦坡拉盆地,我们又发现了一种鲶,还没命名,正在研究。”近日,在中科院物理所咖啡馆举办的第46期科学沙龙,中科院古脊椎动物与古人类研究所所长邓涛介绍。他以“演化千万载,生命逐山高”为题,讲述了青藏高原和生物共同演化的故事。
2020-01-23 09:16
病理性心肌肥大常见于高血压,心肌病等,发病机制尚不明确,是心血管疾病尤其是心力衰竭的关键病理环节。据曾春雨介绍,这项研究提示人为增强或抑制心肌肥大相关长链非编码RNA表达或可成为心力衰竭的关键治疗手段。
2020-01-23 09:14
“对于新型冠状病毒感染的肺炎病例目前没有特效药物。”22日,在北京市卫生健康委员会召开的防范新型冠状病毒感染的肺炎科普宣教媒体沟通会上,北京中医医院呼吸科主任、主任医师王玉光介绍。
2020-01-23 09:13
22日,记者从教育部了解到,教育部于日前发出通知,要求教育系统做好新型冠状病毒感染的肺炎疫情防控工作。通知指出,各地和学校要摸清寒假期间在校学习生活的学生情况,通过多种形式开展宣传教育,做好留校学生防控工作。
2020-01-23 09:12
据英国《自然·通讯》杂志21日发表的一项环境学报告,德国科学家开展的一项分析研究显示,与人类活动造成的土壤铅污染相比,来自钙钛矿太阳能电池的铅进入部分植物体内的效率是前者的10倍。
2020-01-23 09:11
1月17日,中国农历庚子年新春佳节即将到来之际,在北京人民大会堂举行了在华工作外国专家代表新春座谈会,共庆新春佳节。戴伟刚对中国高教的学生资助体系尤为认同,他说,中国的教育补贴和助学贷款系统非常完善,这让中国青年人对国家产生了强大的向心力。
2020-01-23 09:10
据美国《新闻周刊》网站近日报道,欧洲空间局(ESA)建造了一种原型设施,旨在利用月壤模拟物制造氧气。为利用月壤制造氧气,ESA在位于荷兰的欧洲太空研究与技术中心(ESTEC)建造了氧气生产设施。
2020-01-23 09:08
继2016年在比邻星附近发现比邻星b之后,天文学家最新研究发现,这颗恒星附近可能还存在另一颗行星——比邻星c。相关研究日前发表在《科学进展》杂志上。
2020-01-23 09:07
有人60多岁时心脏依然强健,但肾脏却已开始衰竭;有人可能拥有30岁人的肾脏,却经常罹患传染病。为什么人与人之间衰老过程迥然不同?美国趣味科学网站在近日的报道中称,新研究发现人类存在四种不同的“衰老模式”:免疫、肾脏、肝脏和代谢。
2020-01-23 09:06
据美国《新闻周刊》网站近日报道,美国科学家研制出一种微型设备,能以每分钟3000亿转的惊人速度旋转,刷新了旋转速度最快物体新纪录。
2020-01-23 09:05
美国研究人员近日在《自然·癌症》杂志上发表研究报告称,他们系统地分析了数千种现有药物,发现近50种非肿瘤药物可以杀死癌细胞。研究人员表示,这些新发现不仅有助于推动将现有药物用于癌症治疗,还有助于加速新癌症药物的研发。
2020-01-23 09:04

近日,中国医学科学院发布二〇一九年度中国医学三十九项重大进展,涉及临床医学等六大领域,这些医学重大进展,件件与你我相关。

2020-01-22 16:18
记者从中国卫星海上测控部获悉,1月20日,该部所属的2艘测量船远望3号、远望7号在圆满完成3次海上测控任务后,顺利停靠码头。
2020-01-22 16:17
近日据报道,德国能源巨头意昂集团最近发布的一份研究报告显示,5G网络将大幅增加数据中心的耗电量,由此产生的废热可用于市政供暖。
2020-01-22 09:34
南开大学生命科学学院、药物化学生物学国家重点实验室教授刘林团队通过完全化学小分子的方法,成功将卵巢颗粒细胞重编程为具有生殖系转移能力的诱导性多能干细胞,进而分化为卵子,并通过正常受精获得健康小鼠。
2020-01-22 09:30
加载更多