点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人人皆可“一语成画” AI作画神器来了!
首页> 科技频道> 人工智能 > 正文

人人皆可“一语成画” AI作画神器来了!

来源:光明网2022-08-19 18:18

  8月19日,中国图象图形大会CCIG 2022在成都召开。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在会上发表《跨模态大模型技术创新与实践》主题演讲,并正式发布AI艺术和创意辅助平台——文心·一格,这是百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品。

  文心·一格为艺术创想插上科技羽翼,人人都能成为“艺术家”

  人学习作画一般得从基本功练起,大体上包括线条、色彩、明暗、形体、结构、透视、构图和空间。要想画得出众,除了日积月累勤奋练习,还需要一些天赋,以及对世界的精细观察和创作者独特的创想。这让大部分人只能当画作的观赏者而非创作者。但是,随着深度学习、大模型等技术的发展,AI 能够在极短的时间内“创造”出不同风格的画作,大幅降低了作画的门槛,让人人都能成为“艺术家”。

  文心·一格是基于文心大模型的文生图系统实现的产品化创新。在文心·一格官网,用户只需输入自己的创想文字,并选择期望的画作风格,即可快速获取由一格生成的相应画作。官网资料显示,文心·一格现已支持国风、油画、水彩、水粉、动漫、写实等十余种不同风格高清画作的生成,还支持不同的画幅选择。

  文心·一格面向的用户人群非常广泛。它既能启发画师、设计师、艺术家等专业视觉内容创作者的灵感,辅助其进行艺术创作,还能为媒体、作者等文字内容创作者提供高质量、高效率的配图。此外,文心·一格更是为大众用户提供了一个零门槛绘画创作平台,让每个人都能展现个性化格调,享受艺术创作的乐趣。

  文心·一格背后的跨模态大模型技术与系统创新

  吴甜表示,数据的井喷式增长、算力的持续突破、算法的持续创新为人工智能带来新机遇,预训练大模型凭借优越的泛化性、通用性和应用效果,成为人工智能发展的重要方向。跨模态大模型是在技术发展和产业实践中孕育而出的,也是百度文心知识增强大模型面向产业应用持续创新及建设的重要方向。

  面对日益增长的内容创作需要,如何准确理解用户需求,进而精准刻画并满足多样化风格、高质量生成的要求是技术要解决的关键挑战。文心知识增强跨模态理解大模型在模型创新方面,提出基于多视角对比学习的ERNIE-ViL 2.0,在预训练过程能够同时学习模态间和模态内的多种关联性,提升“图像”和“文本”跨模态语义匹配效果。知识增强跨模态图文生成大模型ERNIE-ViLG,将“文生成图”和“图生成文”任务融合到同一个模型进行端到端学习,从而增强文本和图像的跨模态语义对齐。在此次CCIG 2022会上,吴甜还分享了ERNIE-ViLG文图生成算法的升级,通过渐进式扩散模型,生成空间由小及大、生成轮廓由粗到细,同时根据生成阶段自动选择最优生成网络,文本生成图像的效果取得进一步提升。

  新技术在产业实践中应用并创造出价值必须要足够实用化。因此,百度基于文心大模型进行了系统创新,研发了支持AI作画的文生图系统,提供了从用户需求理解到满足的全流程解决方案。首先,基于知识的Prompt工程,理解用户需求并在此基础上丰富语义细节,降低用户输入描述成本。其次,基于扩散生成算法实现创意写实与恢弘构图的艺术画作生成。最后,基于跨模态匹配大模型进行生成画作的结果排序,自动选出语义与美观度最佳的画作。

  从技术创新到系统创新再到产品化创新,这一体系性的创新得益于飞桨产业级深度学习平台的夯实有力支撑。飞桨的端到端自适应分布式训练技术、4D混合并行策略、对异构硬件的自适应并行支持,锤炼出框架与算力、算法相结合三位一体的大模型训练优势。飞桨的自动模型压缩工具、自适应分布式推理技术,更是大幅节约了机器资源,让大模型的部署更加高效、便捷,能真正落地应用。

  吴甜认为,新技术应用于场景,需要从基础算法、技术系统、工程平台多方面同时创新,文心·一格就是依托于多项新技术综合创新的产品。

  除了推出一格这样的AI艺术和创意辅助平台,文心跨模态大模型还为广大开发者、科技爱好者提供了飞桨开源工具和API服务能力,满足开发者灵活探索等需求。对灵活性需求更高的开发者,可以使用飞桨的开源工具PaddleHub基于文图生成开源算法极简开发,并完成模型的管理和一键预测。对便捷性需求更高的开发者,可以使用文心ERNIE-ViLG API,极速获得沉浸式文图生成大模型的技术体验,更可灵活方便、高效地实现产品集成。

  据了解,为了帮助更多行业用户清晰了解、轻松应用基于大模型技术的AIGC能力,百度飞桨文心大模型已在8月开设AIGC系列公开课,课程深入浅出、体系全面并配套丰富的实践资源。

  让机器具备跨越文本、图像等多种模态的复杂场景理解与生成能力,是人工智能的重要目标之一,也是数字时代科技与产业深度融合创新,催生新业态新模式,加快产业智能化升级的新动能。人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,同时也让公众对科技与艺术及文化的融合创新有了更大的想象空间。文心大模型正在成为推动AIGC(人工智能生成内容)发展的新引擎,基于文心大模型的AIGC将会带来创新性的探索,并赋能到广泛的行业领域。

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 世界环境日:美丽中国我先行

  • 美丽中国|夏日大青山

独家策划

推荐阅读
面对日益增长的海量视频数据和复杂多变的应用场景,当前的视频监控系统在实时性、准确性和智能化水平方面仍然面临显著挑战。
2025-06-06 10:43
我国建成全球规模最大的互联网办电服务体系,信息化、网络化、智能化的高效便捷办电服务方式基本形成。
2025-06-06 10:35
科幻电影中凭借红外视觉锁定目标的“超视觉”已在实验室中照进现实。
2025-06-06 10:32
中国科学院近代物理研究所甘再国研究员团队与合作者利用兰州重离子加速器国家实验室加速器装置,首次合成了目前已知最缺中子的镤同位素——新核素镤-210。
2025-06-06 10:31
为深入贯彻中央种业振兴市场净化行动部署,按照种业监管执法年活动安排,农业农村部近日在全国范围内部署开展农作物种子基地监督检查工作,紧盯繁种制种关键环节和重点区域,严把制种源头关,切实保障农业生产用种安全。
2025-06-06 04:15
“一本顶5本,22个超大触摸页面融合18种材质,完全开发宝宝触感神经系统,实现手眼脑三维协调发展。”
2025-06-06 09:50
空天跨尺度计量基准大科学装置建设现场一派繁忙景象,目前项目进展顺利,预计将于2026年建成并投入使用。
2025-06-05 09:43
数据显示,在“本源悟空”的境外用户中,美国、加拿大等量子技术强国访问频次持续领先,其中美国用户访问量稳居境外第一。
2025-06-05 09:42
5月28至29日,宁夏电网迎来历史性时刻——新能源日发电量连续两天超越区内统调用电量,成为国内首个新能源日发电量超越区内统调用电量的省区。
2025-06-05 09:41
国家公园人才培养创新联盟成立大会日前在北京举行。
2025-06-05 09:40
2025年1月,精准智能化学全国重点实验室正式获批,标志着中国科大在“有组织科研”战略上再添国家级平台。
2025-06-05 09:39
中国科学院国家天文台领导的国际合作团队在银河系的“盖亚-香肠-恩克拉多斯”(GSE)吸积矮星系遗迹中,发现了一颗具有高钍/铕比的锕系元素增丰极贫金属星。
2025-06-04 09:47
生态环境部、文化和旅游部、中国文联、中国作协近日联合印发《关于进一步加强生态文化建设的指导意见》,对生态文化建设工作进行全面系统部署。
2025-06-04 09:43
截至今年6月1日19时,江苏核电“和气一号”核能供汽项目已累计供应清洁工业蒸汽300万吨。
2025-06-04 09:40
长久以来,天文学家一直认为,在大约50亿年后,银河系将不可避免地与仙女星系发生碰撞,并最终合并为一个全新的星系“Milkomeda”。但现在人们发现,银河系的未来宛如一部“变形记”,会比之前想象的更加多变且不确定。
2025-06-04 09:39
国家卫健委3日发布《关于医防管交叉复合型战略人才队伍建设发展的意见》。医防管人才可优先被认定为卫生健康高层次人才,拓宽其职业发展通道,并积极推荐参与选拔任用党政领导干部。
2025-06-04 09:36
穿过村庄、绿树、田地……眼前的风景逐渐“褪色”,护林员艾散江抵达了工作地点——艾西曼区域生态修复及荒漠化治理工程核心区。
2025-06-04 09:33
在“尖班”,学生进入学习阶段同时也进入研究阶段,我们将国际重大科技前沿问题等清单转化为学生课题清单,让学生参与到团队的科研攻关过程中
2025-06-03 11:17
 柴油车尤其是重型货车堪称“经济动脉”。
2025-06-03 10:39
手足口病是病毒感染导致的,多发于儿童,急诊处理主要是对症治疗,
2025-06-03 10:36
加载更多