点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:火山引擎发布大模型训练视频预处理方案
首页> 科技频道> 人工智能 > 正文

火山引擎发布大模型训练视频预处理方案

来源:光明网2024-10-15 14:05

  10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

  火山引擎总裁谭待表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”

  自研多媒体处理框架BMF ,助力豆包视频生成模型突破业界难题

  据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

  抖音集团视频架构负责人王悦表示,对大模型厂商而言,上述过程中面临着诸多挑战。

  “首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

  借助Intel的CPU、GPU等不同资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。

  此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

  Bytedance Research 负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。火山引擎视频云团队提供的点播解决方案还为PixelDance生产的视频提供了从编辑、上传、转码、分发、播放的全生命周期一站式服务,让模型的商业化应用有了保障。

  据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用 DiT 架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题,在业界引起广泛关注。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

  多项“音视频+AI”技术方案,助力企业全链路适配AIGC时代

  此次活动中,火山引擎还发布了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D&大场景重建方案,从视频的生产端、交互端到消费端,全链路融入了AI的能力。

  火山引擎视频云负责人表示,在AI视频时代,人和AI交互变得更加动态和生动,这要求处理链路更加智能和交互。

  以对话式AI实时交互方案为例,依托豆包大模型和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和自然语言处理的强大能力,可实现毫秒级人声检测和打断响应,以及丝滑稳定的端到端响应体验。

  在沉浸式消费体验方面,火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景。

  大会上,王悦还透露了字节自研视频编解码芯片的最新进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,成本节省了95%以上,还在2024MSU世界编码器大赛中一举夺得最佳ASIC编码器。

  据悉,该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。(科文)

[ 责编:李欣哲 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 探洞研学欢乐多

  • 颐和园秋色

独家策划

推荐阅读
据日前召开的全国农业科技工作会议消息:围绕建设农业强国战略需求,我国将谋划设立一批重点实验室、大科学装置,建设一批农业科学实验站和数据中心,大力发展新型研发机构,抓好国家农业高新技术产业示范区建设。
2024-10-25 09:16
钙钛矿太阳能电池作为一种新兴清洁能源,为光伏行业高质量发展注入了新动能。近日,北京大学联合国内外多个研究组,提出高密勒指数晶面相干生长提升钙钛矿太阳能电池性能的新策略。相关研究成果发表于《自然》。
2024-10-25 09:12
24日,国家航天局在北京举办实践十九号卫星载荷交付仪式。此次交付的实践十九号卫星搭载载荷包括主粮作物、经济作物、微生物航天育种载荷以及空间技术试验载荷等二十大类。
2024-10-25 09:08
“1公斤DNA便可以装下全世界数据。”日前,北京大学张成、钱珑联合研究团队与合作者提出了一种全新的并行“印刷”DNA存储策略,成功将信息打印在DNA分子之上,犹如在白纸上批量印刷信息。
2024-10-25 09:03
日前,国仪量子发布全球首个AI电子顺磁共振波谱仪,该系列产品不仅具备AI功能,还将关键核心指标——信噪比提至全球最高水平的10000:1,取得顺磁共振波谱学领域的重大突破。
2024-10-25 09:02
一项研究表明,自2001年以来,全球由森林火灾产生的二氧化碳排放量激增了60%。相关研究10月17日发表于《科学》。
2024-10-24 09:12
近日,中国科学院、国家航天局、中国载人航天工程办公室联合发布《国家空间科学中长期发展规划(2024—2050年)》(下称“规划”)。规划提出了中国有望取得突破的五大科学主题和17个优先发展方向。其中,在“宜居行星”主题中,太阳系考古、地外生命探寻等优先发展方向备受关注。
2024-10-24 09:17
免疫检查点阻断(ICB)是一种重要的癌症疗法,遗憾的是,该疗法应答率偏低——对少数产生应答的患者疗效显著,对大部分患者却难以奏效。因此,如何提高ICB治疗应答率成为癌症治疗的一个关键问题。
2024-10-24 09:11
近日,西北工业大学物理科学与技术学院教授臧渡洋团队成功制备出地球上最“长寿”气泡,在声悬浮条件下气泡保持时间可达23分36秒,且在被直径0.8毫米的热铜针穿透时,悬浮气泡仍能保持不破裂。
2024-10-24 09:10
近日,中国科学院新疆理化技术研究所(以下简称“新疆理化所”)发布了一项引人注目的研究成果:科研人员以地球玄武岩为原料模拟火星壤,并通过熔融拉丝技术,将其制备成连续模拟火星壤纤维。这意味着未来人类有望就地取材,建设火星基地。相关研究论文于日前发表于国际期刊《交叉科学》。
2024-10-24 09:08
科学技术的发展让人们获益,又带来一些问题和挑战。
2024-10-24 09:05
10月23日是今年的霜降节气。有人会问,“霜降”的霜从哪里“降”?是像雨和雪一样从天上降下来吗?二十四节气中,霜降与白露、寒露等都反映了气温下降带来的变化,露和霜又有什么区别?
2024-10-23 09:37
中国科学院南海海洋研究所(以下简称南海海洋所)研究员詹海刚团队与澳大利亚联邦科学与工业研究组织研究员冯明等合作,首次从全球尺度上揭示了涡旋在驱动海洋次表层热浪/冷浪事件中的关键作用,并指出涡旋会放大全球变暖对次表层极端温度的影响,加剧强热浪/冷浪的发生。近日,相关研究成果发表于《自然》。
2024-10-23 09:35
银线飞架,纵横神州。只用0.00526秒,就可以把青海的绿色能源输送到1500多公里之外的河南;一秒的输电量足够一个家庭使用两年……这就是神奇的特高压输电工程。
2024-10-23 09:29
随着科幻氛围日渐浓厚,我国科幻创作队伍和读者队伍都在迅猛增长,科幻作家的创作热情高涨,中国必将成为科幻文学创作的热土。
2024-10-23 09:22
近日,中国科学院、国家航天局、中国载人航天工程办公室联合发布《国家空间科学中长期发展规划(2024—2050年)》,规划部署了我国在空间科学研究领域拟突破的五大科学主题和17个优先发展方向。
2024-10-23 09:19
记者21日从中国科学技术大学先进技术研究院了解到,由该院孵化的中科永安(安徽)科技有限公司实施的新一代智能化环保型压缩空气泡沫高效灭火技术工程化研发项目,近日通过安徽省重大科技成果工程化研发项目验收。该技术通过优化泡沫生成与喷射系统,可应用于各类复杂火灾场景中高效灭火,尤其对锂电池灭火具有显著效果。
2024-10-22 11:09
近日,香港城市大学(以下简称港城大)成功研发出新型器件结构,可大幅提升钙钛矿太阳能电池的稳定性和效率,并简化生产工序、降低成本。研究显示,团队在改善二氧化锡层的氧空位缺陷后,器件的能源转化效率已超25%。
2024-10-22 11:09
记者21日从中国科学院国家天文台获悉,我国首个暗能量射电探测实验项目——天籁实验阵列,成功被平方公里阵(SKA)大射电天文台组织认证为SKA探路者项目,将为SKA提供新的科学探索机遇。
2024-10-22 11:08
科研工作不仅需要扎实的理论基础和实践能力,更需要坚定的理想信念和持之以恒的毅力。
2024-10-22 11:07
加载更多