点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:豆包“王炸”!字节跳动发布两款视频生成大模型
首页> 科技频道> 人工智能 > 正文

豆包“王炸”!字节跳动发布两款视频生成大模型

来源:光明网2024-09-24 16:12

  9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,正式发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

  无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”

豆包“王炸”!字节跳动发布两款视频生成大模型

图:火山引擎总裁谭待发布豆包视频生成模型

  创新技术,破解多主体互动和一致性难题

  此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

  据介绍,豆包视频生成模型基于 DiT 架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。

  经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

  目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦AI市场负责人陈欣然认为,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦AI希望成为用户最亲密和有智慧的创作伙伴。

  豆包大模型推出业界最高并发流量标准

  此次活动中,豆包大模型不仅新增视频生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。

  在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

  此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业发展的关键因素。

  谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。

  “在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和服务。”谭待表示。(战钊)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 游西夏陵 开启新体验

  • 江苏扬州至镇江直流输电二期工程建成投运

独家策划

推荐阅读
近日,一个名为Moltbook的社交平台突然走红。与普通网络平台不同的是,Moltbook上的用户都是AI智能体。
2026-02-14 09:21
全球规模最大的200万吨/年柴油吸附分离装置目前在中国石油广西石化稳定运行。
2026-02-14 09:16
大连理工大学赵珺教授带领师生团队正抓紧时间,为实现可重复使用运载火箭关键部件的“复用检测”技术突破全力冲刺。
2026-02-14 09:12
一场刷新人类对宇宙极端物理过程认知的高能事件,被中国科学卫星清晰捕获并成功解读。
2026-02-14 09:11
近日,中国计量科学研究院研制的锶原子光晶格钟NIM-Sr1正式获准校准国际标准时间,实现了我国光钟参与校准国际标准时间“零”的突破。
2026-02-14 09:10
装上智能仿生手,截肢患者可以轻松拿起水杯喝水;高位截瘫患者用意念移动电脑光标,操控轮椅,指挥机器狗取外卖……
2026-02-13 09:50
凌晨2时,南昌西动车组运用一所检修库内灯光如昼。“接触网已断电,安全措施准备完毕,申请登顶!”确认许可后,国铁南昌局电务段南昌西车载设备车间工长曹准与工友一前一后登上动车组车顶,对北斗天线进行全面“体检”。
2026-02-13 09:45
近日,广西涠洲岛海域发生渔船撞击布氏鲸事件,鲸鱼受伤的画面令人揪心。虽然撞鲸的并非观鲸船,但这起事件也给正处于旺季的观鲸游敲响警钟——负责任地观鲸,有边界地亲近,人与自然和谐共生图景才能真正长久。
2026-02-13 09:43
核光钟通过真空紫外激光诱导原子核跃迁,具备更高精度与强抗干扰能力,且可实现便携化应用。但研制核光钟的道路上的一个核心瓶颈,是无法研制出能激发核跃迁的连续波激光光源。
2026-02-13 09:42
2021年,王勤团队开始研发低成本、适用于牧场环境的马匹体形自动测定设备。王勤团队搜集了全球90个马群体、近40个品种的基因组信息,构建了包含2000多个个体的参考面板——这是目前全球规模最大的马基因组参考数据库。
2026-02-13 09:36
一纸锦旗山水间,杏林春暖绿意长。
2026-02-12 11:01
金星与地球大小相近,同样诞生于太阳系内侧,却有着截然不同的命运。
2026-02-12 09:41
科技部十司相关负责同志解读《调查处理规定》。
2026-02-12 09:38
《细胞》封面:猕猴屏状核细胞分类与全脑联接图谱。在当前脑图谱大科学计划研究目标迈进绘制非人灵长类介观脑图谱的关键阶段,中国科学家仍在进一步集聚全球力量,持续扩大“朋友圈”。
2026-02-12 09:25
据悉,在战略上,植物星球计划还将整体提升全球生物多样性保护和实现碳中和的生态能力,构建植物科学领域全球大科学命题国际合作的新格局。
2026-02-12 09:17
马年将至,作为一种兼具力量与速度的动物,马正受到格外的关注。
2026-02-12 09:12
工业和信息化部等五部门近日印发《关于加强信息通信业能力建设支撑低空基础设施发展的实施意见》。加强监管能力体系建设,规划无人机专用号段,推动“一机一码一号”能力建设,探索标识解析在无人机领域的应用,形成无人机通信资源精细化管理。
2026-02-11 09:25
全球森林逐渐被快生树木主导,而稳定生态系统的慢生树种正在消失。“我们关注的是极为独特的物种,它们主要集中在生物多样性丰富、生态系统联系紧密的热带和亚热带地区。“此外,在现在和未来受到干扰的地区,非本地物种可能会加剧对光、水和养分的竞争,从而使本地树木更难生存。
2026-02-11 09:32
中国科学院动物研究所研究员王红梅带领的“灵长类胚胎发育的规律解析与体外模拟团队”,用27年的接力攻坚,把灵长类早期胚胎发育这个看不见、摸不着的“黑匣子”,变成了清晰可见的“生命剧本”。
2026-02-11 09:32
截至1月28日,“横竖都是世界第一”的贵州花江峡谷大桥累计接待游客突破130万人次,通行车辆超20万辆次,持续为区域发展注入新动能。大桥带来的发展溢出效应令人瞩目,而深入大桥肌理探查,你会发现,支撑起这座庞然大物的每根细钢丝,全部都是“中国造”。
2026-02-11 09:31
加载更多