点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:豆包“王炸”!字节跳动发布两款视频生成大模型
首页> 科技频道> 人工智能 > 正文

豆包“王炸”!字节跳动发布两款视频生成大模型

来源:光明网2024-09-24 16:12

  9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,正式发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

  无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”

豆包“王炸”!字节跳动发布两款视频生成大模型

图:火山引擎总裁谭待发布豆包视频生成模型

  创新技术,破解多主体互动和一致性难题

  此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

  据介绍,豆包视频生成模型基于 DiT 架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。

  经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

  目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦AI市场负责人陈欣然认为,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦AI希望成为用户最亲密和有智慧的创作伙伴。

  豆包大模型推出业界最高并发流量标准

  此次活动中,豆包大模型不仅新增视频生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。

  在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

  此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业发展的关键因素。

  谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。

  “在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和服务。”谭待表示。(战钊)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 广西贺州“空心村”变身文旅打卡地

  • 山东临沂:民众畅游曹洼大集

独家策划

推荐阅读
一些不法商家钻监管漏洞,推出所谓“智驾神器”规避车辆安全监控,不仅严重威胁道路交通安全,更触碰了法律红线,扰乱了新能源汽车产业的健康发展秩序。
2025-12-09 10:11
一项新研究揭示了这些天体表面下可能发生的活动,为了解其多样地质特征的形成机制提供了线索。相关研究成果近日发表于《自然-天文学》。
2025-12-09 10:02
实验结果显示,将化合物注射给抑郁模型小鼠后,仅1小时便可观察到显著的抗抑郁效果,且无明显副作用。
2025-12-09 10:01
北京大学生命科学学院罗述金课题组与合作团队,通过古DNA研究发现,家猫直至唐代前后才通过丝绸之路商旅传入中国。
2025-12-09 09:58
7日,中国安全生产科学研究院与国家管网集团,在新疆哈密的国家管网集团管道断裂控制试验场,成功完成了我国首次全尺寸高压纯氢管道喷射火系列试验。
2025-12-09 09:57
基于这样的研究背景,柴秀娟团队近日研发出一种数字孪生驱动的智能温室采摘系统,能有效解决现代温室番茄生产密植环境下,机器人采摘效率低、易损伤植株的问题。团队成员郎一宁介绍:“首先,机器人搭载的滑轨式深度相机会沿温室逐行扫描,采集高精度的RGB-D数据。
2025-12-08 09:54
记者从国家数据局获悉,截至9月底,我国已建成高质量数据集总量超500PB(拍字节,计算机存储容量单位);7个数据标注基地引进和培育标注企业362家,标注从业人员达8.5万人,带动数据标注相关产值163亿元。
2025-12-08 09:53
“梦想”号大洋钻探船的母港在广州海洋地质调查局科考码头,出海执行作业任务时需要通过深中大桥。多年来,我们与150余家参研参建单位团结协作、集智创新,攻克了一个个技术难题,建成了这艘具有我国完全自主知识产权、全球领先的大洋钻探船。
2025-12-08 09:52
空中的昆虫堪称地球上最灵活的生物,能精准完成急转弯、急刹车和空中翻转。美国内华达大学里诺分校的航空航天工程师Hoang-Vu Phan指出,这款新设备标志着“微型机器人性能的巨大飞跃”。
2025-12-08 09:51
近日,中国科学院西安光学精密机械研究所超快光科学与技术全国重点实验室研究员姚保利团队在定量相位成像领域取得进展,提出了正交偏振复用剪切干涉技术,并研发出集成化定量相位相机Q-camera。
2025-12-08 09:50
这次经历让我开了窍:一个顶尖的技术工人,不能只满足于执行标准,更要具备在标准之外创造解决方案的能力。我带徒弟,始终坚持“手把手教技能,实打实查问题,面对面讲后果”。
2025-12-05 10:15
由此,研究团队模仿亚洲玉米螟幼虫头壳的结构特点,在实验室中成功“复刻”出具有类似仿生层状结构的水凝胶。为验证实际效果,研究团队将这种水凝胶安装在农业害虫侦查无人机的防撞支架上,并在模拟果园环境的复杂通道中进行测试。
2025-12-05 10:16
“十四五”时期,我国批准上市创新药达210个。为保证药品安全有效,药监部门对新药研发、生产、上市作出一系列严格规定,强化研发生产各环节质量管理。
2025-12-05 10:22
据中国载人航天工程办公室消息,根据计划安排,神舟二十一号航天员乘组将于近日择机实施第一次出舱活动。目前,空间站组合体运行稳定,神舟二十一号航天员乘组状态良好,已做好出舱活动各项准备工作。
2025-12-05 10:17
大国工匠的成长是一个长期、连续、贯通的过程,职业教育要为学生构建可持续发展的成长通道。在新时代的征程中,职业教育应不断探索符合技术技能人才成长规律的教学模式,为培养更多大国工匠、能工巧匠作出更多贡献。
2025-12-05 10:15
12月1日至4日,第十三届世界科学记者大会在南非比勒陀利亚举行。
2025-12-05 10:48
为何CCER可以抵消碳排放?这里不得不提到中国的碳市场。在这样一个市场里,碳减排量可以像日常商品一样被交易。
2025-12-04 10:13
近日,中国科学院院士、中国科学院分子植物科学卓越创新中心(以下简称分子植物卓越中心)研究员林鸿宣团队与上海交通大学研究员林尤舜团队、广州国家实验室研究员李亦学团队合作,种出了“不怕热”的水稻。
2025-12-04 10:03
科学家发现了一种可以在63摄氏度下存活的单细胞变形虫,创造了真核生物的耐热纪录。拉森火山国家公园以冒泡的酸性湖泊和炽热的地热池而闻名,但该变形虫却来自一条pH中性的“热溪流”。
2025-12-04 10:04
根据我国风电光伏基地规划布局方案,至2030年,这些新能源基地总装机规模将达4.55亿千瓦,大约相当于20个三峡水电站的总装机容量——“沙戈荒”生态环境脆弱,一旦遭到破坏,恢复难度大,大规模建设光伏风电发电基地可能会影响当地的植被、土壤和水资源等。
2025-12-04 10:01
加载更多