点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
模型日均tokens从1200亿增长到4万亿,需要多长时间?豆包大模型给出的时间是——7个月,数据背后是2024年中国大模型应用市场爆发式增长的缩影。12月18日,火山引擎Force原动力大会在上海举办,豆包视觉理解模型正式发布,并以“厘”级的定价为企业提供极具性价比的多模态大模型能力。
大会期间,火山引擎总裁谭待在接受记者采访时表示,豆包大模型在视觉理解、信息处理等领域展现出强劲的增长潜力,不仅仅局限于对话场景,而是广泛应用于生产力相关的多元化场景。围绕如何让大模型用得起、用得好,以及如何帮助企业做好AI创新,推动大模型应用落地,谭待进行了深入解读。
豆包生成图片(关键词:大模型、AI、世界、全面开花)
让大模型用得起、用得好
当前,大模型在各种场景中都在“全面开花”。最近3个月,在信息处理场景,豆包的调用量增长39倍;客服与销售场景,豆包的调用量增长16倍;在硬件终端场景,豆包增长了13倍,AI工具增长9倍。
豆包大模型为何增长如此迅猛?谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
豆包视觉理解模型是当天的重头戏。据介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。
比如,光从云朵里洒出来的美丽照片,模型能识别出这是丁达尔效应并解释背后的原理;根据一张影子图片,视觉理解模型能一眼识别出小动物的影子,并且推断出这是一只猫……不仅如此,该模型还具备出色的理解和推理能力,无论是微积分题,还是高考物理,还是处理代码、分析图表等需求,它都能轻松胜任。
在定价方面,豆包视觉理解模型每千tokens输入价格定为3厘(即0.003元),一元钱就可处理284张720P的图片,比行业价格便宜85%。今年5月,字节跳动在正式对外发布豆包大模型时,就曾因定价比同行低99.3%而引起关注。谭待表示,“豆包大模型通过技术创新优化成本,保持合理的毛利。我们一次性地把成本做到位,就是希望更多的人,特别是中小企业、创业公司、个人能用起来、用得好,创造价值。”
AI+教育、AI+游戏、AI+汽车,甚至AI+天文、AI+养鱼、AI+美食……各种脑洞大开的应用场景让人感叹“AI+千行百业”的态势一日千里。大模型正加速融入普通人的生活日常,并渗透进与生产力相关的场景,而随着模型能力变强,模态变多,也会解锁越来越多的新场景。
帮助企业做好AI创新
会上,豆包3D生成模型首次亮相。豆包3D模型采用3D-DiT等算法技术生成高质量的3D模型;veOmniverse,则是火山和英伟达一起合作的数字孪生平台,火山引擎将二者结合起来,就可以实现AIGC 世界的仿真模拟器。
通过豆包3D模型与veOmniverse的结合方案,用户可以高效完成智能训练、数据合成和数字资产制作,满足仿真训练的多样化需求,加速虚拟与现实的深度融合。
谭待表示,就目前数据来看,在工作、娱乐、生产力的场景其实是差不多的。在他看来,大模型发展过程中需要2C和2B齐头并进,物理与虚拟齐头并进,“大模型比过去的很多技术都更容易连接数字世界和物理世界。”
当天,豆包大模型多款产品迎来更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
同时,火山引擎升级了火山方舟、扣子和HiAgent三款平台产品,帮助企业构建好自身的AI能力中心,高效开发AI应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域AI搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。
“今年是大模型高速发展的一年”,谭待表示,“当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮助企业做好AI创新,驶向更美好的未来。” (战钊)