字节跳动豆包大模型全面升级，视频生成模型或成AI竞争新焦点

发布：2024-12-19 15:25:00 阅读：360

在科技日新月异的今天，大模型技术正以前所未有的速度蓬勃发展。火山引擎总裁谭待形象地比喻道：“面对一列高速行驶的列车，最重要的是确保自己能够搭乘其上。”这一观点在近期火山引擎Force大会上得到了进一步印证。

会上，字节跳动推出了豆包视觉理解模型，标志着视觉理解模型也正式迈入“厘时代”。这一模型不仅为企业提供了极具性价比的多模态大模型能力，更预示着AI技术在视觉领域的深度应用即将迎来新的突破。据悉，豆包视觉理解模型能够精准识别视觉内容，具备强大的理解和推理能力，可完成复杂任务如分析图表、处理代码及解答学科问题等。其细腻的视觉描述和创作能力，使得千tokens输入价格仅为3厘，一元钱即可处理284张720P的图片，相比行业价格便宜了85%。

谭待表示，豆包视觉理解模型不仅将极大地拓展大模型的能力边界，还将降低人们与大模型交互的门槛，解锁更多应用场景。目前，该模型已接入豆包App和PC端产品，注重多模态输入，包括语音、视觉等能力，并已通过火山引擎开放给企业客户。

火山引擎总裁谭待

会上还首次亮相了豆包3D生成模型，该模型与火山引擎数字孪生平台veOmniverse结合使用，能够高效完成智能训练、数据合成和数字资产制作，成为支持AIGC创作的物理世界仿真模拟器。豆包大模型的多款产品也迎来了重要更新：豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构升级到生成3分钟的完整作品；文生图模型2.1版本则首次实现了精准生成汉字和一句话P图的产品化能力。

即梦Dreamina 张楠

即梦Dreamina的张楠认为，生成式AI技术能够将人们脑海中的奇思妙想快速视觉化，像做梦一样。即梦希望成为“想象力世界”的相机，记录每个人的奇思妙想，帮助每个人轻松表达和自由创作。而豆包大模型的应用也在加速落地，截至12月中旬，豆包通用模型的日均tokens使用量已超过4万亿，较首次发布时增长了33倍。在B端，豆包大模型已与八成主流汽车品牌合作，接入多家智能终端，覆盖终端设备约3亿台。

豆包大模型应用场景

与企业生产力相关的场景，豆包大模型也备受青睐。最近3个月，豆包大模型在信息处理场景的调用量增长了39倍，客服与销售场景增长16倍，硬件终端场景增长13倍，AI工具场景增长9倍，学习教育等场景也有大幅增长。谭待认为，豆包大模型市场份额的爆发，将让AI成为每一家企业都能用得起、用得好的普惠科技。随着大模型时代的到来，云计算也在经历变革。火山引擎认为，下一个十年的计算范式应从云原生进入到AI云原生的新时代，并基于此推出了新一代计算、网络、存储和安全产品。

上一篇：2024微博消费新风向：年轻人引领六大潮流趋势，你跟上了吗？

下一篇：2025北京智造装备展：工业自动化与机器人技术引领产业升级新风尚

字节跳动豆包大模型全面升级，视频生成模型或成AI竞争新焦点

最新新闻

相关新闻

热门产品