本文作者:访客

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

访客 2025-06-11 18:33:44 32066
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%摘要: 6 月 11 日,字节跳动旗下火山引擎举办 Force 原动力大会,发布豆包大模型 1.6、视频生成模型 Seedanc...

6 月 11 日,字节跳动旗下火山引擎举办 Force 原动力大会,发布豆包大模型 1.6、视频生成模型 Seedance 1.0 pro 等新模型,并升级了 Agent 开发平台等 AI 云原生服务。

其中,豆包大模型1.6以颠覆性的统一定价模式,将企业常用区间的每百万Tokens价格降至历史低点,实现综合成本降低63%。企业只需花费原来约三分之一的价格,就能获得一个能力更强且原生支持多模态的新模型。

该模型不仅是国内首个支持256K上下文的思考模型,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包 1.6-thinking 的表现已跻身全球前列。在推理能力测试中,豆包1.6在今年高考全国新一卷数学单科中获得144分的成绩。

目前,字节跳动正构建一个AI云原生全栈生态。从面向Agent开发的12款工具产品,到升级AI IDE、发布MCP服务等,火山引擎正在打造一个从开发到部署的全链条服务体系。特别是AI Agent被字节跳动视为继Web和APP之后的新一代技术主体,预示着未来软件开发模式的根本性变革,AI将成为调度者,大幅降低开发门槛,提升效率。

字节跳动CEO梁汝波在大会上表示:

“字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。”
成本革命:每百万Token低至0.8元

火山引擎此次发布的豆包大模型1.6采用了颠覆性的统一定价模式,首创按"输入长度"区间定价策略。在企业使用最频繁的0-32K输入区间内,价格锁定在输入0.8元/百万tokens、输出8元/百万tokens。

这意味着,按照3:1的输入输出比例计算,豆包1.6的综合成本仅为2.6元,相比豆包1.5深度思考模型和DeepSeek R1的7元综合成本,直接腰斩63%。企业现在只需原来三分之一的价格,就能获得能力更强、原生多模态的新模型。

这种统一定价的模式,让网友直呼:

“价格行业最低!”
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%
“统一定价模式令人期待!”

火山引擎还设置了"特惠区"——对于输入32K、输出200tokens以内的请求,输出价格进一步降至2元/百万tokens。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

技术护城河:多模态思考能力全面开花

豆包大模型1.6并非仅仅是价格杀手,其技术实力同样令人瞩目。该模型系列由三个版本组成:

  • doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少 tokens 消耗。
  • doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的强化版本;在代码、数学、逻辑推理等基础能力上进一步提升;支持256K 上下文。
  • doubao-seed-1.6-flash:豆包大模型1.6系列的极速版本,支持深度思考、多模态理解、256K 上下文;延迟极低,TOPT 仅需10ms;视觉理解能力比肩友商旗舰模型。
  • 字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

最引人注目的是其多模态思考能力。模型可以像人类一样理解和处理真实世界问题,支持深度思考、多模态理解、图形界面操作等多项能力。在推理能力测试中,豆包1.6在今年高考全国新一卷数学单科中获得144分的成绩。在海淀模拟全卷考试中,理科拿下 706 分,文科考了 712 分。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

有网友调侃:

“这题我是一道都做不出来”
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

特别值得关注的是其GUI操作能力,凭借领先的视觉深度思考能力和精准的视觉定位能力,智能体可以与浏览器及其他软件进行交互操作。这意味着AI正在从被动响应向主动操作转变,为企业自动化应用打开了全新想象空间。

火山引擎总裁谭待在会上透露,豆包APP正在小范围测试的新功能——deep research。借助这个功能,过去专业人士可能需要花费数小时甚至数天才能完成的专业报告,豆包仅需5到30分钟就能完成。而且生成的报告不仅内容优质、结构严谨,还能自动提炼信息,总结成网页形式,方便人们查阅。

网友表示,豆包已经融入了他们日常生活,根本“离不开”:

“我最近每天用豆包超过一小时。”
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%
“根本离不开。”
字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%
视频生成赛道再下一城

除了大语言模型,火山引擎还发布了豆包·视频生成模型Seedance 1.0 pro。根据第三方权威榜单Artificial Analysis最新结果,该模型在文生视频、图生视频两个维度都超越业界主流模型,登顶全球竞技场第一。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

更关键的是定价策略:每千tokens仅需0.015元,相当于生成一条5秒1080P视频只需3.67元,堪称行业最低价格。如果企业有1万元预算,通过Seedance 1.0 Pro可制作2700多条5秒1080P视频。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

AI云原生全栈布局显现野心

字节跳动的野心远不止于模型本身。此次大会上,火山引擎发布了12款面向Agent开发和应用的工具产品,构建了从开发到部署的全链条服务体系。

在Agent开发层面,升级了AI IDE产品TRAE,月活用户已超过100万;发布火山引擎MCP服务,链接Agent开发体系、大模型工具生态和云服务;推出PromptPilot提示词优化工具,以及开源的veRL强化学习框架。

基础设施方面,针对Agent开发、模型训练和推理分别发布AgentKit、TrainingKit、ServingKit三大套件。特别是云原生推理套件ServingKit,性能相比社区最新版本提升2-3倍,已在互联网、物流、汽车等各行业落地应用。

时代变局:Agent成为新的技术主体

随着AI能力的持续提升,传统的软件开发模式将面临根本性变革。谭待在会上提出的观点颇具前瞻性:

"PC时代主体是Web,移动时代是APP,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务,从被动工具转变为主动执行者。"

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

字节跳动技术副总裁洪定坤则认为,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发"all in one",更大幅度地降低开发门槛,提升开发效率。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

这番表态背后是字节跳动对AI赛道的长期战略布局。截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月刚发布时增长137倍。

字节AI杀疯了!火山引擎大招连发,豆包1.6支持多模态思考能力,综合成本降低63%

根据IDC报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达46.4%。其客户覆盖全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校,这种全行业渗透的态势表明,字节跳动已在AI基础设施领域构建起显著优势。

从定价策略到技术布局,从单一模型到全栈服务,字节跳动正在构建一个完整的AI生态帝国。通过激进的价格战略和技术创新,字节不仅在挑战现有AI市场格局,更是在为即将到来的Agent时代抢占制高点。

阅读
分享