字节跳动发布『豆包』大模型1.6、图像编辑模型3.0、同声传译模型2.0(字节跳动公司作品)

字节跳动发布『豆包』大模型1.6、图像编辑模型3.0、同声传译模型2.0(字节跳动公司作品)

7 月 30 日消息,今天,在 FORCE Link AI 创新巡展・厦门站,字节跳动火山引擎发布『豆包』・图像编辑模型 3.0、『豆包』・同声传译模型 2.0,『豆包』大模型 1.6 系列全新升级,并宣布开源扣子核心能力发布企业自有模型托管方案、Responses API 等多个模型服务和工具产品。

从官方获悉,『豆包』・图像编辑模型 SeedEdit 3.0 基于强大的文生图模型 Seedream 3.0,具备更强的指令遵循能力、图像保持能力和更强的图像生成质量;叠加多样化的数据融合方法与特定奖励模型,可支持 1K 以上高清图像的生成与处理。

用户只需通过自然语言指令,即可完成消除多余内容、改变光影效果、替换文字等操作。同时,『豆包』・图像编辑模型 3.0 具备对风格、结构与语义的精准控制力,能够像人类大脑一样理解指令、深度思考,解锁更多创新的修图场景,例如图像风格转换、变换材质、变化人物姿势、根据提示词进行推理等 P 图玩法。

官方介绍称,『豆包』・图像编辑模型 3.0 可广泛应用于影像创作、广告营销、游戏宣传等领域,企业用户可在火山方舟平台调用 API,个人用户可使用即梦或『豆包』 App 进行体验。

不该动的地方,绝不动!

『豆包』・图像编辑模型 3.0 精准锁定头发区域换成短发,只修改毛衣区域颜色和纹理并添加项链。

调整人物姿态让其自然落座,背景、人物面部特征、其他细节毫发无损!

▲ prompt:变成时尚短发造型。改变姿势,让她坐在椅子上

你的话,它听得懂、做得到!

『豆包』・图像编辑模型 3.0 只瞄准文字区域,字体、光影会自动匹配原图风格,智能填充周围纹理,画面完好如初!

▲ prompt:把“MORE”变成“MAGAZINE”。把“探索未知”变成“凝视内心”

P 完还是那么美,那么清晰!

『豆包』・图像编辑模型 3.0 让黑夜秒变阳光明媚的白昼,光影自然过渡,建筑、树木细节清晰锐利,毫无涂抹感或分辨率下降。

▲ prompt:把场景变为白天

会“脑补”,理解力 MAX!

『豆包』・图像编辑模型 3.0 能理解“发酵”过程,生成体积膨大、充满气泡的发酵面团图。并且基于面团状态进行推理,在保持面团主体关联性的前提下,生成金黄酥脆、香气四溢的面包图。

prompt:1 小时之后将会发生什么?面团会变成什么样的食物呢?

旅游照片中路人太多?说句“去掉所有路人”,背景瞬间干干净净~

▲ prompt:把所有路人都去掉

下载的图片有水印?下指令“消除文字”,无痕处理比橡皮擦还好用~

prompt:消除图片中的文字

老照片想上色?线稿想变写实?一句话搞定,色彩均匀又自然。

prompt:把女人站在埃菲尔铁塔前的黑白照片变成彩色的

prompt:把线稿建筑变成水彩画

想换光影氛围?发出指令“逆光 + 暖色调 + 金色光晕”,秒变电影质感。

prompt:保持原画面主体内容与构图不变,逆光、暖色调、光影交织、轮廓光、氛围感、阳光洒入、金色光晕、明暗对比

想给照片或设计换个 Style?“毛毡风”“水彩风”“卡通风”…… 一句指令就能切换,让你的创意无限延伸!

『豆包』・同声传译模型 2.0正式发布:3 秒极低延迟,0 样本声音复刻

传统的翻译系统通常依赖于“级联模型”—— 多个模块相互串联,依次处理语音识别、翻译、声音复刻和语音合成等任务,翻译结果不够连贯、处理速度慢。

此次全新发布的『豆包』・同声传译模型 Seed-LiveInterpret 2.0,支持全双工语音理解和生成框架,将传统机器同传的语音延迟从 8-10 秒降低到 2-3 秒,实现文本与语音的同步生成;无需提前录制,一边说话一边采样,实现 0 样本声音复刻,让同一个人同音色开口说外语,带来更沉浸的体验。

『豆包』大模型 1.6 系列再升级:极速版延迟低至 10ms

今年 6 月,『豆包』大模型 1.6 系列多个模型正式发布,为企业提供多样化选择。此次,极速版 Doubao-Seed-1.6-flash 模型在保持出色的视觉理解能力的同时,升级了代码、推理、数学等『大语言模型』能力。

Doubao-Seed-1.6-flash 模型,非常适合智能巡检、手机助手、智能硬件等对模型效果、速度和成本都有要求的大规模商业化场景。该模型具有业界领先的极低延迟,TPOT 仅 10ms,并依然具备强大的视觉理解能力。

价格上,Doubao-Seed-1.6-flash 在输入文本长度 0-32k 的区间中(企业使用量最大),每百万 tokens 输入仅需 0.15 元,输出仅 1.5 元。在真实的客户案例中,该模型帮助客户延迟下降 60%,成本降低 70%。

此外,火山引擎发布全模态向量化模型 Seed1.6-Embedding,首次实现了“文本 + 图像 + 视频”混合模态的融合检索,帮助企业构建更强大的多模态知识库。在权威测评榜单中,该模型包揽了多模态全面任务、中文文本的 SOTA 成绩。

特别声明:[字节跳动发布『豆包』大模型1.6、图像编辑模型3.0、同声传译模型2.0(字节跳动公司作品)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

监控器展会到底值不值得去?揭秘安防行业前沿科技!(监控市场)

你是否在纠结:参加监控器展会真的有用吗?本文带你全面解析监控器展会的真相——从参展企业、核心技术(如AI识别、4K超清、红外夜视)、应用场景到如何挑选适合自己的设备。不仅有权威行业动态,还有真实参展体验与选购建议,帮你避开“智商税”,用对预

监控器展会到底值不值得去?揭秘安防行业前沿科技!(监控市场)

『章子怡』又惹上麻烦!起因是一条悼文,怀念外国大师被定罪,太冤枉(『章子怡』现场演戏)

这位国际影星与意大利设计大师的跨界情谊,在『社交媒体』的放大镜下,演化成关于文化认同的全民辩论。如今同样的跨界合作,在悼念情境下却被部分舆论解构为"文化献媚"。这种双重标准揭示的,或许是『社交媒体』时代的情感通货

『章子怡』又惹上麻烦!起因是一条悼文,怀念外国大师被定罪,太冤枉(『章子怡』现场演戏)

微软宣布WMIC工具将在Win11 25H2 后被移除,建议改用 PowerShell(微软正式发布)

9 月 17 日消息,WMIC 是 『Windows』 此前长期内置的命令行工具,用户可通过文本命令与 『Windows』Management Instrumentation(WMI)系统交互,用于执行系…

微软宣布WMIC工具将在Win11 25H2 后被移除,建议改用 PowerShell(微软正式发布)

孩子骑电动车总摔?这款安全带才是真·防摔神器!(孩子骑电车碰到小车怎么处理)

孩子坐电动车爱乱动、容易摔下车?别再只靠“抱稳”了!儿童电动车安全带能有效固定宝宝,提升骑行安全性。本文详解安全带原理、选购要点、适用场景及使用技巧,帮你避开坑货,选对“娃神守护装备”。价格区间20-150元,适合3-8岁儿童,家长必看!

孩子骑电动车总摔?这款安全带才是真·防摔神器!(孩子骑电车碰到小车怎么处理)

美科技巨头扎堆投资英国 助力AI基建升级(美股大型科技股普跌,两日内六大巨头蒸发2700亿美元💵)

『美国总统特朗普』对英国进行第二次国事访问当天,多家美国科技公司宣布将在英国投资310亿英镑💷,用于提升英国的人工智能基础设施建设

美科技巨头扎堆投资英国 助力AI基建升级(美股大型科技股普跌,两日内六大巨头蒸发2700亿美元💵)