我们很高兴地宣布 OpenAI 首个开放权重模型 gpt-oss正式在 Azure AI Foundry(国际版)与 Windows AI Foundry(国际版)上线!
本次 gpt-oss 系列推出两款高性能模型:gpt-oss 120b 和 gpt-oss 20b。gpt-oss-120b 和 gpt-oss-20b 现已在 Azure AI Foundry(国际版)正式上线,gpt-oss-20b 也已支持在 Windows AI Foundry(国际版)本地运行,未来还将通过 Foundry Local(国际版)登陆 macOS 平台。
🔵 gpt-oss-120b 一个强大的推理引擎
拥有 1200 亿参数,采用稀疏架构优化,在数学计算、代码生成、专业问答等复杂任务上表现出色,可媲美 o4-mini,但模型体积更小、部署更灵活。即使是在单个数据中心级 GPU 上,也能高效运行,特别适合对性能和安全性要求极高的场景。
🔵 gpt-oss-20b 一款精通工具的轻量级产品
专为代码执行、工具调用等智能体任务优化,可在多种 Windows 硬件上流畅运行(支持 16GB + VRAM 的独立 GPU),未来还将支持更多设备。非常适合构建本地智能助手,或将 AI 技术能力嵌入到真实业务流程中,即使在网络受限的场景下也能稳定发挥。
两款模型将在不久与 Responses API兼容,这意味着您可以将它们无缝替换到现有系统,几乎无需修改代码,快速实现灵活部署。
依托微软全栈 AI 平台:
🔵 Azure AI Foundry(国际版)提供一站式模型构建与部署工具
🔵 Foundry Local(国际版)支持开源模型在本地设备高效运行
🔵 Windows AI Foundry(国际版)深度融合 Windows 生态,助力 AI 原生开发
不论您是企业用户还是 AI 技术开发者,现在都可以用自己擅长的方式、完全根据自身需求,自主运行、改造、部署 OpenAI 模型。
将 gpt-oss 引入云和边缘设备
Azure AI Foundry(国际版)不只是模型目录,更是为开发者量身打造的智能构建平台。目前平台已汇聚超过 11,000 个模型,并持续增长中,为开发者提供统一环境,进行模型评估、微调、部署,且具备企业级的安全性与可靠性。
现在,gpt-oss 正式加入 Foundry 模型家族,意味着您可以:
✅ 只需几行 CLI 命令,就能在云端部署 gpt-oss 推理服务,轻松启动测试与集成。
✅ 可使用您自己的数据对模型进行微调、蒸馏,并在平台上稳定部署,满足业务需求。
✅ 混合,将开源模型与自研或商业模型结合,灵活应对不同场景的任务需求。
对于必须在客户端运行的应用场景,Foundry Local(国际版)将主流开源模型带入本地设备。然后为 Windows AI Foundry(国际版)集成优化后的模型,支持在本地 CPU、GPU 和 NPU 上高效推理,并通过 CLI、API 和 SDK 提供一致的调用体验。
无论您是在离线环境中工作、在内部部署,还是在边缘设备运行,Foundry Local(国际版)和 Windows AI Foundry(国际版)都能让您实现“可选上云”。
这就是混合智能的真实用例:能够混合和匹配模型、优化性能和成本,并满足您的数据需求。
增强开发者和决策者的能力
gpt-oss 现已全面支持在 Azure 和 Windows 平台运行,这不仅为开发者带来了更大的自由度,也为企业决策者打开了新的可能性。
对于开发人员来说,开放权重意味着完全透明。您可以深入了解模型结构,按需定制、微调和部署。更重要的是,您将可以了解模型是如何工作的,以便让它能更适合您的业务场景。
对于决策者来说,将拥有更强的掌控力与灵活性。使用 gpt-oss,您可以获得极具竞争力的性能,它不再是“黑盒子”,让您在部署、合规性和成本方面有更多选择。
开源模型,真正走向主流
从智能体到垂直行业的专属智能副驾,越来越多的 AI 应用都在借助开源模型重新定义 AI 的开发与部署方式。借助 Azure AI Foundry(国际版),您可以顺势而上,快速落地您的创新想法:
🔵 通过开放权重,团队可以通过高效参数微调(如 LoRA、QLoRA、PEFT 等)快速迭代,用自有数据训练模型,仅需数小时(而非数周)就能生成新模型版本。
🔵 支持模型蒸馏、量化、剪裁上下文长度、结构化稀疏等优化方式,让 AI 模型适配边缘 GPU 甚至高性能笔电的内存和算力限制。
🔵 您可以为安全审计检查注意力模式,也可以插入行业适配模块、只训练特定模型层,甚至导出为 ONNX 或 Triton 格式,部署到 AKS或 Foundry Local(国际版)实现容器化推理。
简而言之,开放模型不仅仅是“替代品”,它们更像是可编程的智能基座,让您自由发挥、按需定制。Azure AI Foundry(国际版)提供完整的训练流程管理、权重管理、低延迟推理架构,让您能够充分利用每一个优化“杠杆”,推动人工智能定制的发展。
开放与负责任的 AI,携手共进
gpt-oss 的发布,以及它在 Azure 和 Windows 平台的全面集成,只是一个更大愿景的起点。展望未来,AI 技术将无处不在。为了让更多用户能够真正用好 AI 技术,微软致力于打造一个开放的平台——无论是云端还是终端设备,从数据中心到个人电脑,我们都希望将最新的 AI 技术带给每一位用户。
多入口、多选择,真正“让 AI 触手可及”
通过将 gpt-oss 以多种方式提供给开发者和企业客户,我们正在加倍兑现“实现 AI 技术大众化”的承诺。我们清楚地知道,客户需要的是多样化的模型组合——既包括闭源的商业模型,也包括开源模型。无论您选择哪一条路径,Azure AI Foundry(国际版)都能提供内置的安全与治理工具,帮助您在合规、信任与管理之间实现平衡,让创新变得更安心、更可控。
我们对开源工具的支持从未止步
今年 6 月,我们宣布 GitHub Copilot Chat 插件正式开源(MIT 协议),这是迈向“开源 AI 技术编程环境 VS Code”的第一步。