高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行(高通 npu)

高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行(高通 npu)

8 月 11 日消息,OpenAI 于 8 月 6 日推出了其最小开源模型 gpt-oss-20b,在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果。高通今日宣布,这是其首个可在搭载骁龙平台的终端侧运行的开源推理模型。

从官方新闻稿获悉,高通称 gpt-oss-20b 思维链推理模型可直接在搭载骁龙旗舰处理器的终端上运行。此前 OpenAI 的复杂模型仅限云端部署,这是 OpenAI 首次实现模型支持终端侧推理。通过提前获取模型,并结合高通 ® AI 引擎和 Qualcomm® AI Stack 进行集成测试,我们发现这款 200 亿参数的模型表现极为出色,能够完全在终端侧进行思维链推理。

高通认为这是一个关键转折点:预示着 AI 的未来方向,即丰富复杂的助手式推理也将在本地实现。这也展现了 AI 生态系统的成熟性,合作伙伴和开发者可以利用骁龙处理器,实时采用 OpenAI 等领军企业的开源创新成果。OpenAI 的 gpt-oss-20b 将助力终端设备利用终端侧推理,带来隐私保护和时延方面的优势,同时通过 AI 智能体为云端解决方案提供支持。

高通称,通过提前获取 gpt-oss-20b 模型,并结合 Qualcomm AI Stack 进行集成测试,见证了该模型的卓越能力,它能完全在终端侧进行复杂推理。开发者将可通过 Hugging Face 和 Ollama 等主流平台获取该模型,并在搭载骁龙平台的终端上发挥其性能。更多部署详情即将在 Qualcomm AI Hub 上公布。

将 Ollama 的轻量级的开源 LLM 服务框架和强大的骁龙平台集成,开发者和企业不仅可以直接在搭载骁龙计算平台的终端上运行 gpt-oss-20b 模型,还能够进行网页搜索等多个默认特性,无需额外配置。用户也可以在 Ollama 上尝试 Turbo 模式,以探索该模型的更多功能。

特别声明:[高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行(高通 npu)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

布局到审查:基于DeepSeek建筑规划方案双重保障(布局初步)

该文档围绕基于DeepSeek的建筑规划方案双重保障展开,核心探讨了大模型在建筑规划从布局到审查环节的创新应用。设计成果标准化要对建筑轮廓等内容进行规整和检测;二三维成果转换支持多种软件格式;微观和宏观智能…

布局到审查:基于DeepSeek建筑规划方案双重保障(布局初步)

益气聪明丸主治哪些疾病及包含哪些成分(益气聪明丸主治功能)

益气聪明丸主要用于治疗因气血不足引起的症状,如耳聋耳鸣以及视力模糊等。其主要成分为黄芪、党参、葛根、升麻、蔓荆子、白芍、黄柏(炒)、甘草(炙),并添加了蜂蜜作为辅料。该药具有益气升阳的作用,并能改善听力障碍和视觉模糊的症状。

益气聪明丸主治哪些疾病及包含哪些成分(益气聪明丸主治功能)

财务人员提升工作能力的实用方法? 【能力跃迁实战指南】(财务人员提升工作谈话记录)

2025年的财务从业者,必须跳出账本思维,转型为“业务伙伴”和“数据决策者”。 真实价值:持CDA Level I的财务新人起薪高出同行18-25%,简历通过率提升2倍CDA数据分析师是数据领域认可度最高的…

财务人员提升工作能力的实用方法? 【能力跃迁实战指南】(财务人员提升工作谈话记录)

“谢大脚”于月仙,一辈子没生育,去世4年后,丈夫的选择让人动容

这部剧陪我们走过20年,从刘能的抠门到赵老四的正经,再到谢大脚的热心,每个人都是我们生活里的某种缩影。有些人走了,你才发现——她不只是剧里的人,她是你青春的一个证人。 他没解释,因为解释在某些人眼里,是认…

“谢大脚”于月仙,一辈子没生育,去世4年后,丈夫的选择让人动容

睿海公司400G光模块智能光互联解决方案(睿海集团董事长)

睿海光电400G光模块采用业界领先的PAM4调制技术,单通道速率高达100Gbps,相比传统方案提升200%频谱效率。 睿海光电采用PAM4方案具有:支持更长的传输距离,更优的抗噪声性能,完整的信号完整性解…

睿海公司400G光模块智能光互联解决方案(睿海集团董事长)