标签:"Qwen"相关文章

9小时前

一切为了Agent：千问、阶跃、Gemini打响「3.5模型大战」，春节将成关键节点？(一切为了人民健康)

『DeepSeek』 V4 虽然还没发布，但在 1 月刚刚发布了一篇关键论文，提出了全新的「Engram 条件记忆」机制，能在计算量较 MoE减少 18% 的情况下，在 32768 个 token 的长上下文…

2月前

张一鸣押宝成功，『抖音』『豆包』手机卖到断货(张一鸣3500亿)

这款与手机厂商在操作系统层面深度合作的AI助手，标志着『抖音』AI业务又上了一个台阶。李响了解到，这款合作手机由『抖音』集团主导AI助手的产品定义与体验，中兴通讯旗下努比亚负责硬件研发与生产。『豆包』选择与中兴合作，…

2月前

解放军总医院联合南大、吉大等机构，共同提出首个「脊柱诊疗大模型」SpineGPT(解放军总医院联勤论坛官网)

为填补现有数据与临床需求之间的认知鸿沟，研究团队与实践中的脊柱外科医生共同设计和构建了 SpineMed 生态系统。案例对比：在对「青少年特发性脊柱侧凸」病例的分析中，SpineGPT 提供了包含 72…

3月前

新书速览|AI Agent智能体与MCP开发实践：基于Qwen3大模型(新书速览|《ThinkPHP8高效构建Web应用》)

（6）系统整合大模型与智能体技术体系，从AI Agent技术体系，到AIAgent开发技术栈（微调、提示词、MCP、LangGraph、A2A、RAG、gradio），再到AI Agent开发工程案例，全…

新书速览|AI Agent智能体与MCP开发实践：基于Qwen3大模型(新书速览|《<strong>ThinkPHP8高效构建Web应用</strong>》)

3月前

阿里Qwen再发力！『通义千问』技术负责人林俊旸亲自带队组建具身智能小分队(阿里原文)

阿里巴巴旗下『通义千问』（Qwen）团队近日正式组建具身智能专项小组，标志着这家科技巨头在物理AI领域迈出关键一步。技术负责人林俊旸在公开声明中强调，多模态基础模型正从虚拟交互向实体操作演进，具备工具调用和长期记…

4月前

开源RL框架Verlog来了，专为LLM智能体打造，400回合不成问题(开源框架)

作者推测，模型性能下降的原因是 3B 模型在处理长上下文方面的能力有限，例如，当 n = 8 时，提示词长度约为 4600 个 token。三个实验环境表明，Verlog 展现出稳定的训练能力，不管是在长…

4月前

白山智算大模型平台如何成为开发者的提效引擎

它为开发者提供了一种“即插即用”的便捷方式，开发者无需深入钻研底层模型的训练细节，也无需为部署和优化而烦恼，只需通过简单的代码调用，就能轻松获得强大的AI推理能力，将更多精力投入到业务逻辑的创新中。这一功能对…

4月前

研究人员在离线学习加入多样性激励，减轻创意写作“AI味”(研究人员在离线工作)

基于此，上海交通大学本科校友、美国西北大学博士生郁家豪和所在团队研究了如何提高大模型在代码生成这项复杂任务上的性能。之所以开展这一方向是因为：通过评估其他使用闭源模型的研究团队在SWE-Bench 上的提…

4月前

干掉同声传译？阿里又推出一模型，精通18种语言，离线可用(同声传译最厉害的人叫什么)

Qwen3-LiveTranslate-Flash还支持多种语言或方言的不同音色，例如：『通义千问』团队称，今后还将持续提升语音翻译的准确性、自然度、情感一致性，拓展更多语种的覆盖范围，增强在各种复杂语音环境…

4月前

从文本到语音：阿里Qwen3-Omni重塑人机交互体验(将文本转换为语音输出所使用的技术)

4月前

基于昇腾打造自动适配工具，助力CANN打破生态壁垒(升腾概念龙头)

2025年9月20日，华为联合智子芯元(深圳)科技有限责任公司，在大湾区昇腾算力应用创新研究院的支持下，正式发布ModelBridge，一款面向昇腾CANN的生态适配工具，覆盖从算子到模型的一站式转化、适配…

4月前

七连发大模型、牵手『英伟达』、基础设施扩建……阿里这场会信息量很大(七连发图片)

在与阿里云的合作方面，联想百应智能体已接入通义Qwen3大模型，依托Qwen3在混合推理模式、支持MCP、多语言等能力上的突破，百应智能体进一步丰富了模型库，并在语言理解、多轮推理、指令跟随等关键能力上实现…

4月前

亚马逊云科技宣布推出Qwen3与『DeepSeek』-V3.1模型的完全托管服务(亚马逊云科技公司)

· 这个高度复杂的模型可与当今最先进的AI系统相媲美，而其MoE（混合专家）架构意味着客户在享受卓越性能的同时还能优化计算成本。随着我们通过Amazon Bedrock等服务让更多强大的开放权重模型变得触…

4月前

亚马逊云科技推出Qwen3与『DeepSeek』-V3.1模型的完全托管服务(亚马逊云科技推出bedrock agent)

9月19日，亚马逊云科技宣布，在Amazon Bedrock上新增Qwen3和『DeepSeek』-V3.1开放权重模型，这些模型现已在全球范围内正式可用。…

5月前

DFRobot 亮相贸泽电子 elexcon 2025 展台，展示与Qwen3 大模型融合的AI 应用(dfrobot官网商城)

展会现场，DFRobot的技术人员向来访观众演示了 LattePanda Sigma 驱动的实时 AI场景解说系统是如何通过语音和文本指令与设备进行交互。贸泽电子亚太区市场及商务拓展副总裁田吉平…

6月前

IPhone 18 Pro 爆料汇总(苹果2018pro是什么处理器)

目前，iOS 18、iPadOS 18、macOS Sequoia 和 visionOS 2 中的 Apple Intelligence所集成的 ChatGPT 仍基于 GPT-4o，但苹果已确认将于下月…

6月前

阿里云『通义千问』Qwen Code宣布每日可免费运行2000次(阿里云『通义千问』开源Qwen2.5-1M模型)

8 月 9 日消息，阿里云『通义千问』官方宣布，AI 编程智能体 Qwen Code 用户每天可免费获得 2000次（请求）运行权限，且没有 Token 限制。作为对比，其竞品 Google Gem…

6月前

三倍性能！继华为之后AMD也向『英伟达』AI『芯片』发起挑战

但有趣的是，继华为之后，AMD这位"红色巨人"正在悄然布局一场漂亮的突围战——不仅要在硬件性能上硬碰硬，更要在软件生态这片"无人区"开辟新战线。 AMD的聪明之处在于，

6月前

科创人工智能ETF(588730)上涨1.11%，冲击3连涨，AI在多个场景创新应用有望加速落地(易方达科创人工智能etf)

截至2025年8月6日13:26，上证科创板人工智能指数(950180)强势上涨1.31%，科创人工智能ETF(588730)上涨1.11%，冲击3连涨，盘中换手8.62%，成交8217.70万元。广发证…

6月前

阿里中标工商银行AI编程项目(工行和阿里巴巴签署战略合作协议)

钛媒体App 8月5日消息，中国工商银行日前发布《软件开发中心智能研发平台》中标结果。阿里云凭借通义灵码独家中标，根据中标公告，通义灵码将为工商银行智能研发平台提供代码补全、代码问答及单测智能体等服务。此前，…

6月前

Qwen新开源，把AI生图里的文字SOTA拉爆了(开源软件文集)

官方Demo中有直接生成PPT的示例，我们也来测试一下，提示词是：有点惊喜的是，Qwen-Image把“动物奶油”这几个字准确对应到了奶油蛋糕上。可以看到，Qwen-Image对提示词的理解都很到位，提…

6月前

阿里『通义千问』开源全新文生图模型Qwen-Image(阿里通网络电话官方网站)

这一创新成果不仅在复杂文本渲染和精确图像编辑方面取得了突破性进展，更是在多个公开基准测试中展现了卓越性能，成为图像生成与编辑领域的新星。 Qwen-Image以其强大的文本渲染能力脱颖而出，支持多行布局、段落…

6月前

『通义千问』开源全新文生图模型Qwen-Image

新榜讯 8月5日消息，阿里旗下『通义千问』Qwen正式开源20B的MMDiT模型Qwen - Image。该模型为『通义千问』系列首个图像生成基础模型，于复杂文本渲染和精确图像编辑领域取得显著进展。借助增强的多任务训…

6月前

阿里『通义千问』首个图像生成基础模型 Qwen-Image 开源(阿里通平台正规吗)

IT 之家 8 月 5 日消息，阿里『通义千问』团队今日宣布开源 Qwen-Image，这是一个 20B 的 MMDiT 模型，也是『通义千问』系列中首个图像生成基础模型，其在复杂文本渲染和精确图像编辑方面取得了显著…

6月前

『斯坦福大学』发现：为什么有些AI能越来越聪明，有些却停滞不前？(斯坦福dad)

虽然行为植入实验取得了显著成功，但研究团队意识到这种方法有一个局限性：它使用的是专门针对倒计时游戏的训练数据，可能无法很好地推广到其他类型的问题上。 A：认知行为是AI模型在解决问题时表现出的思维模式，包括…

6月前

AI日报：火山引擎发布『豆包』3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4(火山at)

Qwen3-30B-A3B-Instruct-2507新版本在非思考模式下表现出色，性能媲美顶级闭源模型，并在多个领域实现了显著提升，同时支持多语言和长文本处理，为开发者和研究人员提供了便利的开源平台。昆…

6月前

科技昨夜今晨0731：华为鸿蒙 5 终端数量破 1000 万(科技昨夜今晨)

余承东 7 月 30 日发文称：今天，鸿蒙 5 终端数量突破了 1000 万，非常感谢每一位伙伴、开发者和用户的支持和反馈！华为终端官方 7月 29 日宣布，腾讯系应用近期集体为鸿蒙用户送上“大礼包”，…

6月前

凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o(凌晨作者)

它的亮点在于，仅激活 30 亿（3B）参数，就能展现出与业界顶尖闭源模型，如谷歌的 Gemini 2.5-Flash（非思考模式）和OpenAI 的 GPT-4o 相媲美的超强实力，这标志着在模型效率和性能…

6月前

阿里巴巴Qwen3-Coder可与Claude Sonnet 4媲美(阿里巴巴1688采购网)

阿里巴巴已推出Qwen3-Coder，这是其迄今最先进的AI编码模型，旨在与西方领先的模型在编程任务上直接竞争。根据阿里巴巴的说法，该模型在基于代理的编码、浏览器自动化和工具使用方面，其成绩可与Claude…

6月前

阿里，一张王炸！(放一个阿里阿里)

尤为值得一提的是，就在昨天清晨，阿里云又一“王炸”级开源模型问世——『通义千问』AI编程大模型Qwen3-Coder。此外，为方便开发者更好地使用Qwen3-Coder，通义团队还同步开源了一款命令行工具Qw…