量子位智库:2025上半年AI核心成果及趋势报告(量子位智库官网)
模型层面,推理能力持续提升,尤其在数理和代码类问题上;大模型走向Agentic,工具使用能力增强;多模态推理融合视觉与文本,图像和视频生成能力全面提升;小模型加速普及,智能密度提高;模型评估向动态、实用任务…
模型层面,推理能力持续提升,尤其在数理和代码类问题上;大模型走向Agentic,工具使用能力增强;多模态推理融合视觉与文本,图像和视频生成能力全面提升;小模型加速普及,智能密度提高;模型评估向动态、实用任务…
报告指出,目前“大语言模型仍是AI Agent最为核心的‘工具’”,但“如何提升记忆力、以及工具的使用,是扩展AI能力边界的关键”。当前行业“仍缺乏真正专业级的通用型智能体”,但“部分产品如Manus、Kim…
好在官方写了很详细的 Quickstart,不过更好的是,发现火山引擎 ECS 提供了一键部署的方案,很方便。 根据上一 Part的介绍添加好新模型之后,就能在开源版扣子里面看到新模型了。 加上火山引擎诸…
上半年,谷歌发布的Gemini 2.5Pro和xAI发布的Grok 4在多个领域达到了SOTA水平,部分能力甚至超过了OpenAI。DeepSeek开源了多个模型,包括推理模型、代码模型和Agent模型;智谱…
他打开AI辅助系统输入症状描述,短短数秒内,系统便自动检索了全球最新发表的27篇相关论文,整合出包括药物剂量、禁忌症和临床实验数据的治疗方案建议——这背后,正是检索增强生成(RAG)技术在悄然改变人机协作的边…
在制造车间,智能体可能实时优化生产排程;在校园,它能为学生定制学习方案;在家庭,它或许能兼顾老人陪护与儿童教育……随着技术与产业的深度融合,AICloud Agent正从抽象概念变为触手可及的生产力,推动…
黄宁毕业于北京大学数学科学学院,曾主导数据驱动编程语言拜语言的编译器开发,此后一直投身于「AI+软件开发」领域,带领团队先后实现编程智能、测试智能等多种通用软件工程智能体,致力于探索编程语言、程序设计和软件工…
IDC数据显示,中国人工智能算力市场将在2026年达到337亿美元,而云平台的价值不仅是提供算力,更重构了开发范式——算家云等平台提供从模型训练到解决方案的全栈服务,让企业从“重工程”转向“重业务”。 安全牛…
报告指出,目前“大语言模型仍是AI Agent最为核心的‘工具’”,但“如何提升记忆力、以及工具的使用,是扩展AI能力边界的关键”。当前行业“仍缺乏真正专业级的通用型智能体”,但“部分产品如Manus、Kim…
凤凰网科技讯 8月1日,扣子开发平台与小米应用商店正式打通,新增发布渠道——能够实现将智能体一键发布至小米应用商店,加速智能创意的落地与传播。 通过小米应用商店审核后,智能体将在小米应用商店上架。可通过小米应…
在这一演进过程中,MCP(Model-Compute-Platform)作为一种新兴的开发范式正在崭露头角,它通过整合大模型能力、分布式计算资源和统一开发平台,为AIAgent的开发带来了革命性的变化。 一…
每经AI快讯,8月1日,小米应用商店宣布与字节跳动旗下一站式AI Agent开发平台扣子达成合作,打通智能体一键发布能力。开发者在扣子开发平台完成智能体的创建与调试后,可一键发布至小米应用商店,用户则可在应用…
南都记者从佛山市工业和信息化局获悉,目前,市工信局、市人工智能与智能机器人产业发展工作专班,梳理《人工智能与智能机器人赋能重点行业优秀产品(第一批)》,并正式发布(后附案例介绍)。目前,“factory …
界面映射:将视觉检测结果与 DOM(网页)或组件树(桌面应用)相结合,为每个可交互元素生成唯一标识;布局自适应:在不同分辨率、主题模式下,仍能精准执行点击与输入,无需硬编码坐标;动态监测:在任务执行过程中持…
8 月 1 日消息,月之暗面今日发布 Kimi K2 高速版 ——Kimi-K2-turbo-preview,模型参数与Kimi-K2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40…
升级到鸿蒙5后,小艺作为系统级智能体,也变得无处不在:除了传统的语音和长按电源键唤醒外,鸿蒙5的小艺导航条常驻桌面底部,可以把文件、图片等拖给小艺导航条高效处理,也可以随时通过指关节圈选屏幕内容问问小艺,除此…
据悉,Marco在跨境电商对话场景的翻译幻觉率仅为0.02%,比业内翻译大模型第一梯队的平均幻觉率还要低75%。其中,智能退款agent通过多模态的理解和推理能力,智能退款服务为商家和消费者提供了最佳的退款…
于是,我在小艺智能体市场找到“爆款文案生成器”Agent,直接告诉它,“帮我写一段小红书风格的探店文案,照片是洒满阳光的咖啡馆角落,感觉很治愈。” 它很快给了几个版本,不仅有吸睛的标题,还搭配了适合的emoj…
Wide Research是Manus首次开放的并行智能体系统,支持一次性调用上百个子智能体同步处理任务。用户在X平台评论称:“这看起来很棒,但运行100个Manus智能体也意味着消耗100倍的积分?Man…
Google Vertex AI Agent Builder:依托 Gemini 大模型的多模态能力,支持从视频内容直接生成 Web应用,在电商场景中实现商品 3D 展示与交互优化。 亚马逊 Alexa …
开源编程模型的天花板,要被Qwen3-Coder掀翻了。 有人实测,在苹果M4Max上通过mlx-lm运行Qwen3-Coder-Flash,每秒可生成4467个token,相当快。 但u1s1,最近Qw…
通过Agent工具收拢所有安全设备的告警信息,依据预设工作流自动完成初步事件分析、人员沟通调度,并实现工单的自动分类、优先级排序与智能分配,解决传统运营中“告警分散、响应无序”的痛点。钓鱼邮件处置与AI …
人民财讯8月1日电,中信证券研报认为,下一代大模型(如GPT-5),有望成为决定本轮AI产业前景的关键变量。下一代大模型在逻辑推理、原生多模态、记忆系统等关键能力突破,将加速高价值复杂行业场景应用落地。产业端…
此外,致远互联凭借其在企业级AI Agent创新成果和落地实践,CoMi同时入选智库机构甲子光年《企业级AIAgent(智能体)价值及应用报告》,入选其“中国企业级AI Agent生态图谱”企业级平台层+…
该模型的发布,旨在为开发者社区提供一个在性能与效率之间取得更佳平衡的AI编程解决方案。对于开发者长期关注的代码上下文理解能力,Qwen3-Coder-Flash也给出了强有力的回应。 【免责声明】本文仅代表…
别担心,今天我就来分享一个超级棒的解决方案——无需编程的AI部署! 3️⃣ AI Agent本地部署大师:这是最适合小白的方式,一键部署,傻瓜式操作,完全不需要编程基础!无需编程的AI部署,让你轻松拥有自己的…
2025上半年AI核心成果及趋势报告显示,AI领域在应用、模型、技术和行业层面均有显著进展。行业趋势上,头部玩家模型差距缩小,xAI、谷歌迎头赶上,中美大模型差距缩小,中国在多模态领域表现优异,AI编程成必…
直接说结果:GLM-4.5根据我们的需求生成了一个静态网页,自动生成了网页主题、生成了3张小狗照片,并详细介绍了它们的名字、品种、年龄、性格和简介;页面使用了渐变背景、毛玻璃效果和悬停动画效果,而且是完全响…
结果出乎意料,短短几秒钟内,文档搭子Agent就列出了会议核心结论、各方观点等信息,比我自己花半小时通读、划重点高效多了。升级鸿蒙5后,系统级智能体小艺也进化成了能思考的真人感小艺,支持语音、长按导航条、识屏…
当用户修改参数与能力包默认设置冲突时,Agent 应主动提示并更新槽位;短期记忆在任务完成或超时后立即清除,长期记忆则按需归档或版本冻结。通过短期记忆维护会话状态、长期记忆管理流程资产,并结合自愈与反馈,b…