标签:"训练方法"相关文章

2月前

阿里巴巴DAMO院揭秘：为什么AI模型会说话就能做好图片搜索？(阿里巴巴达摩院一般年薪多少)

研究团队通过分析模型内部表示的"各向异性程度"和"核相似性结构"，发现了一个关键现象：当模型在文本理解能力上得到提升后，它对图像、音频、视频等其他模态信息的处理能力也随

3月前

阿里巴巴发布Qwen-Image：让AI画出完美中文字的图像生成新时代(阿里巴巴发布qwen2.5 omni)

选择Qwen2.5-VL而不是纯语言模型有三个重要原因：它的语言和视觉空间已经预先对齐，使其更适合文字到图像的转换任务；它保持了强大的语言建模能力，没有因为多模态训练而削弱文字理解能力；它支持多模态输入，这意…

4月前

多通道大小鼠转轮节律监测系统的原理与训练方法

多通道大小鼠转轮节律监测系统是由动物自发运动来推动跑轮，笼内动物长期活动的信息，如跑轮转动方向、转数、累计总行程等。动物通过自主跑动推动转轮，系统通过高精度磁感应传感器或编码器（分辨率360PR）实时记录…

5月前

腾讯科技取得联邦神经网络的训练方法、装置及电子设备专利(腾讯科技取得联合会员)

金融界2025年8月19日消息，国家知识产权局信息显示，腾讯科技（深圳）有限公司;北京大学取得一项名为“联邦神经网络的训练方法、装置及电子设备”的专利，授权公告号CN114418095B，申请日期为2022年…

5月前

从理论到临床：康复运动实训室的育人使命(理论与临床的关系)

建设一个能够模拟真实临床环境、提供多样化实践场景的康复运动实训室，对于提升学生的实践操作能力、培养其临床思维具有重要意义。高校康复运动实训室的建设目标，是为学生提供一个与临床实践紧密结合的教学环境。通过科学…

5月前

清华与智谱AI：GLM-4.5称霸三大AI领域(清华智班是什么意思)

GLM-4.5系列模型已经完全开源，研究团队将代码、模型权重和相关工具都发布在了GitHub平台上(https:github.comzai-orgGLM-4.5)，希望能推动推理和智能代理AI系统的…

5月前

浙大团队：AI实现GUI元素精准识别如侦探(浙江大学人工智能实验室)

通过巧妙的探索策略设计，AI系统能够在复杂的状态空间中找到最优解，这为其他需要精确定位和语义理解的任务提供了宝贵经验。 A：InfiGUI-G1有三个主要优势：一是自适应探索，能根据任务难度调整候选答案数量；…

6月前

卡内基梅隆大学团队的突破性训练方法让『机器人』️学会察言观色(卡内基梅隆大学研究生申请条件)

在一个朋友间分享毯子的场景中，传统方法可能只会告诉AI"对话失败了"，而新方法能具体指出："你在第三句话中直接拒绝分享是关键失误，但第一句话表达理解对方感受是加分项。它通过两个关键创新来

6月前

独家丨星海图将发布首个开放世界真机数据集及VLA开源模型(星海图片唯美二次元)

据硅星人了解，星海图即将发布的全球首个开放场景高质量真机数据集Galaxea Open-World Dataset包含500小时真实世界移动操作数据，覆盖家庭、厨房、零售、办公等50个场景、150类任务、1…

6月前

腾讯AI梦：克制的雄心

与美国用户分散于Facebook、WhatsApp、LinkedIn等多平台不同，中国用户在微信即可一站式完成社交、工作、商务、购物等多元行为——这种场景集中与数据闭环，让腾讯有了另一个在当下AI时代的先天…

6月前

从恐惧到自信：雅思口语考前急救的完整路径图(从恐惧到自信的成语)

在多年的英语学习和教学实践中，我积累了不少关于雅思口语考前急救的经验，接下来就和大家分享一些实用的学习方法和经验。在学习阶段的规划上，考前一周可以进行集中的语料积累和话题练习；考前三天重点进行模拟考试训练，…

6月前

教AI学会犯错——加州大学伯克利分校团队揭示编程教育新思路(犯错教会我____)

训练数据来自真实学生的编程作业，虽然研究团队做了匿名化处理并获得了相关许可，但在更大规模应用这种方法时，如何保护学生隐私、防止模型输出被滥用（比如用于学术作弊），都是需要认真考虑的问题。ParaStudent…

6月前

NVIDIA发布Eagle 2.5：小模型看懂电影级长视频

NVIDIA的研究团队刚刚打造了一副"超级眼镜👓"，让AI模型能够清晰地"观看"并理解长达数小时的视频内容，这就是Eagle2.5技术的魅力所在。Eagle 2.5团队通

7月前

HuggingFace发布超大规模数学推理数据集，助力AI学习

问题随之而来：传统的数据集大多侧重于图像和语言理解，很少涉及到数学推理这一复杂领域。 HuggingFace发布的超大规模数学推理数据集，不仅为AI的数学推理能力提供了突破性的提升，也为未来更多的AI应用打…

9月前

万字长文带你读懂强化学习，去中心化强化学习又能否实现？

现在，我们已经了解了监督微调（SFT）以及 PPO 和 GRPO 之间的区别，可以更清晰地看到『DeepSeek』的 R1-Zero训练过程实际上是多么简单。我们已经强调『DeepSeek』展示了模型可以…

9月前

2025『大语言模型』（LLM）上手指南-Microsoft

LLM的“大”体现在参数数量多、需大量训练数据和计算资源，其发展经历多个阶段，基于Transformer架构的预训练语言模型推动了技术进步。微软通过Azure AI平台支持AI创新，Copilot系列产品提升…

9月前

贵州工匠行申请轻量化自然语言处理大模型训练方法专利，降低计算的复杂程度

金融界2025年4月26日消息，国家知识产权局信息显示，贵州师范大学;贵州工匠行科技有限公司申请一项名为“轻量化自然语言处理大模型训练方法”的专利，公开号CN119862925A，申请日期为2025年3月。 …

10月前

《『DeepSeek』实战指南：从数据到财富》出版发行

《『DeepSeek』实战指南：从数据到财富》通过三个战略维度构建认知坐标：其一，以全球技术演进为经线，回顾从GPT技术革命到中国大模型“自主可控”攻坚的产业脉络；其二，以『DeepSeek』技术体系为纬线，深入解…

《<strong>『DeepSeek』实战指南：从数据到财富</strong>》出版发行

11月前

水滴智店：团队运动数据云端集成,智能手环手表检测高精度

随着大数据、云计算、物联网等技术的不断发展，团队运动数据云端集成和智能手环手表检测高精度成为了现实。在团队运动数据云端集成和智能手环手表检测高精度的道路上，我们也面临着诸多挑战。展望未来，随着我国…

12月前

4500美元💵验证强化学习「魔力」，1.5B模型也能超越o1预览版，模型、数据、代码全开源

但研究团队并未退缩，他们提出了一种巧妙的策略，让 RL 的训练成本降低至常规方法的 5%，最终只用了 3800 A100 GPU 小时和4500 美元💵，就在 1.5B 的模型上训练出了一个超越 OpenAI…

2025-1-26

TeleAI复杂推理大模型达竞赛级数学表现，评分超o1-preview

TeleAI-t1-preview使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。针对TeleAI-t1-preview训练的不同阶段，TeleAI…