『英伟达』发布 Llama Nemotron Nano VL

6 月 5 日消息,科技媒体 marktechpost 昨日(6 月 4 日)发布博文,报道称『英伟达』(Nvidia)针对高效、精准地处理文档级理解任务,推出 Llama Nemotron Nano VL 视觉-语言模型(VLM)。

Llama Nemotron Nano VL 基于 Llama 3.1 架构,融合了 CRadioV2-H 视觉编码器和 Llama 3.1 8B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支持最长 16K 的上下文长度,覆盖图像和文本序列。

模型通过投影层和旋转位置编码实现视觉-文本对齐,优化了 token 效率,特别适合长篇多模态任务,无论是多图像输入还是复杂文本解析,它都能游刃有余。

今日霍州(www.jrhz.info)©️

该模型的训练分为三个阶段:首先,利用商业图像和视频数据集进行交错式图文预训练;其次,通过多模态指令微调提升交互式提示能力;最后,重新混合纯文本指令数据以优化在标准语言模型基准上的表现。

今日霍州(www.jrhz.info)©️

训练采用『英伟达』的 Megatron-LLM 框架和 Energon 数据加载器,依托 A100 和 H100 GPU 集群完成。在 OCRBench v2 基准测试中,该模型在 OCR、表格解析和图表推理等任务上取得领先精度,尤其在结构化数据提取(如表格和键值对)及布局相关问题解答中表现突出,媲美更大规模模型。

今日霍州(www.jrhz.info)©️

部署方面,Llama Nemotron Nano VL 设计灵活,支持『服务器』和边缘推理场景。『英伟达』提供了 4-bit 量化版本(AWQ),结合 TinyChat 和 TensorRT-LLM 实现高效推理,兼容 Jetson Orin 等受限环境。

模型还支持 Modular NIM(NVIDIA 推理微服务)、onNX 和 TensorRT 导出,此外『英伟达』通过预计算视觉嵌入选项,进一步降低静态图像文档处理的延迟,为企业应用提供了实用解决方案。

附上参考地址

特别声明:[『英伟达』发布 Llama Nemotron Nano VL] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

老虎滩104舰启动拆解 市民不舍告别(老虎滩战舰)

“104舰,再见啦!你承载了太多美好的回忆!”今年2月24日,因海水侵蚀、自然老化等原因导致舰体结构失稳,停泊在大连老虎滩畔三十余年的104舰正式启动拆解。不少市民得知消息后,赶来与104舰做最后告别

老虎滩104舰启动拆解 市民不舍告别(老虎滩战舰)

湃腾包装取得吸塑泡壳加工夹持限位装置专利,避免了破裂和变形的风险(上海湃腾文化传播有限公司)

国家知识产权局信息显示,昆山湃腾包装制品有限公司取得一项名为“一种吸塑泡壳加工夹持限位装置”的专利,授权公告号CN223948495U,申请日期为2025年2月。企业注册资本3000万人民币。 声明:市场有风…

湃腾包装取得吸塑泡壳加工夹持限位装置专利,避免了破裂和变形的风险(上海湃腾文化传播有限公司)

厚衣服先别收!北京下周冷空气频繁 气温偏低注意保暖(厚衣服如何收纳)

根据预报,今明两天北京天空云量较多,周六西部北部地区将有雨夹雪。由于阴云笼罩,气温逐渐下降,白天最高气温在4℃到7℃之间,外出时需注意防范。市气象台预报显示,3月1日至5日冷空气活动频繁,大部分时间天空云量较多,气温有所波动,整体偏低

厚衣服先别收!北京下周冷空气频繁 气温偏低注意保暖(厚衣服如何收纳)

漫谈HeroDashAI助手功能,解惑知识量多不多及购买费用(herodam)

该系统已获得多项软件著作权与系统资质认证,并与多家国际云通信厂商深度合作,确保全球通信合规与稳定性,其合作客户更是涵盖了世界 500强、行业头部品牌以及快速成长的跨境企业,这些都为 HeroDash AI …

漫谈HeroDashAI助手功能,解惑知识量多不多及购买费用(herodam)

妙洁竹纤维百洁布真的不沾油吗?厨房清洁神器选它准没错!(妙洁竹纤维抹布怎么样)

在厨房清洁领域,妙洁竹纤维百洁布以其不沾油的独特特性备受关注。这款加厚设计不仅有效去除污渍,还能让清洁工作更加轻松高效。本文深入解析其工作原理、适用场景以及选购要点,帮你挑选最适合自己的厨房清洁好物。

妙洁竹纤维百洁布真的不沾油吗?厨房清洁神器选它准没错!(妙洁竹纤维抹布怎么样)