复旦联合南洋理工提出基于视觉Grounding的多轮强化学习框架MGPO(南洋理工大学和复旦大学哪个好)
MGPO 的核心创新点包括: 1)自上而下的可解释视觉推理:赋予了 LMMs 针对高分辨率场景的 「自上而下、问题驱动」视觉搜索机制,提供可解释的视觉 Grounding 输出; 2)突破最大像素限制:即…
MGPO 的核心创新点包括: 1)自上而下的可解释视觉推理:赋予了 LMMs 针对高分辨率场景的 「自上而下、问题驱动」视觉搜索机制,提供可解释的视觉 Grounding 输出; 2)突破最大像素限制:即…