2h ago

AXPO Method Improves Multimodal Agent Reasoning in Vision-Language Models

2105136.7K

——0——

Original post

Agent Explorative Policy Optimization for Multimodal Agentic Reasoning

paper: https://huggingface.co/papers/2605.28774

AK@_akhaliq

Agent Explorative Policy Optimization for Multimodal Agentic Reasoning

3:29 PM · May 28, 2026 · 3.6K Views

3:29 PM · May 28, 2026 · 2.9K Views