Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: multi-agent-rl
此标签下有15条笔记。
2026年5月17日
多智能体强化学习索引
multi-agent-rl
reinforcement-learning
index
cooperative
competitive
game-theory
2026年5月17日
Convex Markov Games:凸偏好下的统一多智能体决策框架
multi-agent-rl
convex-optimization
markov-games
nash-equilibrium
game-theory
2026年5月17日
涌现通信协议:从信号到语言
multi-agent-rl
emergent-communication
language-evolution
llm-coordination
trust-based-learning
2026年5月17日
K-Level Policy Gradients:递归对手建模框架
multi-agent-rl
policy-gradient
k-level-reasoning
opponent-modeling
game-theory
2026年5月17日
可扩展多智能体RL:序列模型与新基准
multi-agent-rl
transformer
sequence-modeling
benchmark
scalable
offline-rl
2026年5月17日
Fictitious Cross-Play:团队竞争博弈中的全局Nash均衡学习
multi-agent-rl
game-theory
fictitious-play
nash-equilibrium
team-competition
2026年5月16日
Deep Meta Coordination Graphs (DMCG)
multi-agent-rl
coordination-graphs
meta-learning
deep-learning
graph-neural-networks
2026年5月16日
涌现协调与相位结构
multi-agent-rl
emergent-behavior
coordination
phase-transition
cooperation
2026年5月16日
Language-Driven Multi-Agent Coordination
multi-agent-rl
llm
language-communication
coordination
agentic-ai
2026年5月16日
Oryx - 可扩展多智能体序列模型
multi-agent-rl
sequence-modeling
scalable
offline-rl
coordination
2026年5月16日
TAAC - Team Attention Actor-Critic
multi-agent-rl
actor-critic
attention
centralized-training
decentralized-execution
2026年5月02日
MARL通信与协调机制
multi-agent-rl
communication
coordination
graph-network
2026年5月02日
MARL策略梯度方法
multi-agent-rl
policy-gradient
coma
maddpg
maven
2026年5月02日
MARL值函数分解方法
multi-agent-rl
value-factorization
qmix
vdn
qtran
2026年5月02日
多智能体强化学习简介
multi-agent-rl
reinforcement-learning
cooperative
competitive