Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: actor-critic
此标签下有6条笔记。
2026年5月17日
连续动作空间的Actor-Critic方法
reinforcement-learning
actor-critic
continuous-control
ddpg
sac
td3
2026年5月16日
TAAC - Team Attention Actor-Critic
multi-agent-rl
actor-critic
attention
centralized-training
decentralized-execution
2026年5月05日
Soft Actor-Critic (SAC)
reinforcement-learning
actor-critic
maximum-entropy
sac
2026年5月05日
TD3 (Twin Delayed Deep Deterministic Policy Gradient)
reinforcement-learning
actor-critic
td3
ddpg
2026年4月30日
Actor-Critic方法
reinforcement-learning
actor-critic
policy-gradient
value-function
2026年4月30日
策略梯度方法
reinforcement-learning
policy-gradient
reinforce
actor-critic