TD3算法详解

Twin Delayed Deep Deterministic | 双子延迟算法

算法概述

TD3（Twin Delayed Deep Deterministic）是DDPG的改进版本，解决了DDPG中的过估计问题。TD3使用两个独立的评论网络来减少偏差，一个用于当前策略，一个用于目标策略，使算法更加稳定和高效。

← 返回列表