CODEBASE
← 返回列表

TD3算法详解

Twin Delayed Deep Deterministic | 双子延迟算法

算法概述

TD3(Twin Delayed Deep Deterministic)是DDPG的改进版本,解决了DDPG中的过估计问题。TD3使用两个独立的评论网络来减少偏差,一个用于当前策略,一个用于目标策略,使算法更加稳定和高效。

核心组件

← 返回列表