Update README.md
This commit is contained in:
12
README.md
12
README.md
@@ -205,4 +205,14 @@ TensorBoard 通常会记录和可视化多种训练指标。你提到的这些
|
||||
- **`train/entropy_loss`**:熵损失,反映策略的探索程度。
|
||||
- **`train/clip_range`**:剪裁范围,反映策略更新的限制。
|
||||
- **`train/clip_fraction`**:被剪裁的比例,反映策略更新的稳定性。
|
||||
- **`train/approx_kl`**:近似 KL 散度,反映策略更新的幅度和稳定性。
|
||||
- **`train/approx_kl`**:近似 KL 散度,反映策略更新的幅度和稳定性。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
## 参考
|
||||
|
||||
https://github.com/mangenotwork/CLI-Sichuan-Mahjong //golang命令行麻将
|
||||
|
||||
https://github.com/lauyikfung/SichuaMahjongAI //SichuaMahjongAI
|
||||
Reference in New Issue
Block a user