Update README.md

This commit is contained in:
2024-12-01 18:35:49 +08:00
parent 9cfd4f88af
commit 3ff448b15d

View File

@@ -255,16 +255,9 @@
**示例方法** **示例方法**
- Imitation Learning + Reinforcement Learning - Imitation Learning + Reinforcement Learning:
:
- 先使用监督学习模仿玩家风格,再用强化学习微调策略。 - 先使用监督学习模仿玩家风格,再用强化学习微调策略。
- AlphaZero-like Framework:
- AlphaZero-like Framework
:
- 结合深度强化学习和搜索(如 MCTS强化对局策略。 - 结合深度强化学习和搜索(如 MCTS强化对局策略。
**适用场景** **适用场景**