Compare commits
7 Commits
| Author | SHA1 | Date |
|---|---|---|
|
|
e85e7d9096 | |
|
|
798d1af835 | |
|
|
0d723495ce | |
|
|
4a9f45b2df | |
|
|
96353480be | |
|
|
7f06b5648e | |
|
|
0dd368cc33 |
22
README.md
22
README.md
|
|
@ -101,13 +101,13 @@
|
|||
|
||||
3. **带幺九**:
|
||||
|
||||
- **带幺九**:指玩家手上的牌全部是由1和9组成的顺子、刻子或对子。例如,123, 789, 111, 999, 11等。计为3番。
|
||||
- **带幺九**:指玩家手上的牌全部是由1和9组成的顺子、刻子或对子。例如,123, 789, 111, 999, 11等。计为3番。<!--存疑-->
|
||||
|
||||
- **清带幺九**:指玩家手上的牌不仅全部由1和9组成,而且是同一花色(条、筒、万),即清一色的带幺九。计为1番。<!--存疑-->
|
||||
|
||||
4. **七对**:手牌由7个对子组成,计为2番。
|
||||
|
||||
5. **全求人**:所有牌都是通过碰、杠、吃别人打出的牌来完成的,计为6番。
|
||||
5. **全求人**:所有牌都是通过碰、杠别人打出的牌来完成的,计为6番。
|
||||
|
||||
6. **龙七对**:七对中有一对是三张相同的牌,计为12番。
|
||||
|
||||
|
|
@ -205,4 +205,20 @@ TensorBoard 通常会记录和可视化多种训练指标。你提到的这些
|
|||
- **`train/entropy_loss`**:熵损失,反映策略的探索程度。
|
||||
- **`train/clip_range`**:剪裁范围,反映策略更新的限制。
|
||||
- **`train/clip_fraction`**:被剪裁的比例,反映策略更新的稳定性。
|
||||
- **`train/approx_kl`**:近似 KL 散度,反映策略更新的幅度和稳定性。
|
||||
- **`train/approx_kl`**:近似 KL 散度,反映策略更新的幅度和稳定性。
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
## 参考
|
||||
|
||||
https://github.com/mangenotwork/CLI-Sichuan-Mahjong //golang命令行麻将
|
||||
|
||||
https://github.com/lauyikfung/SichuaMahjongAI //SichuaMahjongAI
|
||||
|
||||
https://github.com/risseraka/node-sichuan-mahjong //nodejs
|
||||
|
||||
https://github.imc.re/latorc/MahjongCopilot //麻将 AI 助手,基于 mjai (Mortal模型) 实现的机器人。
|
||||
|
||||
https://github.com/kennyzhang0819/Sichuan-Mahjong-AI-Testbed // Java 完整实现的四川麻将游戏的源代码
|
||||
Loading…
Reference in New Issue