5.2 KiB
5.2 KiB
Deep2048 项目组织总结
📁 项目结构整理
1. 测试文件整理
已整理的测试文件 (tests/ 目录):
test_training_data.py- 训练数据模块测试test_game_engine.py- 游戏引擎测试test_mcts.py- MCTS算法测试run_all_tests.py- 统一测试运行器
运行测试:
# 运行所有测试
python tests/run_all_tests.py
# 快速测试(跳过性能测试)
python tests/run_all_tests.py --quick
# 运行特定测试
python -m pytest tests/test_training_data.py -v
2. 数据目录命名规范
统一命名规范:
data/ # 所有数据文件
├── training/ # 训练数据
├── l0_training/ # L0阶段训练数据
├── l0_production/ # L0生产数据
└── l0_test/ # L0测试数据
logs/ # 所有日志文件
├── l0_generation/ # L0数据生成日志
├── l0_production/ # L0生产日志
└── l0_test/ # L0测试日志
checkpoints/ # 所有检查点文件
├── l0/ # L0检查点
├── l0_production/ # L0生产检查点
└── l0_test/ # L0测试检查点
results/ # 结果输出
└── benchmark/ # 基准测试结果
outputs/ # 其他输出文件
models/ # 模型文件
已更新的配置:
training_data.py- 默认数据目录:data/trainingl0_play.py- L0数据目录:data/l0_trainingl0_config.json- 生产配置更新
3. .gitignore 管理
统一的忽略规则:
# 统一数据目录
data/
logs/
checkpoints/
outputs/
results/
models/
# 临时数据目录(旧命名,逐步迁移)
*_data/
*_logs/
*_checkpoints/
training_data/
# ... 其他旧目录
# 数据文件
*.pkl
*.pickle
*.pth
*.pt
*.h5
*.npz
# 临时文件
*.tmp
*.temp
*.bak
*.backup
🛠️ 新增工具
1. 快速基准测试工具
功能:
- 自动测试不同线程数的性能
- 找出最优的MCTS配置
- 测试不同棋盘大小和模拟深度
- 生成性能报告和推荐配置
使用方法:
# 快速测试(推荐)
python benchmark_tool.py --quick
# 完整基准测试
python benchmark_tool.py
# 指定输出目录
python benchmark_tool.py -o results/my_benchmark
示例输出:
🎯 快速推荐:
最优线程数: 1
预期速度: 241.3 模拟/秒
CPU效率: 241.3 模拟/秒/核心
2. 项目清理工具
功能:
- 扫描和清理临时文件
- 清理旧命名的数据目录
- 清理Python缓存和日志文件
- 预览模式和交互式确认
使用方法:
# 预览清理(不实际删除)
python tools/cleanup.py --dry-run
# 交互式清理
python tools/cleanup.py
# 自动清理(不询问)
python tools/cleanup.py --yes
📊 性能基准结果
测试环境:
- CPU: 多核处理器
- 测试配置: 3x3棋盘, 200次模拟
关键发现:
- 最优线程数: 1线程 (241.3 模拟/秒)
- 多线程效果: 在当前实现中,多线程没有显著提升
- 推荐配置:
- 线程数: 1
- 模拟深度: 80
- 棋盘大小: 3x3 (L0阶段)
🚀 使用建议
1. 开发环境设置
# 1. 运行快速基准测试
python benchmark_tool.py --quick
# 2. 根据结果配置MCTS
mcts = PureMCTS(
c_param=1.414,
max_simulation_depth=80,
num_threads=1 # 根据基准测试结果
)
# 3. 运行测试确保功能正常
python tests/run_all_tests.py --quick
2. L0数据生成
# 快速测试
python l0_play.py --quick
# 生产环境(使用优化配置)
python l0_play.py --config l0_config.json
3. 项目维护
# 定期清理临时文件
python tools/cleanup.py --dry-run # 先预览
python tools/cleanup.py # 确认后清理
# 运行完整测试
python tests/run_all_tests.py
📈 性能优化建议
1. MCTS配置优化
基于基准测试结果:
- 单线程最优: 当前实现中单线程性能最佳
- 模拟深度: 80为性能和质量的平衡点
- 棋盘大小: 3x3适合L0阶段快速训练
2. 数据管理优化
- 使用统一的数据目录结构
- 定期清理临时文件释放空间
- 使用检查点功能支持断点续传
3. 开发流程优化
- 使用快速基准测试确定最优配置
- 运行测试套件确保代码质量
- 使用清理工具维护项目整洁
🎯 下一步计划
-
性能优化:
- 研究多线程性能瓶颈
- 优化MCTS算法实现
- 考虑CUDA加速的实际应用
-
功能扩展:
- 添加更多基准测试指标
- 实现自动配置调优
- 添加可视化工具
-
工程化改进:
- 添加配置验证
- 改进错误处理
- 完善文档和示例
📝 总结
通过本次整理,项目现在具备了:
✅ 清晰的目录结构 - 统一的命名规范和组织方式
✅ 完整的测试套件 - 覆盖核心功能的测试
✅ 性能基准工具 - 自动找出最优配置
✅ 项目维护工具 - 自动清理和管理
✅ 标准化的工作流 - 从开发到部署的完整流程
项目现在更加工程化、易维护,为后续的神经网络训练和模型优化奠定了坚实的基础。