论文完成蓝图初步定义

2025-07-22 22:53:20 +08:00
parent a1e81ad870
commit 88bed2a1ef
6 changed files with 293 additions and 0 deletions
--- a/paper/sections/00_abstract.tex
+++ b/paper/sections/00_abstract.tex
@@ -0,0 +1,10 @@
+\begin{abstract}
+    本文拟设计一种新的2048游戏训练流程，最终目的是使用大参数的2D相对位置编码自注意力神经网络，
+    完成对游戏局面的精确估值和决策，并尝试将模型能力由基本的4×4，扩展到3~10之间任意边长、任意长宽比的棋盘尺寸。
+    本文拟设计一种从小参数残差卷积网络（ResNet-style CNN）结合蒙特卡洛树搜索，
+    迁移到中等规模的2D相对位置编码自注意力网络的训练流程，利用CNN+MCTS多次迭代后生成的低噪声高质量数据，
+    指导Transformer模型的高效训练
+
+\end{abstract}
+
+\textbf{关键词：} 2048游戏、深度强化学习、相对位置编码、self-attention、估值策略网络