论文完成蓝图初步定义
This commit is contained in:
10
paper/sections/00_abstract.tex
Normal file
10
paper/sections/00_abstract.tex
Normal file
@@ -0,0 +1,10 @@
|
||||
\begin{abstract}
|
||||
本文拟设计一种新的2048游戏训练流程,最终目的是使用大参数的2D相对位置编码自注意力神经网络,
|
||||
完成对游戏局面的精确估值和决策,并尝试将模型能力由基本的4×4,扩展到3~10之间任意边长、任意长宽比的棋盘尺寸。
|
||||
本文拟设计一种从小参数残差卷积网络(ResNet-style CNN)结合蒙特卡洛树搜索,
|
||||
迁移到中等规模的2D相对位置编码自注意力网络的训练流程,利用CNN+MCTS多次迭代后生成的低噪声高质量数据,
|
||||
指导Transformer模型的高效训练
|
||||
|
||||
\end{abstract}
|
||||
|
||||
\textbf{关键词:} 2048游戏、深度强化学习、相对位置编码、self-attention、估值策略网络
|
||||
Reference in New Issue
Block a user