27 lines
1.1 KiB
TeX
27 lines
1.1 KiB
TeX
\section{引言}
|
||
|
||
\subsection{研究背景}
|
||
2048游戏自2014年发布以来,因其简单的规则和复杂的策略性而广受欢迎。
|
||
作为一个完全信息的确定性游戏(除了新数字的随机生成),2048为研究自监督人工智能算法提供了一个理想的测试平台。
|
||
|
||
\subsection{研究动机}
|
||
传统的卷积神经网络(CNN)在处理2048游戏时存在以下局限性:
|
||
\begin{itemize}
|
||
\item 固定的感受野限制了对全局信息的捕获
|
||
\item 缺乏对位置关系的显式建模
|
||
\item 难以处理不同位置间的长距离依赖关系
|
||
\end{itemize}
|
||
|
||
Self-attention机制的出现为解决这些问题提供了新的思路。
|
||
通过引入2D相对位置编码,我们可以在捕获全局状态信息的同时,对棋盘任意两个位置的关系进行建模,
|
||
同时学习到位置无关的特征表示。
|
||
|
||
\subsection{符号定义}
|
||
\begin{itemize}
|
||
\item 棋盘矩阵 $K$
|
||
\item 矩阵元素 $K_{i,j}$
|
||
\item 方块数字 $N$
|
||
\item 对数变化后的方块数字 $N' = \log_2(N)$
|
||
\item 对数变化后的矩阵 $K'$
|
||
\end{itemize}
|