Theme
线性代数是深度学习、计算机视觉和自然语言处理的共同基础。
向量空间中的线性组合:
v=∑i=1nαieiv = \sum_{i=1}^{n}\alpha_i e_i v=i=1∑nαiei
矩阵乘法可以理解为线性变换复合:
Y=XWY = XW Y=XW
在 Transformer 注意力 中,QK⊤QK^\topQK⊤ 就是批量相似度计算。