post_img

Attention Is All You Need

摘要

缩放点积注意力(Scaled Dot-Product Attention) 在自注意力机制中,注意力分数的计算公式为:$$\tex …