关于torch.nn.Linear的输入与输出探讨

关于torch.nn.Linear的一点问题最近写Transformer代码的时候，FFN层是线性层，突然发现我丢进去的是一个三维的张量[batch_size, H, d_model]，但是线性层nn.Linear竟然还给它算出来了，而且预期结果形状还是我想要的[batch_size, H, d_ff]。印象中nn.Linear的输入和输出都是二维的。于是我去找了一圈博客，各种博客里面写的都是

文章共252字 · 阅读需要大约1分钟

一键AI生成摘要，助你高效阅读

问答

花飞雨追

15649人浏览 · 2021-05-27 17:19:28

花飞雨追 · 2021-05-27 17:19:28 发布

关于torch.nn.Linear的一点问题

最近写Transformer代码的时候，FFN层是线性层，突然发现我丢进去的是一个三维的张量[batch_size, H, d_model]，但是线性层nn.Linear竟然还给它算出来了，而且预期结果形状还是我想要的[batch_size, H, d_ff]。印象中nn.Linear的输入和输出都是二维的。于是我去找了一圈博客，各种博客里面写的都是输入二维的，更疑惑了。最后去看了官方文档才知道，他们都有问题。

在这里插入图片描述