【d2l】【困难代码】【2】 output, state = self.rnn(X_and_context, state)

lycnight / 2023-07-28 / 原文

问题来源

【d2l】9.7 序列到序列学习
image
image

为什么解码器的输入中,要把输入数据和编码器中最后一个时间步长的最上一层的状态广播之后拼接在一起进行输入(X_and_context)?

问题解决

原来是编码器的一种设计方法之一,不这么做也行