tensorflow - Seq2Seq聊天机器人模型

确切的答案取决于您从Neural Machine Translation model（NMT）获取的构建块以及您将用自己的构建块替换的构建块。我假设图形结构与NMT完全相同。

如果是这样，在推理时，你只能向解码器提供一个零向量。

内部细节：NMT使用名为Helper的实体来确定解码器中的下一个输入（请参阅tf.contrib.seq2seq.Helper文档）。

特别是，tf.contrib.seq2seq.BasicDecoder在执行某个步骤时仅依赖于帮助：输入到后续单元格的next_inputs正好是Helper.next_inputs()的返回值。

Helper接口有不同的实现，例如

tf.contrib.seq2seq.TrainingHelper返回下一个解码器输入（通常是地面实况）。如the tutorial。
tf.contrib.seq2seq.GreedyEmbeddingHelper会丢弃输入，并返回前一个输出中的argmax采样标记。当sampling_temperature超参数为0时，NMT在推理中使用此帮助程序。
tf.contrib.seq2seq.SampleEmbeddingHelper也会这样做，但会根据categorical（a.k.a. generalized Bernoulli）分布对令牌进行抽样。在sampling_temperature > 0。
...

代码采用BaseModel._build_decoder方法。请注意，GreedyEmbeddingHelper和SampleEmbeddingHelper都不关心解码器的输入。所以实际上你可以提供任何东西，但零张量是标准选择。