python - 使用深度学习技术进行文本摘要

时间：2014-05-19 04:53:35

标签： python theano summarization deep-learning

我正在尝试总结属于合法域的文本文档。

我指的是关于如何实施深度学习架构的网站deeplearning.net。我已经阅读了很多关于文档摘要（单个文档和多文档）的研究论文，但我无法确定如何为每个文档生成摘要。

培训完成后，网络会在测试阶段稳定下来。因此，即使我知道在训练阶段学习的一组特征（我已经想到），在测试过程中很难找出每个特征的重要性（因为网络的权重向量是稳定的）我将尝试为每个文档生成摘要。

我试图解决这个问题很长一段时间，但这是徒劳的。

如果有人参与其中或对此有任何想法，请给我一些指示。我非常感谢你的帮助。谢谢。

答案 0 :(得分：2)

我认为你需要更具体一点。当你说＆＃34;我无法确定为每个文档生成摘要的准确性时，是否意味着你不知道如何解释学到的功能，或者你不了解算法？此外，＆＃34;深度学习技巧＆＃34;涵盖范围非常广泛的模型 - 您实际上正在尝试使用哪种模型？

在一般情况下，深度学习模型不会学习人类可以解释的特征（尽管如此，您当然可以尝试寻找给定输入与模型中相应激活之间的相关性）。所以，如果你问的是什么，那就没有好的答案。如果您在理解您正在使用的模型时遇到困难，我可以帮助您:-)请告诉我。

答案 1 :(得分：0)

这是blog series，从文本摘要的工作原理开始就进行了详细讨论，最近的研究使用了基于seq2seq深度学习的模型，该博客系列从解释这种体系结构开始，直到找到最新的研究方法。 / p>

此repo还在构建文本摘要模型时收集了多种实现，它在google colab上运行这些模型，并将数据托管在google驱动器上，因此，无论您的计算机多么强大，都可以使用google colab这是一个免费的系统，可以在

上训练您的深层模型

如果您希望看到文本摘要的实际效果，可以使用此free api。

我真的希望这会有所帮助