处理文本数据以进行分类

时间:2016-10-11 06:50:35

标签: machine-learning neural-network

假设我们输入的数据包含离散值和一串文本,输出应该是一组标记。

要把它变成可以输入神经网络的数据,我无法弄清楚如何处理文本输入。

仅使用文本输入,我假设生成思想向量的RNN可以工作,但我有点不确定如何提供其余的输入数据。

1 个答案:

答案 0 :(得分:1)

如果您使用RNN处理文本输入,则RNN的输出可以与离散要素的单热编码连接。然后可以将连接的矢量馈送到输出层(例如,逻辑以计算跨多个标签的交叉熵损失)。

同样,如果您使用嵌入图层来映射输入文本,您也可以为离散特征学习另一种嵌入。然后可以将两个嵌入的要素族连接起来以输入到输出层。

enter image description here