基于问题的对话框的仅问题数据集

时间:2019-10-14 14:45:55

标签: dataset data-mining data-retrieval

对于我的硕士论文,我使用基于问题的对话框。在这种方法中,只允许您对给定的初始问题提问。透彻的学习理论可以使愚昧无知。 基于此,我尝试实现推荐系统。

对于机器学习或其他方法,必须有庞大的数据集。遗憾的是,该应用程序的使用方式不足以产生足够多的问题。

所以我必须找到新的数据源。我目前无法找到现有的合适数据集,也无法找到适合目的的数据集。

例如,TREC数据集(http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.11.2766&rep=rep1&type=pdf)提供了足够的问题,但它们根本不相关。因此,我将不得不手动创建模式,然后必须再次检索。所以这并不是真的有用。

StackOverflow问题和它们的“相关”问题(如果您从未意识到,则在左下角)也浮在脑海,但它们通常不是问题,通常通过描述问题的文本(语料库)来关联。但是我真的只需要提问。

此外,Reddit Megathread已用于对基础服务进行笔测试。它们在语义上相关并且具有后续关系,但是这些通常也不是问题。

我目前无法提出其他有意义的潜在资源。 有人有创意吗?

0 个答案:

没有答案