我是否必须让自己的LUIS实体识别“最新”这个词

时间:2017-09-29 16:50:10

标签: botframework luis

我目前正在使用预建的实体ORDINAL,它非常适合识别FIRST和LAST这两个词。但是,从测试中,我发现我的用户使用“最新”这个词,并且它不会将其识别为ORDINAL。

我应该创建自己的实体吗?任何帮助指出我正确的方向将不胜感激。

1 个答案:

答案 0 :(得分:1)

对于这个例子,你有三个选择,其中两个在LUIS本身。

LUIS:选项1 - 简单实体

  • 在您的应用程序中创建一个简单实体,并将latest及其同义词添加到您的LUIS应用程序中。
  • 优势包括减少代码债务,能够手动标记令牌,以及使用机器学习识别latest及其同义词(注意:您仍需提供LUIS的同义词来识别)
  • 缺点包括在您的应用程序中使用的较少实体(简单,分层和复合实体的任何组合的当前限制为每个应用程序30个。)

LUIS:选项2 - 列出实体

  • 在您的应用程序中创建一个列表实体,并添加latest作为子列表的规范形式,并在列表中将其同义词作为值进行匹配。
  • 优势包括RegEx匹配,从您的应用程序中抽象出来。 LUIS将识别列表实体中已存在的任何令牌。
  • 缺点包括使用一组有限的同义词丢失一个字的一个列表实体(列表实体的当前限制为每个应用程序50个)。您必须手动将每个标记添加到子列表才能被识别。用户无法使用列表实体标记令牌。 未在LUIS的机器学习方面使用,无助于提高意图预测分数。

应用程序级别:RegExp /子字符串解析

  • 创建一个令牌提取器(使用RegExp或其他一些技术)来识别单词latest及其同义词
  • 这样做的好处包括LUIS资源(实体和列表实体)的支出减少,不太重要的是,从LUIS接收结果所花费的时间可能会减少很少。
  • 由于必须在您的应用程序中执行匹配,因此包括增加的代码债务。