使用Azure搜索可以在PDF上搜索全文吗?

时间:2018-12-07 13:25:57

标签: azure azure-storage azure-search

我是Microsoft认知服务的新手。我正在尝试创建一个搜索机器人,该机器人查找2个存储为Azure存储中BLOB的PDF文件。如果用户提出类似“如何提出flexrequest?”之类的问题,它将查看PDF文件并回答用户。 问题是,两个文件都包含关键字“ flexrequest”。

我想知道如何使用Azure搜索在关键字上查找pdf。我已经按照文档上的教程进行操作,但没有成功。它仅查找文档的标题,并返回整个文档。我只需要文字的特定部分。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

应该可以查询文档正文并返回文本片段。但是,您需要确保您的文档正文字段是可搜索和可检索的。

一旦索引配置正确,就可以查询同一索引内的所有可搜索字段。我不确定您的实际索引是什么样子,但是根据您的描述,我在下面创建了一个示例,该示例应查询标题和文档中的术语,并在突出显示的响应中返回包含该术语的文档片段。 GET / indexes / yourIndexHere / docs?search = flexrequest&searchFields = document,title&highlight = document&api-version = 2017-11-11

我还建议您看看QnA Maker,该工具(也使用Azure搜索)旨在完全支持这种情况。 https://azure.microsoft.com/en-us/services/cognitive-services/qna-maker/