PDF blob中的搜索关键字-Azure搜索

时间:2018-08-02 13:57:02

标签: azure metadata azure-storage-blobs azure-search

我正在尝试搜索PDF文档的元数据中包含的关键字。我不确定这是否可能。任何指导将不胜感激!

这是我所指的PDF中关键字/标签的示例 enter image description here

我知道可以在搜索索引中添加字段,但是不确定如何映射它。我已经尝试了以下方法,但是没有用。

enter image description here

enter image description here

2 个答案:

答案 0 :(得分:1)

以下是关键字元数据的工作方式-

  1. 向pdf文件添加关键字(元数据)将不起作用,因为pdf仅支持所选的自定义元数据标签。 请参阅此文档-https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage

  2. 解决此问题的方法是将元数据标签添加到pdf文件blob本身。 enter image description here

  3. 在以天蓝色搜索(“所有元数据” /存储元数据)创建索引之后,该键开始出现在要选择的字段名称列表下(搜索/检索/过滤器等)。 enter image description here

  4. 最后,我们现在可以搜索自定义关键字。 enter image description here

答案 1 :(得分:0)

关键字标记不是我们通过metadata_格式支持的标记之一(列出的标记为here)。如果将一个字段添加到名为“关键字”的索引中,它会提取出来吗?另外,如果您以类似Azure Storage Explorer的方式查看PDF的属性,则我假设此关键字元数据仍然存在,并且称为“关键字”。如果没有,这可能会提供一些其他见解。