如何通过typo3索引搜索和爬虫排除内容元素索引

时间:2013-07-31 07:43:01

标签: indexing typo3 web-crawler

当我从Backend抓取内容时,我将索引所有内容。 我想排除特定内容区域或(特定内容元素)。

我使用的是typo3版本4.7.12 和索引搜索4.7.7和爬虫版本3.5.0

任何想法请告诉我......

提前致谢。

1 个答案:

答案 0 :(得分:1)

此外,您可以将标记作为HTML注释插入,以定义要在索引中包含或排除的正文文本的哪一部分:

标记为<!--TYPO3SEARCH_begin-->和/或<!--TYPO3SEARCH_end-->

规则:

  • 如果根本没有标记,则包含所有内容。
  • 如果第一个找到的标记是“结束”标记,则包含该点之前的内容,并排除前一个代码直到下一个“开始”标记。
  • 如果第一个找到的标记是“开始”标记,那么直到该点之前的内容将被排除在内容之前,直到包含下一个“结束”标记为止。

Copy & pasted from documentation