在Drupal中处理RSS提要内容

时间:2011-10-17 16:57:15

标签: php drupal drupal-6 rss feed

我目前正在与第三方合作,他们通过RSS Feed向我们提供产品信息。

我们的Drupal 6网站从每个Feed(基本上是类别)导入RSS故事(产品),并在我们的商店页面中显示结果节点。我们使用Feeds模块。

到目前为止,这么好,这个系统已经工作了一年多了。

我的问题是,如何提取更多RSS提要内容?

我的意思是,目前价格是Feed的一部分,但我们的网站没有作为数据库中的实体的价格,它只是有一团HTML。

我希望在自定义CCK字段中定价,这样我们就可以更清楚地列出事物等等。

我从来没有超越主题Drupal,但我对PHP / XPath / DOM感到满意,所以我确信如果我能弄清楚如何挂钩和解析HTML内容,这是可能的。喂自己。

不是在某种程度上将某些东西放在一起可能是次优的,有人可以建议我最好这样做吗?自定义Feed导入模块? Drupal中的其他一些钩子可以后处理节点吗?

修改

为了澄清,我们目前使用Feeds模块(6.x-1.0-beta),并将RSS标题,描述,日期等映射到CCK字段。

我想做的是更进一步,解析RSS'描述'字段的HTML内容。

更新

http://drupal.org/project/feedapi_scraper

这看起来像我所追求的那样,但看起来并没有广泛使用,这总是让我对Drupal模块有点紧张。我会试一试并报告。

2 个答案:

答案 0 :(得分:0)

我很确定Feed Element Mapper module会为你做的一切: - )

从模块页面:

FeedAPI的附加模块,用于将Feed(例如标记)或作者名称上的元素映射到分类法或CCK字段。这些映射可通过点击来配置。

答案 1 :(得分:0)

这个模块看起来是一个很好的解决方案:

http://drupal.org/project/feeds_xpathparser

它支持使用任意XPath从源提要中提取信息。