从食谱网站上抓取食谱成分

时间:2019-12-16 10:35:28

标签: web-scraping

我正试图从食谱网站上抓取几种食谱的成分。 我正在使用google chrome webscraper扩展名。

这是我创建的站点地图: {“ _id”:“ klassiekers_dagelijkse_kost1”,“ startUrl”:[“ https://dagelijksekost.een.be/#category=98&kitchen=44&type=32”],“选择器”:[{“ id”:“所有项”,“类型”:“ SelectorLink”,“ parentSelectors”: [“ _root”],“选择器”:“。desktop-search-overlay__结果a.large-recipe-teaser”,“ multiple”:true,“ delay”:0},{“ id”:“ afzonderlijke项目”,“ type“:” SelectorLink“,” parentSelectors“:[” alal items“],” selector“:”。desktop-search-overlay__results li:nth-​​of-type(1)a.re​​cipe-teaser“,” multiple “:true,” delay“:0},{” id“:” Gerecht“,” type“:” SelectorLink“,” parentSelectors“:[” afzonderlijke items“],” selector“:” div.dish-detail__content“ ,“ multiple”:false,“ delay”:0},{“ id”:“ image”,“ type”:“ SelectorImage”,“ parentSelectors”:[“ Gerecht”],“ selector”:“。desktop-search -overlay__results li:nth-​​of-type(1)div.large-recipe-teaser__image“,” multiple“:false,” delay“:0},{” id“:” Naam“,” type“:” SelectorText“ ,“ parentSelectors”:[“ Gerecht”],“ selector”:“ h1.dish-metadata__title”,“ multiple”:false,“ regex”:“”,“ delay”:0},{“ id”:“Ingrediënten “,” type“:” SelectorLink“,” parentSelectors“:[” Gerecht“],” selector“:” div.d ish-ingredients border-block“,” multiple“:true,” delay“:0},{” id“:”ingrediëntenblok“,” type“:” SelectorLink“,” parentSelectors“:[”Ingrediënten“],”选择器“:” ul.ingredients--“,”多个“:true,”延迟“:0},{” id“:” Benodigdheden“,”类型“:” SelectorText“,” parentSelectors“:[”ingrediëntenblok“ ],“ selector”:“ span.ingredient__product”,“ multiple”:true,“ regex”:“”,“ delay”:0},{“ id”:“ Hoeveelheden”,“ type”:“ SelectorText”,“ parentSelectors“:[”ingrediëntenblok“],” selector“:” span.ingredient__unit“,” multiple“:true,” regex“:”“,” delay“:0},{” id“:” Bereidingstijd“,” type“:” SelectorText“,” parentSelectors“:[” Gerecht“],” selector“:” div.dish-metadata__info-line:nth-​​of-type(1)“,” multiple“:false,” regex“: “”,“ delay”:0},{“ id”:“类别”,“类型”:“ SelectorText”,“ parentSelectors”:[“” Gerecht“],”选择器“:” div.dish-metadata__info-line [ analyticsid]“,” multiple“:false,” regex“:”“,” delay“:0}]}}

当我开始抓取时,我可以看到它正在运行着几个配方。但是我一直收到消息,没有提取数据。 有人可以告诉我我在做什么错吗?

0 个答案:

没有答案