找到正确的xpath

时间:2016-05-13 08:54:07

标签: xpath scrapy

我想从page找到字符串

的正确xpath

Untersuchung polymerischer stabilsation in kolloidalen Systemen unter Verwendung neuartiger feldtheoretischer Simulationen ”for one item and other item of string is strong>“EntwicklunghämatopoietischerStammzellen aus humanen ES- und iPS-Zellen”< /强>

name = 'lianjia'
allowed_domains = ["gepris.dfg.de/gepris/"]
start_urls =['http://gepris.dfg.de/gepris/institution/5000', 'http://gepris.dfg.de/gepris/institution/5008']
My Scrapy program is
    def parse(self, response):
        for sel in response.xpath("//div[@id='detailseite']"):        
            lianjia = lianjiaItem()
            lianjia['item1'] = sel.xpath("").extract()
            lianjia['item2'] = sel.xpath("").extract()

1 个答案:

答案 0 :(得分:0)

lianjia['item1'] = sel.xpath("//li[@id=4]/ul/li/ul/li[1]/div/div/a/text()").extract()
lianjia['item2'] = sel.xpath("//li[@id=4]/ul/li/ul/li[2]/div/div/a/text()").extract()