Google Docs ImportXML的XPath查询

时间:2015-03-07 21:25:54

标签: xpath xml-parsing google-sheets salesforce

我正试图从salesforce中提取一系列笔记,我真的只需要这些笔记的正文,而我宁愿避免手动复制这些笔记。

我已将笔记的网址添加到Google文档电子表格中,并且我正在尝试使用ImportXML函数来提取特定信息,但我似乎无法正确获取xpath查询。

经过我自己的一些尝试和相当多的研究(我是一个完整的初学者,所以我可能只是在寻找错误的东西)我想出了一个像这样的xpath查询:

//div[@class="pbSubsection"]//td[@class="data2Col"][5]//text

这会导致解析错误。

我还发现我可以在Chrome和开发者工具中打开Note,找到该表并右键单击以选择Copy XPath,它给了我:

//*[@id="ep"]/div[2]/div[2]/table/tbody/tr[5]/td[2]

即使我将//文字追加到最后。显然,这并不像我要求的那样万无一失;有什么我在这里缺少或我可以使用一些工具来弄清楚这些查询的问题?我没有太多运气就试过了XMLQuire。

然后,如果某种善意的人想要查看页面代码(匆忙改变以删除敏感信息)并具体告诉我我缺少什么,我会满足于此:

https://www.dropbox.com/s/peo5i47du1vtsmu/test.html

我试图提出的文字是:

  

teamviewer 12345   服务器:客户名称,ST   用户名:administrator   密码:password1

有什么想法吗?提前感谢您的时间。

1 个答案:

答案 0 :(得分:0)

"//div[@class='pbSubsection']//td[@class='data2Col']/text()"

产量

['Connection Details',
 'teamviewer 12345 \r',
 '\r',
 'Server: Customer Name, ST\r',
 'Username: administrator\r',
 'Password: password1']
相关问题