HTML Agility Pack如何找到文本的某些部分

时间:2019-05-20 23:47:01

标签: c# html parsing

我正试图从一个网站中获取一些变量,并且这些变量大约有30次出现。我遇到的问题是我不知道如何搜索和翻录html的某些部分,因为该html的所有内容都在一行中,我需要获取

名称(和值) 高(价值) 宽度(值) url(值)

我需要链接高度和宽度,然后找到名称并找到链接

然后需要将链接图像保存到pc中,我的div类已正常工作

尝试了多个节点集并使用正则表达式(对于html,正则表达式非常糟糕,很糟糕)

            var url = "https://sketchfab.com/3d-models/steyr-aug-a3-4cea993b9f0d47c6b1beed7877b17447";

            using (HttpClient client = new HttpClient())
            {
                using (HttpResponseMessage response = client.GetAsync(url).Result)
                {
                    using (HttpContent content = response.Content)
                    {
                        string result = content.ReadAsStringAsync().Result;
                        System.IO.File.WriteAllText(Application.StartupPath + "rip.html", result);
                    }
                }
            }


            var path = Application.StartupPath + "rip.html";

            var doc = new HtmlAgilityPack.HtmlDocument();
            doc.Load(path);

            var node = doc.DocumentNode.SelectNodes("//div[@class='dom-data-container']");

我不确定如何查找

名称或我需要查找的文件,在这里 https://hastebin.com/igavulogax.js

并想解析名称并获得价值 宽度并获得价值 身高和获得价值 并输入url值,然后使用name值将其保存为url图像

0 个答案:

没有答案