从任何页面下载所有链接

时间:2010-01-21 11:31:52

标签: c# asp.net file-io download

我想开发一个asp.net页面,通过它我可以指定包含许多文件和链接的任何页面的URL。目录。我想全部下载它们。类似于FireFox的DownThemAll插件。

“MyPage.htm”文件包含许多指向位于同一服务器上的文件/目录的链接。

现在我想编写一个可以下载所有这些文件的函数,如果我提供

“www.mycustomdomain.com \ Mypage.htm”作为输入。

我希望问题很明确。

2 个答案:

答案 0 :(得分:1)

希望我理解你的问题。您有一个带有链接列表的HTM文件,这些链接是指向远程服务器上特定文件的链接,您想要下载所有文件。

没有失败证明的方法来做到这一点。

检查此问题。 How do you parse an HTML in vb.net尽管这是针对VB.net的,但它与您要求的内容有关。您可以获得一系列链接,然后开始下载文件。

您可以使用Computer.Network.DownloadFile方法下载远程文件,并将其保存在您的位置。

这不是一个失败的prrof方法,因为如果下载需要身份验证,那么它将下载HTML页面[主要是腰部页面]

答案 1 :(得分:1)

以HTML格式获取网页。谷歌(c#从网上获取文件)。第一个链接会给你一个想法。

然后找到正则表达式的链接。 www.x.com中链接的一些示例正则表达式模式应为 (http://www.x.com/。*?) (但如果你还在你的正则表达式模式中包含A标签,那就更好了)

并下载文件,如下所示: http://www.csharp-examples.net/download-files/

相关问题