Swift:解析HTML的最快方法

时间:2014-11-25 05:09:37

标签: regex swift html-parsing

我有一个大型的源代码文件,我需要解析一些特定的文本。我想尽快完成它。在Swift中执行此操作的最快方法是什么?这些都是我能想到的选择吗?

  • 使用第三方字符串函数库 - 我试过这个。它运行良好,但我认为与一般的其他低级方法相比,这要慢很多,除非有一些特别适合Swift的快速方法。

  • 使用第三方HTML解析器。我已经研究了几个,但我不确定它们是否符合我的需求。在我继续这个之前,我只想知道这些是否通常更快,如果有任何明显的快速,并且如果我能够调整它们以获得我想要的源代码。

  • 使用String或NSString。根据我的理解,使用String vs NSString应该没有速度差异。我对这种方法很满意,并且它比其他一些方法更低,所以我应该期待相当快的性能吗?

  • 使用正则表达式。我被告知,由于这些是较低级别,理想情况下它们应该是最快的。我之前使用过正则表达式,但不是在ios中。使用NSRegularExpression进行字符串解析是否容易,是否更快?

谢谢!

1 个答案:

答案 0 :(得分:0)

在研究您的问题时遇到此链接:http://benedictcohen.co.uk/blog/archives/74

作者解释了@CodaFi建议的旧方法,但最后有一个相关的更新,你应该检查:

  

解析HTML的最简单方法是将其视为XML并使用   的NSXMLParser。 iOS附带LibTidy,能够修复   众多的标记罪。使用LibTidy创建干净的XML并传递   这个XML到NSXMLParser。只有使用上面概述的方法   不可能使用NSXMLParser。

那么也许选项4或5可供您查看?