在<p> ... </p>段落元素中提取文本

时间:2011-09-12 11:48:15

标签: android string parsing

我有一个像

这样的字符串
some text <p>any text</p>

我需要删除部分

<p>any text</p>

因此,获取字符串

some text

我从教程中找到了一些示例代码来处理字符串,但我不明白它是如何工作的。我是编码新手,很难,因为我不懂英语。

private String description;

public void setDescription(String description) {
    this.description = description;
    if (description.contains("<p>")) {
        String musor  = description.substring(description.indexOf("<p>"));
        String cleanUp = musor.substring(0, musor.indexOf("</p>")+1);
        musor = musor.substring(musor.indexOf("<p>"));
        this.description = this.description.replace(cleanUp, "");
    }
}

1 个答案:

答案 0 :(得分:3)

你可以使用可以解决问题的正则表达式。

String regexp = "<p>.*?</p>";
String replace = "";
myString.replaceAll(regexp, replace);

<p>替换所有 - 标记及其内容。 (另见http://www.regular-expressions.info/。)

我想有很多库可以做同样甚至更多。