根据标题,我现在正在做的是使用Java从HTML中提取数据。问题是,我提取的数据包含我不需要的信息
以下是我正在提取的HTML代码的一部分
<div class="postdetails">
Member Group: Junior Member<br />
Joined: Mar 2010
</div>
现在我得到的输出是Member Group: Junior Member Joined: Mar 2010
,这两行都是行。
我想要的是Mar 2010
部分。我可以知道如何截断这句话吗?
以下是我提取数据的Java代码的一部分
Elements joinDate = doc.select("div.postdetails");
System.out.println(joinDate.text());
答案 0 :(得分:0)
假设您想要在最后一个':'之后的文本,那么您可以使用
var n = str.lastIndexOf(":");
然后使用str.substr(n)