删除数据框中字符列的前N行

时间:2018-11-22 14:05:44

标签: r

我有一个包含电子邮件的数据框。有一个名为“ message”的列,如下所示:

> > dataset$message[1]  
>[1] Message-ID:...
> 
> Date: ...
> 
> From: ...
> 
> To:...
> 
> Subject: ...
> 
> Mime-Version: ...
> 
> Content-Type:...
> 
> Content-Transfer-Encoding: ...
> 
> X-From:...
> 
> X-To: ...
> 
> X-cc:...
> 
> X-bcc: ...
> 
> X-Folder: ...
> 
> X-Origin: ...
> 
> X-FileName: ...
>  
> > Some message text

换句话说,每个条目包含15行标题,然后是文本。我想要的是从每行中删除这15行,只保留文本,这样

>dataset$message[1]

看起来像这样:

> Some message text

1 个答案:

答案 0 :(得分:1)

类似的事情会起作用:

sub("^(?:.*\\n){15}", "", multiline_string_mail, perl = TRUE)

#[1] "Super secret message"

示例数据:(您应始终提供可用的示例数据)

multiline_string_mail =
"hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
Super secret message"