使用正则表达式删除字符串的一部分

时间:2013-09-01 16:07:17

标签: c# regex replace rss

我在C#中有一个RSS阅读器,我的问题是有些网站也在其提要中显示图片,但我不需要它。这就是现在对该网站新闻的描述:

/calcio/calciomercato/2013/09/01-271389/Calciomercato?rssimage This is the actual news...
/calcio/calciomercato/2013/08/01-271389/Notizia?rssimage This is the real news...
/calcio/calciomercato/2013/05/01-271389/Esempio?rssimage The news...

如何在实际新闻之前删除所有文字?所有“不受欢迎的部分”都以“?rssimage”结尾,那么我怎样才能删除之前的所有文本?而且,我如何检查新闻是否包含这个不受欢迎的文本?

谢谢!

编辑: 这是RSS: http://tuttosport.feedsportal.com/c/34178/f/619230/index.rss

这是desided输出: Gli emiliani vogliono un attaccante:il sogno resta Belfodil,un'ipotesiconcretaèFloroFlores,mac'èancheil cileno dell'Universidad

I biancoscudati sognano il grande colpo:operazioneperòdifficileperchèSartoridovrebbe poi trovare il sostituto proprio in extremis

L'attaccantefinoraèstoopoco impiegato tra i titolari,potrebbe andare a fare esperienza:i friulani lo hanno proposto al Bologna a titolo temporaneo

2 个答案:

答案 0 :(得分:3)

这很简单,我们不需要Regex,只需要一些string methods

int i = line.IndexOf("?rssimage");
if(i != -1) line = line.Substring(i+8).TrimStart();

答案 1 :(得分:3)

尝试:

string input = "/calcio/calciomercato/2013/09/01-271389/Calciomercato?rssimage This is the actual news...";
string output = Regex.Replace(input, @"(.*?)\?rssimage ", string.Empty);

不要忘记在代码文件的操作中添加using System.Text.RegularExpressions;