拆分一段

时间:2011-08-10 13:23:09

标签: .net string split

我想用“。”拆分段落。运营商。 但我不想在某些情况下拆分它。喜欢在哪里“。”带着像“博士”,“太太”和“小姐”这样的词。或者其他一些词。

无论是在C#还是在SQL Server中,我都需要一些逻辑。

1 个答案:

答案 0 :(得分:1)

我把这个问题读作“我如何将段落分成它的组成句子?”,如果这就是你的意思,这就是我如何处理这个问题:

  1. 在句子内建立一个可接受的句号用量的“白名单”
  2. 将段落拆分为“。” (称这些可能的句子)
  3. 循环搜索可能的句子,根据句子中可接受的句号使用情况白名单检查结尾字符
  4. 如果匹配,将该可能的句子与下一个句子合并,并再次检查
  5. 不知道你的真实问题集的范围,我不能说这种方法是否真的可行。

    如果你正在寻找一个更强大的英语语言解析器,那么这是一个(possibly) related question,但这个问题是针对Java的。

相关问题