在最近的单词边界上截断字符串

时间:2009-02-05 05:39:54

标签: java string

是否可以在多个字符后将Java字符串截断为最接近的字边界。类似于PHP wordwrap()函数,如example所示。

4 个答案:

答案 0 :(得分:14)

使用java.text.BreakIterator,如下所示:

String s = ...;
int number_chars = ...;
BreakIterator bi = BreakIterator.getWordInstance();
bi.setText(s);
int first_after = bi.following(number_chars);
// to truncate:
s = s.substring(0, first_after);

答案 1 :(得分:4)

您可以使用正则表达式

Matcher m = Pattern.compile("^.{0,10}\\b").matches(str);
m.find();
String first10char = m.group(0);

答案 2 :(得分:2)

使用第一种方法,您的最终长度将大于number_chars。如果您需要精确的最大值或更少,例如Twitter消息,请参阅下面的实现。

请注意,regexp方法使用空格来分隔单词,而BreakIterator即使有逗号和其他字符也会分词。这是更理想的。

这是我的全部功能:

/**
     * Truncate text to the nearest word, up to a maximum length specified.
     * 
     * @param text
     * @param maxLength
     * @return
     */
    private String truncateText(String text, int maxLength) {
        if(text != null && text.length() > maxLength) {
            BreakIterator bi = BreakIterator.getWordInstance();
            bi.setText(text);

            if(bi.isBoundary(maxLength-1)) {
                return text.substring(0, maxLength-2);
            } else {
                int preceding = bi.preceding(maxLength-1);
                return text.substring(0, preceding-1);
            }
        } else {
            return text;
        }
    }

答案 3 :(得分:0)

使用BreakIterator的解决方案在破解句子是URL时并不是非常简单,它打破URL不是很好的方式。我宁愿使用我的解决方案:

public static String truncateText(String text, int maxLength) {
    if (text != null && text.length() < maxLength) {
        return text;
    }
    List<String> words = Splitter.on(" ").splitToList(text);
    List<String> truncated = new ArrayList<>();
    int totalCount = 0;
    for (String word : words) {
        int wordLength = word.length();
        if (totalCount + 1 + wordLength > maxLength) { // +1 because of space
            break;
        }
        totalCount += 1; // space
        totalCount += wordLength;
        truncated.add(word);
    }
    String truncResult = Joiner.on(" ").join(truncated);
    return truncResult + " ...";
}

Splitter / Joiner来自番石榴。我还在我的使用cas(可以省略)中添加...