如何计算文本中单词的频率

时间:2014-11-14 23:56:39

标签: javascript arrays

如何实现javascript函数来计算文本中单词的频率

frequencies('foo foo bar foo   bar buz', ['foo', 'bar']);

should return {"bar": 2, "foo": 3}

3 个答案:

答案 0 :(得分:4)

这样的事情应该这样做

function frequencies(str, opts) {
    var o = {};
    opts.forEach(function(opt) { o[opt] = 0; });
    str.split(/\s+/).forEach(function(x) { if (x in o) o[x]++; });

    return o;
}

FIDDLE

答案 1 :(得分:0)

如果你可以使用下划线/ lodash,那么简单如下:

function frequencies(str) {
  return _.countBy(str.split(' '));
}

答案 2 :(得分:0)

这个怎么样:

function frequencies(str, words){
    var ret = {}, split = str.split(' ');

    for(var i = 0; i < split.length; i++){
        var currentWord = split[i];
        if(!currentWord || !~words.indexOf(currentWord)) continue;
        ret[currentWord] = !ret[currentWord] ? 1 : ret[currentWord]+1;
    }

    return ret;
}

console.log(frequencies('foo foo bar foo   bar buz', ['foo', 'bar']));

http://jsfiddle.net/uqgtqy01/1/