是否有一个共同的“坏词”列表?

时间:2011-03-08 21:52:52

标签: language-agnostic

我正在寻找一个常见的坏词列表,以便我可以创建一个过滤器。

最好是一个包含整个单词的列表,我不想过滤掉每个包含坏词的单词(即过滤所有包含ass的单​​词会过滤“assassinate”)

3 个答案:

答案 0 :(得分:1)

我用12种语言收集了2200个坏词:en,ar,cs,da,de,eo,es,fa,fi,fr,hi,hu,it,ja,ko,nl,no,pl,pt, ru,sv,th,tlh,tr,zh。

可以使用MySQL转储,JSON,XML或CSV选项。

https://github.com/turalus/openDB

答案 1 :(得分:0)

结帐:No swearing.。他们目前有一个有限的API,但您可以使用他们的搜索网址直接发出http请求。

http://www.noswearing.com/search.php?st=ass&submit=Search

答案 2 :(得分:0)

单词列表以及要插入MySQL数据库的脚本:

http://urbanoalvarez.es/blog/2008/04/04/bad-words-list/