lucene 自带分词器总结

11月 18, 2015 |

KeywordAnalyzer
将整个内容当成一个term,即没有分词

WhitespaceAnalyzer
在空格处分词

SimpleAnalyzer
非字母处分词,会过滤掉数字,且转换为小写

StopAnalyzer
在SimpleAnalyzer的基础上,去掉stop words

StandardAnalyzer
在StopAnalyzer的基础上,支持ip,email地址,数字,字母中日韩等字符的提取

PerFieldAnalyzerWrapper
每个Field一个分析器的支持

Posted in: Lucene

Comments are closed.