Doris基础学习系列（四十五）Doris的分词测试

Rae V管理员 /2023-09-05/1.8 K阅读/0评论

0905

文章最后更新时间2024年12月13日，若文章内容或图片失效，请留言反馈！

在Doris中我们如果使用倒排索引的话，那么对应部分字段我们会涉及到分词，本文的话，我们来介绍下分词的使用测试案例。

SELECT TOKENIZE('中华人民共和国','"parser"="chinese","parser_mode"="fine_grained"');

SELECT TOKENIZE('中华人民共和国','"parser"="chinese","parser_mode"="coarse_grained"');

SELECT TOKENIZE('I love CHINA','"parser"="english"');

SELECT TOKENIZE('I love CHINA 中华人民共和国','"parser"="unicode"');

从上面的分词测试结果可以看出，混合分词和英文分词的效果都差不多，如果是中文的话，还是建议使用中文分词。

真正的成长, 源于内心的觉醒和不懈的努力, 你的信念和行动, 将铺就通往更好的自己的道路

还没有评论，来说两句吧...