Skip to content
This repository has been archived by the owner on Apr 19, 2024. It is now read-only.

词库存在包含关系的词组时,分词只按长词组生效,被包含词组不生效 #82

Open
Limaoda opened this issue Oct 21, 2021 · 0 comments

Comments

@Limaoda
Copy link

Limaoda commented Oct 21, 2021

例如词库中有这两个词组:深圳科技、深圳科技有限公司

深圳科技 用 jieba_search 分词后:深圳科技 用 jieba_index 分词后:深圳、科技、深圳科技

深圳科技有限公司 用 jieba_search 分词后:深圳科技有限公司 用 jieba_index 分词后:深圳、科技、科技、有限、公司、深圳科技有限公司

正常来说 深圳科技有限公司 不管用哪种分词策略都必须有:深圳科技有限公司、深圳科技 这两组词对吧!

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant