当前位置
首页/ 官方博客/ 使用教程/ 熊猫中文分词助手如何使用自定义词典

熊猫中文分词助手如何使用自定义词典

自定义词典说明

熊猫中文分词助手如何使用自定义词典?

熊猫中文分词助手支持自定义词典功能,具体使用帮助如下:

  • 用户可以指定自定义的词典,以便包含在词库里没有的词。虽然软件有新词识别能力,

    但是自行添加新词可以保证更高的正确率

  • 词典格式与主词典格式相同,即一行包含:词、词频(可省略)、词性(可省略),用空格隔开

  • 词频省略时,分词器将使用自动计算出的词频保证该词被分出


自定义词典内容举例:

创新办 3 i
云计算 5
凱特琳 nz
台中
机器学习 3

请注意一行一个

当然,如果您不需要词性标注功能,可以仅添加新词列表即可:如

抖音

微信

QQ

(一行一个)

举例(1)

最后在分词前,选择该txt文件路径即可:

如图

举例(2)


文章标签

相关推荐

熊猫中文分词助手1.1.0.0发布

熊猫中文分词助手1.1.0.0发布,本次更新内容:新增源文档编码设置功能,优化文本多行分词逻辑

熊猫中文分词助手1.1.0.0发布
熊猫中文分词助手各个分词模式的区别

熊猫中文分词助手各个分词模式(精确模式,全模式,搜索引擎模式)的区别

熊猫中文分词助手各个分词模式的区别
熊猫中文分词助手词性标记对照表

熊猫中文分词助手词性标记对照表

熊猫中文分词助手词性标记对照表
主流中文分词技术方案(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)对比

本文将系统介绍主流的中文分词技术(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)以及具体功能,api对比

主流中文分词技术方案(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)对比
批量中文分词工具获取方式

本文提供我们官方开发的批量中文分词工具获取方式

批量中文分词工具获取方式
干货:利用分词算法来分析关键词

百度关键词算法之分词算法,利用分词算法来分析关键词,这样做可以让我们的关键词确定的更 为准确,让我们的seo优化工作更快见效

干货:利用分词算法来分析关键词