Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略

目录

jieba简介

jieba安装

jieba使用方法

1、进行分词


jieba简介

jieba应该算得上是分词领域的佼佼者,想要使用python做文本分析,分词是必不可少的一个环节。

  • 支持三种分词模式:

    • 精确模式,试图将句子最精确地切开,适合文本分析;
    • 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
    • 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
  • 支持繁体分词
  • 支持自定义词典
  • MIT 授权协议

官网github地址:GitHub - fxsjy/jieba: 结巴中文分词

jieba安装

pip install jieba

好啦,大功告成,开始使用吧!

jieba使用方法

1、进行分词

import jieba
text='周杰伦(Jay Chou),1979年1月18日出生于台湾省新北市,祖籍福建省泉州市永春县,中国台湾流行乐男歌手、原创音乐人、演员、导演等,毕业于淡江中学。'
text_cut = jieba.cut(text, cut_all=False)
print(list(text_cut))

['周杰伦', '(', 'Jay', ' ', 'Chou', ')', ',', '1979', '年', '1', '月', '18', '日出', '生于', '台湾省', '新北市', ',', '祖籍', '福建省', '泉州市', '永春县', ',', '中国台湾', '流行乐', '男歌手', '、', '原创', '音乐', '人', '、', '演员', '、', '导演', '等', ',', '毕业', '于', '淡江', '中学', '。']

Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略相关推荐

  1. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  2. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  3. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  4. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  5. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  6. Python:numpy库中的一些函数简介、使用方法之详细攻略

    Python:numpy库中的一些函数简介.使用方法之详细攻略 目录 numpy库中的一些函数简介.使用方法 1.np.concatenate() 1.1.函数案例 1.2.函数用法 numpy库中的 ...

  7. Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介、使用方法之详细攻略

    Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介.使用方法之详细攻略 目录 glob库的简介 glob库的使用方法 1.单个字符通配符:用问号(?)匹配任何单个的字符.

  8. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  9. Py之chatterbot-corpus:python包之chatterbot-corpus包简介、安装、使用方法之详细攻略

    Py之chatterbot-corpus:python包之chatterbot-corpus包简介.安装.使用方法之详细攻略 目录 chatterbot-corpus简介 chatterbot-cor ...

最新文章

  1. sqluldr2支持mysql吗_Oracle SQLULDR2 以及 SQLLDR 进行导入导出的功能说明
  2. jtable隐藏全部_全部隐藏!
  3. 通信原理速识1:绪论
  4. 自定义_如何自定义协议
  5. KuYun企业授权管理系统源码开源版
  6. 爬虫-cookie与session的功能与用途
  7. MongoDB 进阶模式设计
  8. tornado httpserver
  9. 第一篇:了解和使用MVPArms项目
  10. excel删除行闪退_Excel出现闪退如何处理?
  11. pre-receive hook declined
  12. Entrez Direct-入门
  13. EasyExcel模板数据填充
  14. 3GPP使用方法与协议下载
  15. C++编程-牛客网-雀魂启动
  16. 缺氧游戏里能造出计算机吗,缺氧游戏氧气制造方法汇总 缺氧氧气如何制造
  17. 带节点的曲线,可以鼠标拖动节点,类似PS
  18. 黄石城市职业学院计算机专业,黄石6所中职学校 14个“3+2”专业直升大学
  19. 三国时期曹魏五大名将-五子良将
  20. 书到用时方恨少,试试运气好不好

热门文章

  1. Windows 下直接运行 Linux的Live CD版的方法
  2. CSS网页制作布局实例教程
  3. Spring 自定义注解玩法大全,从入门到…
  4. 技术总监反思录:我是怎么失去团队掌控力的?
  5. Spring Boot 密码加密的 2 种姿势!
  6. Netty实现自定义协议
  7. 和6岁孩子的函数式编程对话
  8. 阿里云专家手把手教你重塑 IT 架构!
  9. 看看阿里的考核尺度, 阿里人工资高是有原因的
  10. 曾经废寝忘食学到的技术,现在都没用了......