Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略

目录

SnowNLP的简介

SnowNLP的安装

SnowNLP的使用方法

关于训练


SnowNLP的简介

snowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的。

snownlp主要可以进行中文分词(算法是Character-Based Generative Model)、词性标注、情感分析、文本分类(原理是朴素贝叶斯)、转换拼音、繁体转简体、提取文本关键词(原理TextRank)、提取摘要(原理TextRank)、分割句子、文本相似(原理BM25)。官网还有更多关于该库的介绍。

  • 中文分词(Character-Based Generative Model)
  • 词性标注(TnT 3-gram 隐马)
  • 情感分析(现在训练数据主要是买卖东西时的评价,所以对其他的一些可能效果不是很好,待解决)
  • 文本分类(Naive Bayes)
  • 转换成拼音(Trie树实现的最大匹配)
  • 繁体转简体(Trie树实现的最大匹配)
  • 提取文本关键词(TextRank算法)
  • 提取文本摘要(TextRank算法)
  • tf,idf
  • Tokenization(分割成句子)
  • 文本相似(BM25)
  • 支持python3(感谢erning)

github:SnowNLP: Simplified Chinese Text Processing
snownlp pypi

SnowNLP的安装

pip install snownlp

SnowNLP的使用方法

文章推荐

NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→情感分析→测试)

关于训练

现在提供训练的包括分词,词性标注,情感分析,而且都提供了我用来训练的原始文件 以分词为例 分词在snownlp/seg目录下

from snownlp import seg
seg.train('data.txt')
seg.save('seg.marshal')
# from snownlp import tag
# tag.train('199801.txt')
# tag.save('tag.marshal')
# from snownlp import sentiment
# sentiment.train('neg.txt', 'pos.txt')
# sentiment.save('sentiment.marshal')

Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略相关推荐

  1. Python编程语言学习:在根目录的py文件内调用某叶目录文件内的包/库或者函数(常用在GUI编程)之详细攻略

    Python编程语言学习:在根目录的py文件内调用某叶目录文件内的包/库或者函数(常用在GUI编程)之详细攻略 目录

  2. Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略

    Py之nltk:nltk包的简介.安装.使用方法.代码实现之详细攻略 目录 nltk包的简介 nltk包的安装 nltk包的使用方法 nltk包的代码实现 nltk包的简介 NLTK is a lea ...

  3. Py之matplotlib:python包之matplotlib库图表绘制包的简介、安装、使用方法(matplotlib颜色大全)详细攻略

    Py之matplotlib:python包之matplotlib库图表绘制包的简介.安装.使用方法(matplotlib颜色大全)详细攻略 目录 matplotlib简介 matplotlib安装 m ...

  4. Py之skflow:skflow的简介、安装、使用方法、代码实现之详细攻略

    Py之skflow:skflow的简介.安装.使用方法.代码实现之详细攻略 目录 skflow的简介 skflow的安装 skflow的使用方法 skflow的代码实现 skflow的简介 skflo ...

  5. Py之scikit-learn:机器学习Sklearn库的简介、安装、使用方法(ML算法如何选择)、代码实现之详细攻略

    Py之scikit-learn:机器学习Sklearn库的简介.安装.使用方法.代码实现之详细攻略 目录 scikit-learn的简介 scikit-learn的安装 scikit-learn的使用 ...

  6. Py之wordcloud:python中非常有趣的词云图wordcloud简介、安装、使用方法、案例应用详细攻略

    Py之wordcloud:python中非常有趣的词云图wordcloud简介.安装.使用方法.案例应用详细攻略 目录 wordcloud简介 wordcloud安装 wordcloud使用方法 案例 ...

  7. Py之cv2:cv2库(OpenCV,opencv-python)的简介、安装、使用方法(常见函数、方法等)最强详细攻略

    Py之cv2:cv2库(OpenCV,opencv-python)的简介.安装.使用方法(常见函数.方法等)最强详细攻略 目录 关于OpenCV简介 OpenCV应用领域 1.计算机视觉领域方向 2. ...

  8. Py之matplotlib-seaborn :核密度估计(KDE)分析/奇异点分析/相关性分析简、绘图的高级进阶之高级图可视化(直方图-箱线图-密度图-小提琴图等)简介、代码实现之详细攻略

    Py之matplotlib-seaborn :核密度估计(KDE)分析/奇异点分析/相关性分析简.绘图的高级进阶之高级图可视化(直方图-箱线图-密度图-小提琴图等)简介.代码实现之详细攻略 目录 根据 ...

  9. c语言opencv所用库函数,Py之cv2:cv2库(OpenCV,opencv-python)的简介、安装、使用方法(常见函数、方法等)最强详细攻略...

    ## 关于OpenCV简介 ## OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由 ...

最新文章

  1. AndroidStudio项目打包成jar
  2. 1.0jpa 2.0_JPA 2.1:不同步的持久性上下文
  3. [HDU] 2553 N皇后问题-简单深搜
  4. 电脑开机显示服务器启动失败是什么原因,请问我的电脑在启动时显示NTDETECT失败是什么意思? 爱问知识人...
  5. TensorFlow HOWTO 2.1 支持向量分类(软间隔)
  6. 计算机视觉FPN: 特征金字塔网络
  7. Java中的ObjectOutputStream –将对象写入文件
  8. unity 字体width_Unity制作自定义字体的两种方法
  9. 基于python的贪吃蛇游戏设计论文_《贪吃蛇游戏课程设计》报告毕业设计(论文)...
  10. 布谷鸟算法的程序(个人注释)
  11. 2022年网络工程师考试知识点:网络攻击
  12. 吗 极域软件可以装win10_关于win10企业版在极域电子教室软件 v4.0 2015 豪华版的全屏控制下如何取得自由...
  13. 怎么远程传输大文件?
  14. 微信红包封面免费送!!!
  15. MySQL常用的文本文件导出导入方式总结
  16. Infor SCE 小计
  17. 一个typedef的用法
  18. xml文件加密和解密
  19. 第15讲:Python列表对象的反转与排序
  20. matlab 向量的复制,MATLAB:复制向量’n’次

热门文章

  1. linux系统调用理解之摘录(2)
  2. Andriod监听支付宝收款实现个人支付宝支付接口!附安卓App
  3. 基于OpencvTensorflow实现实时查找停车位置
  4. 第12章 样式(三)
  5. 构造方法和方法的重载。
  6. 跨平台视频通信项目-OpenTok
  7. shell脚本安装mysql并安装一个小服务
  8. 端口映射的几种实现方法
  9. Linux下mysql备份
  10. 上传图片和导出文件测试用例