• wordcloud

  • 出现的问题:
    Q1:ImportError: cannot import name ‘WordCloud’ from ‘wordcloud’
    解决:不能将文件名命名为‘wordcloud’

  • 如何改变词云的形状
    参考链接:https://www.jianshu.com/p/656c978764cb

  • 分词

  • 分词的主要目的:让计算机更好的把握每个词的含义。

  • 英文分词
    手动分词
    参考链接:https://blog.csdn.net/wawj9393/article/details/78365446
    利用nltk来分词
    参考链接:https://blog.csdn.net/zzulp/article/details/77150129
    还可以标记出词的词性、还原缩写、时态等
    https://www.jianshu.com/p/9d232e4a3c28 (这篇更好)

  • 过滤停用词
    参考之前的“舆情分析”的论文

  • 词频统计

  • CountVectorizer
    统计文本词频,转化为数学向量的形式。(词频矩阵)

  • 文本特征提取 eg.TF-IDF/One-hot
    优缺点对比参考链接:https://www.cnblogs.com/lianyingteng/p/7755545.html

  • TF-IDF
    TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)
    该技术采用一种统计方法, 根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一 个字词在整个语料中的重要程度。
    用于统计矩阵中每个词语的TF-IDF值(一种加权技术)
    参考链接:https://www.cnblogs.com/lianyingteng/p/7755545.html (使用)

  • 舆情分析

  • 判断positive还是negative是一个二分类问题

  • method 1. 朴素贝叶斯
    参考链接:https://www.jianshu.com/p/845b16559431

  • 出现问题“ValueError: dimension mismatch”是指测试集和训练集的维度不同
    解决方法:1.将X = vectorizer.fit_transform(review) tfidf = transformer.fit_transform(X)中的fit删除
    之间的不同参考链接:https://blog.csdn.net/qq_28334183/article/details/88896111
    2.将测试集和训练集利用append()链接在一起,再一起计算TF-IDF值
    all_append = train_review.append(test_review)

  • 判断好坏

  • 建立模型之后需要评价模型的好坏
    大概介绍
    参考链接:https://www.jianshu.com/p/41f434818ffc
    AUC和ROC
    参考链接:https://blog.csdn.net/u013385925/article/details/80385873
    详细AUC参考链接:https://tracholar.github.io/machine-learning/2018/01/26/auc.html

python做情感分析相关推荐

  1. 如何用Python做情感分析?

    商品评论挖掘.电影推荐.股市预测--情感分析大有用武之地.本文帮助你一步步用Python做出自己的情感分析结果,难道你不想试试看? 需求 如果你关注数据科学研究或是商业实践,"情感分析&qu ...

  2. 自然语言处理NLP-100例 | 第一篇:如何用Python做情感分析?

    大家好,我是K同学啊~ 今天给大家分享一个情感分析的小案例 在维基百科上,情感分析的定义是: 文本情感分析(也称为意见挖掘)是指用自然语言处理.文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观 ...

  3. 用python做舆情分析系统_如何用Python做舆情时间序列可视化?

    如何批量处理评论信息情感分析,并且在时间轴上可视化呈现?舆情分析并不难,让我们用Python来实现它吧. 痛点 你是一家连锁火锅店的区域经理,很注重顾客对餐厅的评价.从前,你苦恼的是顾客不爱写评价.最 ...

  4. Python爬取《你好李焕英》豆瓣短评并基于SnowNLP做情感分析

    爬取过程在这里: Python爬取你好李焕英豆瓣短评并利用stylecloud制作更酷炫的词云图 本文基于前文爬取生成的douban.txt,基于SnowNLP做情感分析. 依赖库: 豆瓣镜像比较快: ...

  5. python评论情感分析步骤_python中snownlp情感分析简易的demo分享

    下面小编就为大家带来一篇python snownlp情感分析简易demo(分享).小编觉得挺不错的,现在就分享给大家,也给大家做个参考.一起跟随小编过来看看吧 SnowNLP是国人开发的python类 ...

  6. python实现情感分析_使用python+机器学习方法进行情感分析(详细步骤)

    使用python+机器学习方法进行情感分析(详细步骤) 2021-02-07 不是有词典匹配的方法了吗?怎么还搞多个机器学习方法.因为词典方法和机器学习方法各有千秋.机器学习的方法精确度更高,因为词典 ...

  7. 对财经新闻情感分析python_我用Python进行情感分析,让程序员和女神牵手成功

    先用电影评论来做情感分析,主要包括下面几个主要内容(看到最后哦): 1.准备文本数据 2.基于文本文档来构建特征向量 3.训练机器学习模型来区分电影评论的正面评论和负面评论(对你的女神同样适用哦~~) ...

  8. python实现情感分析_利用python实现简单情感分析

    最近选修的大数据挖掘课上需要做关于情感分析的pre,自己也做了一些准备工作,就像把准备的内容稍微整理一下写出来,下次再做类似项目的时候也有个参考. 情感分析是什么? 文本情感分析是指用自然语言处理(N ...

  9. python景点情感分析代码_python snownlp情感分析简易demo(分享)

    SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和T ...

最新文章

  1. 8.QML Qt Quick Controls 2中常用的界面形式——堆叠式界面(StackView)
  2. java 读取css文件_java文件读取的两种方式
  3. Qt数据库操作(三) -- 使用SQL模型类
  4. ib网卡命令_infiniband网卡安装、使用总结
  5. MacOS/MacBook设置短语快捷键
  6. 保护你的DLL和Code不被别人使用。
  7. Linux启动脚本rc.local 不执行的解决方法
  8. Access 中数据库操作时提示from子句语法错误
  9. python的selenium模块_python-爬虫-selenium模块
  10. vue分割开的tab组件效果
  11. 偏微分方程数值解法pdf_单摆-微分方程浅谈
  12. 前程无忧招聘信息数据清洗+聚类分析
  13. 混沌算法 matlab,混沌算法优化BAS算法
  14. STM32理论 —— 综述、GPIO
  15. 清橙A1210. 光棱坦克
  16. JINI学习笔记2-HelloWorld
  17. OpenCV - 分水岭算法图像分割(Python实现)
  18. Java 空格“ ”、空字符串“”和null区别
  19. 《系统》是南方周末2007年度最好的特稿
  20. FPGA控制DDS_AD9850输出正弦波(“并行spi”)

热门文章

  1. java课设小迷宫含代码_Java小项目之迷宫游戏的实现方法
  2. Java最大值最小值问题(用户输入)
  3. python装饰器带参数函数二阶导数公式_SICP Python 描述 1.6 高阶函数
  4. template模板
  5. 微软发布Win11 2022最大更新22H2 版本号为 22621.521
  6. 基于javaweb的高校运动会管理系统(java+ssm+jsp+js+jquery+mysql)
  7. 计算机中专综合知识,湖南省汨罗市职业中专高考(八)计算机应用专业综合知识试题讲解.doc...
  8. 贵州2021高考成绩排名查询,贵州高考排名查询方法,2021年贵州高考成绩位次全省排名查询...
  9. Linux下安装java11(亲测)
  10. el-backtop关于 target is not existed: .page-component__scroll .el-scrollbar__wrap的问题