机器学习-LDA--景区评论分析 ipython

#导入所需基本包
import pandas as pd
import numpy as np
# 导入扩展库
import re                           # 正则表达式库
import jieba                        # 结巴分词
import jieba.posseg                 # 词性获取
import collections                  # 词频统计库
import csv                          #文件读写

import os
import pandas as pd# 打开文件
path = 'A:\jupyter_code\模式识别期末论文\评论数据'
dirs = os.listdir( path )         #os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。
# 输出所有表格文件
excels=[]
i=0
for fname in dirs:if 'xlsx' in fname:  #搜索带有xlsx的文件，即读取所有.xlsx文件print ('%-22s'%fname,'\t','标签取为：',i)df = pd.read_excel('评论数据/'+fname)df['标签']=str(i) #添加标签excels.append(df)i+=1
a = pd.concat(excels)           #纵向合并
#评论内容去重
a = a.dropna(subset=['评分'])  #删除评分为空值的行
print('去重之前：',a.shape[0])
a=a.drop_duplicates(subset=['评论内容'])
print('去重之后：',a.shape[0])a.to_excel('景区评论.xlsx',index=False)   #保存文件

丽江古城.xlsx                 标签取为： 0
九寨沟.xlsx                 标签取为： 1
伦敦眼.xlsx                 标签取为： 2
卢浮宫博物馆.xlsx              标签取为： 3
张家界.xlsx                 标签取为： 4
杭州西湖.xlsx                标签取为： 5
洱海.xlsx                  标签取为： 6
都江堰景区.xlsx               标签取为： 7
雅典卫城.xlsx                标签取为： 8
鼓浪屿.xlsx                 标签取为： 9
去重之前： 25789
去重之后： 23811

import pandas as pd
data = pd.read_excel('景区评论.xlsx')

去重之前： 23811
去重之后： 23811

词频统计

import jieba                        # 结巴分词
import jieba.posseg                 # 词性获取
import collections                  # 词频统计库
import re                           # 正则表达式
import csv                          #文件读写
import pandas as pd data = pd.read_excel('景区评论.xlsx')
stopWords = pd.read_csv('stopword.txt',encoding='utf-8', sep='lipingliping', header=None)
custom_stopWords = pd.read_csv('自定义停用词.txt',encoding='utf-8', sep='lipingliping',header=None)
adverbWords = pd.read_csv('程度副词.txt',encoding='utf-8', sep='lipingliping',header=None)
stop = list(stopWords.iloc[:, 0])+list(custom_stopWords.iloc[:, 0])+list(adverbWords.iloc[:, 0])#将停用词写入列表
#景区热词表名
name=['丽江古城热词','九寨沟热词','伦敦眼热词','卢浮宫博物馆热词','张家界热词','杭州西湖热词','洱海热词','都江堰景区热词','雅典卫城热词','鼓浪屿热词']
j=0
for labels in range(0,10):data01=(''.join(str(i) for i in data.loc[data["标签"]==labels,"评论内容"]))#预处理pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|\ |"\|~·@￥……*|“”|‘’|（）|{}|') # 定义正则表达式匹配模式(空格等)data02 = re.sub(pattern, '', data01)     # 将符合模式的字符去除data_cut = jieba.cut(data02,cut_all=False,HMM=True)data_stop = []#去除停用词(目的是去掉一些意义不大的词)for word in data_cut:         # 循环读出每个分词if word not in stop:       # 如果不在去除词库中data_stop.append(word)    # 分词追加到列表word_counts = collections.Counter(data_stop)       # 对分词做词频统计word_counts_top = word_counts.most_common(20)    # 获取前20个最高频的词print(word_counts_top)words_cloud_A = open('A:/jupyter_code/模式识别期末论文/景区热词表/'+name[j]+'.csv', 'w', newline = '')   #打开景区热词表格文件，若表格文件不存在则创建write = csv.writer(words_cloud_A)    #创建一个csv的writer对象用于写每一行内容write.writerow(['评论热词','热度'])  #写表格表头item = list(word_counts.items()) #将字典转化为列表格式item.sort(key = lambda x: x[1], reverse = True) #对列表按照第二列进行排序for k in range(20):write.writerow(item[k])#把前20词语写入表格words_cloud_A.close()j+=1

<ipython-input-5-2b1d7f058281>:10: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.stopWords = pd.read_csv('stopword.txt',encoding='utf-8', sep='lipingliping', header=None)
<ipython-input-5-2b1d7f058281>:11: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.custom_stopWords = pd.read_csv('自定义停用词.txt',encoding='utf-8', sep='lipingliping',header=None)
<ipython-input-5-2b1d7f058281>:12: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.adverbWords = pd.read_csv('程度副词.txt',encoding='utf-8', sep='lipingliping',header=None)
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\28138\AppData\Local\Temp\jieba.cache
Loading model cost 0.663 seconds.
Prefix dict has been built successfully.[('地方', 649), ('晚上', 485), ('酒吧', 469), ('不错', 459), ('客栈', 434), ('喜欢', 434), ('值得', 408), ('感觉', 353), ('里', 334), ('特色', 328), ('景色', 306), ('住', 299), ('吃', 290), ('商业化', 284), ('走', 275), ('热闹', 275), ('大研', 268), ('四方街', 265), ('美', 255), ('木府', 230)]
[('景色', 882), ('不错', 653), ('值得', 498), ('九寨', 477), ('美', 459), ('风景', 346), ('瀑布', 243), ('地方', 228), ('推荐', 223), ('看水', 213), ('水', 213), ('总体', 206), ('归来', 205), ('好玩', 193), ('有趣', 186), ('性价比', 182), ('体验', 179), ('超赞', 178), ('高', 177), ('海', 167)]
[('摩天轮', 528), ('排队', 456), ('泰晤士河', 314), ('不错', 260), ('俯瞰', 227), ('景色', 222), ('时间', 217), ('晚上', 201), ('值得', 200), ('地标', 196), ('坐', 182), ('快速通道', 179), ('世界', 167), ('建筑', 167), ('夜景', 163), ('美', 142), ('乘坐', 138), ('地方', 135), ('携程', 134), ('英国', 133)]
[('艺术', 738), ('蒙娜丽莎', 665), ('时间', 594), ('巴黎', 578), ('世界', 534), ('排队', 532), ('法国', 466), ('维纳斯', 398), ('值得', 377), ('参观', 375), ('金字塔', 335), ('建筑', 330), ('胜利', 305), ('雕塑', 304), ('女神', 297), ('著名', 295), ('地方', 284), ('三宝', 274), ('讲解', 271), ('小时', 262)]
[('景色', 1060), ('不错', 842), ('值得', 584), ('走', 510), ('索道', 490), ('天子山', 479), ('玩', 464), ('袁家界', 459), ('门票', 444), ('风景', 413), ('坐', 407), ('时间', 390), ('森林公园', 378), ('杨家', 358), ('界', 342), ('溪', 324), ('金鞭', 323), ('十里', 322), ('画廊', 320), ('国家森林公园', 313)]
[('景色', 522), ('不错', 431), ('美', 398), ('美景', 385), ('走', 298), ('风景', 291), ('地方', 287), ('断桥', 264), ('雷峰塔', 238), ('值得', 233), ('感觉', 224), ('苏堤', 192), ('喜欢', 173), ('美丽', 159), ('坐', 151), ('十景', 151), ('中', 143), ('三潭印月', 141), ('时间', 139), ('荷花', 138)]
[('地方', 587), ('美', 580), ('苍山', 558), ('景色', 477), ('双廊', 444), ('不错', 432), ('风景', 404), ('环海', 332), ('值得', 318), ('住', 312), ('感觉', 305), ('环', 260), ('骑行', 247), ('租', 247), ('云南', 242), ('时间', 213), ('拍照', 212), ('电动车', 203), ('海', 201), ('建议', 185)]
[('不错', 642), ('水利工程', 626), ('景色', 566), ('值得', 499), ('智慧', 475), ('古人', 368), ('讲解', 251), ('地方', 241), ('走', 234), ('历史', 223), ('李冰', 214), ('导游', 208), ('风景', 199), ('性价比', 176), ('推荐', 169), ('总体', 169), ('宝瓶口', 163), ('好好', 163), ('时间', 162), ('高', 162)]
[('神庙', 260), ('希腊', 243), ('建筑', 189), ('历史', 176), ('古希腊', 124), ('地方', 108), ('雅典娜', 106), ('值得', 94), ('城市', 90), ('中', 87), ('帕特农', 81), ('文明', 81), ('神殿', 67), ('壮观', 65), ('感觉', 64), ('世界', 63), ('震撼', 59), ('古老', 57), ('遗迹', 54), ('文化', 52)]
[('岛上', 839), ('厦门', 789), ('不错', 785), ('地方', 514), ('景色', 487), ('值得', 470), ('日光岩', 418), ('码头', 390), ('建筑', 347), ('吃', 294), ('时间', 258), ('风景', 251), ('住', 246), ('适合', 244), ('感觉', 233), ('岛', 231), ('走', 231), ('推荐', 213), ('钢琴', 208), ('菽庄花园', 208)]

LDA主题分析

import jieba                        # 结巴分词
import jieba.posseg                 # 词性获取
import collections                  # 词频统计库
import re                           # 正则表达式
import csv                          #文件读写
import pandas as pddata = pd.read_excel('景区评论.xlsx')
stopWords = pd.read_csv('stopword.txt',encoding='utf-8', sep='lipingliping', header=None)
custom_stopWords = pd.read_csv('自定义停用词.txt',encoding='utf-8', sep='lipingliping',header=None)
adverbWords = pd.read_csv('程度副词.txt',encoding='utf-8', sep='lipingliping',header=None)
stop = list(stopWords.iloc[:, 0])+list(custom_stopWords.iloc[:, 0])+list(adverbWords.iloc[:, 0])+[' ','\n','\t']#将停用词写入列表

<ipython-input-108-36f853b61cbb>:9: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.stopWords = pd.read_csv('stopword.txt',encoding='utf-8', sep='lipingliping', header=None)
<ipython-input-108-36f853b61cbb>:10: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.custom_stopWords = pd.read_csv('自定义停用词.txt',encoding='utf-8', sep='lipingliping',header=None)
<ipython-input-108-36f853b61cbb>:11: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.adverbWords = pd.read_csv('程度副词.txt',encoding='utf-8', sep='lipingliping',header=None)

data0 = data.loc[data['标签']==0, ['评分','评论内容']]
data1 = data.loc[data['标签']==1, ['评分','评论内容']]
data2 = data.loc[data['标签']==2, ['评分','评论内容']]
data3 = data.loc[data['标签']==3, ['评分','评论内容']]
data4 = data.loc[data['标签']==4, ['评分','评论内容']]
data5 = data.loc[data['标签']==5, ['评分','评论内容']]
data6 = data.loc[data['标签']==6, ['评分','评论内容']]
data7 = data.loc[data['标签']==7, ['评分','评论内容']]
data8 = data.loc[data['标签']==8, ['评分','评论内容']]
data9 = data.loc[data['标签']==9, ['评分','评论内容']]data_pos=data9.loc[data9["评分"]>=4,"评论内容"]
data_neg=data9.loc[data9["评分"]<=2,"评论内容"]
data_pos_cut = data_pos.astype('str').apply(lambda x: jieba.lcut(x))
data_neg_cut = data_neg.astype('str').apply(lambda x: jieba.lcut(x))
pos = data_pos_cut.apply(lambda x: [i for i in x if i not in stop])
neg = data_neg_cut.apply(lambda x: [i for i in x if i not in stop])

# 导入情感评价表
feeling = pd.read_csv('BosonNLP_sentiment_score.txt', sep=' ', header=None, encoding='utf-8')
# 改变列名
feeling.columns = ['word', 'score']
#feeling
# 将felling中的word字段转化为列表
feel = list(feeling['word'])
# 自定义查分函数
def classfi(my_list):SumScore = 0for i in my_list:if i in feel:SumScore += feeling['score'][feel.index(i)]return SumScore
# 运算时间较长
pos_score = pos.apply(lambda x: classfi(x))
neg_score = neg.apply(lambda x: classfi(x))

# 导入扩展库
import re                           # 正则表达式库
import jieba                        # 结巴分词
import gensim
from gensim import corpora, models, similarities
neg_feel = pd.concat((neg_score,neg),axis=1)
pos_feel = pd.concat((pos_score,pos), axis=1)
# 改变列名,便于查看
pos_feel.columns = ['评分', '评论']
neg_feel.columns = ['评分', '评论']
# 主题分析
# 建立词典
pos_dict = corpora.Dictionary(pos_feel['评论'])
neg_dict = corpora.Dictionary(neg_feel['评论'])
# 建立语料库
pos_corpus = [pos_dict.doc2bow(i) for i in pos_feel['评论']]
neg_corpus = [neg_dict.doc2bow(i) for i in neg_feel['评论']]
# LDA模型训练
pos_lda = models.LdaModel(pos_corpus, num_topics=3, id2word=pos_dict)
neg_lda = models.LdaModel(neg_corpus, num_topics=3, id2word=neg_dict)print("\n正面评价")
# 输出每个主题
for i in range(3):print("主题%d : " % i)print(pos_lda.print_topic(i))print("\n负面评价")
# 输出每个主题
for i in range(3):print("主题%d : " % i)print(neg_lda.print_topic(i))

正面评价
主题0 :
0.008*"地方" + 0.008*"景色" + 0.007*"值得" + 0.006*"不错" + 0.006*"美丽" + 0.005*"美" + 0.004*"走" + 0.003*"总" + 0.003*"断桥" + 0.003*"相宜"
主题1 :
0.016*"美景" + 0.010*"风景" + 0.009*"景色" + 0.007*"上有天堂" + 0.006*"下有苏杭" + 0.006*"喜欢" + 0.005*"地方" + 0.005*"喷泉" + 0.004*"美丽" + 0.004*"游船"
主题2 :
0.014*"不错" + 0.014*"美" + 0.012*"景色" + 0.009*"断桥" + 0.008*"走" + 0.008*"值得" + 0.008*"雷峰塔" + 0.006*"美景" + 0.006*"感觉" + 0.006*"地方"负面评价
主题0 :
0.020*"小时" + 0.018*"套餐" + 0.017*"导游" + 0.016*"船上" + 0.016*"雷峰塔" + 0.013*"10" + 0.013*"坐船" + 0.013*"现场" + 0.013*"坐" + 0.013*"开水"
主题1 :
0.017*"小时" + 0.016*"号" + 0.016*"请问" + 0.016*"账" + 0.016*"消息" + 0.016*"退票" + 0.016*"回复" + 0.015*"船上" + 0.014*"导游" + 0.013*"套餐"
主题2 :
0.029*"纯净水" + 0.021*"高" + 0.020*"一瓶" + 0.018*"10" + 0.017*"小时" + 0.014*"雷峰塔" + 0.012*"游客" + 0.012*"成本" + 0.012*"交通" + 0.012*"不可思议"

data01=(''.join(str(i) for i in data.loc[data["标签"]==labels,"评论内容"]))
#预处理
pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|\ |"') # 定义正则表达式匹配模式(空格等)
data02 = re.sub(pattern, '', data01)     # 将符合模式的字符去除
data_cut = jieba.cut(data02,cut_all=False,HMM=True)
stopWords = pd.read_csv('stopword.txt',encoding='utf-8', sep='lipingliping', header=None)
custom_stopWords = pd.read_csv('自定义停用词.txt',encoding='utf-8', sep='lipingliping',header=None)
adverbWords = pd.read_csv('程度副词.txt',encoding='utf-8', sep='lipingliping',header=None)
stop = list(stopWords.iloc[:, 0])+list(custom_stopWords.iloc[:, 0])+list(adverbWords.iloc[:, 0])#将停用词写入列表
data_stop = []
#去除停用词(目的是去掉一些意义不大的词)
for word in data_cut:         # 循环读出每个分词if word not in stop:       # 如果不在去除词库中data_stop.append(word)    # 分词追加到列表

import os
import jieba
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd
from keras import models,layers
from keras.utils.np_utils import to_categorical
from keras.preprocessing.text import Tokenizer
from sklearn import metrics
from sklearn.naive_bayes import MultinomialNB
from sklearn.preprocessing import LabelEncoder,OneHotEncoder
from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizer
from sklearn.feature_selection import SelectKBest,f_classif# 法2：tf-idf策略tf_idf = TfidfVectorizer()x_trian_vec = tf_idf.fit_transform(data_stop)  #将训练集文本转换为TF-IDF权重矩阵#x_test_vec = tf_idf.transform(X_test_cut)  #将测试集文本转换为TF-IDF权重矩阵x_trian_vec.shape  #查看形状

data = pd.read_excel('景区评论.xlsx')
pos_data = data.loc[data['评分']>=4,['评分','评论内容']]
neg_data = data.loc[data['评分']<=3,['评分','评论内容']]
pos_data['评分']=0
neg_data['评分']=1

data01

	评分	评论内容
0	0	这到底是怎么一回事，身边竟然好多朋友都在问我：“我在丽江，怎么只看到了束河古镇，可是旅游票...
1	0	丽江有三大古城， #大研古镇（又名丽江古城）是规模最大也最受欢迎的一个，来丽江就没有人能逃...
2	0	机器学习-LDA--景区评论分析 ipython相关推荐（5）【整合】基于机器学习的酒店评论文本倾向性分析酒店评论情感分析系统(五)-- [整合]基于机器学习的酒店评论文本倾向性分析本文主要是对之前的第三.四节所介绍的各分块进行整合. 流程: 对GUI界面输入的评论文本,先进行中文分词和去停用词,然后再 ... 网易云评论进行LDA主题模型分析网易云评论进行LDA主题模型分析前言这个项目是在学校参加竞赛下与另一个同学一起做的,我负责的是对评论进行LDA主题模型的分析.写这篇文章是想记录一下学习过程,有什么地方描述的不对还请大家多多指教, ... 北京理工大学2023年软件工程需求与uml建模——第14组旅游景区智能分析平台项目进度（V3.0最终版）目录一.甲乙方交流会议记录二.关于游客端小程序与管理端网页的功能优化(原型) 1.游客端小程序 2.管理端网页三.需求规格说明文档一.甲乙方交流会议记录参会人员项目方参与人员:刘玥王鹏宇 ... 从入门到入土：机器学习part01\|python\|代码分析\|初步学习此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ... 【Python数据分析】文本情感分析——电影评论分析（二）接上一篇<[Python数据分析]文本情感分析--电影评论分析(一)>. 目录文本向量化词袋模型 TF-IDF 建立模型构建训练集与测试集特征选择方差分析逻辑回归朴素贝叶斯 ... ML/DL之预测分析类：利用机器学习算法进行预测分析的简介、分析、代码实现之详细攻略 ML/DL之预测分析类:利用机器学习算法进行预测分析的简介.分析.代码实现之详细攻略目录机器学习算法进行预测的简介机器学习算法进行预测的分析机器学习算法进行预测的代码实现机器学习算法进行预测 ... 《R语言机器学习：实用案例分析》——1.2节R的数据结构本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.2节R的数据结构,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sark ... 《R语言机器学习：实用案例分析》——1.3节使用函数本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.3节使用函数,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar ... python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析（图）... 这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ... 《R语言机器学习：实用案例分析》——1.8节总结本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.8节总结,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar), ... 最新文章 java语言中if语句的基本语法_java中if语句有哪些形式和用法 Android更改浮动操作按钮颜色给Jquery easyui 的datagrid 每行增加操作链接(转) 全球及中国固态锂电池行业需求量预测及投资规模战略报告2021-2027年 python同步两张数据表_Python 如何实现数据库表结构同步 AI研发工程师成长指南 C++ 异常类型以及多级catch匹配《剑指Offer》合并两个排序的链表计算机网路vlan划分练习树状笔记软件for linux,WikidPad：wiki风格的开源树状笔记管理软件(新增发布内容为html)... 计算机进入睡眠和休眠,win7中睡眠和休眠的区别上海海洋大学计算机二级成绩,上海海洋大学是几本 2018分数线是多少分 windows2016小文件服务器,Windows Server 2016 搭建 SMB 共享文件第三章 Guarded Suspension模式等我准备好哦 Jlink仿真sw调试方式的4线连接方式四川省计算机应用教材,四川省电子科技大学计算机应用技术图像视频伪造检测，针对DeepFake技术检测效果不佳实战案例｜拒绝信息泄露，腾讯云助力电商对抗网络爬虫室内定位系统算法--无线时钟同步的比较 ultraedit许可证id 7位数字_优雅的数据库ID设计热门文章 sql server 使用 top WITH TIES Forward（请求转发）和Redirect（重定向）的比较同步十进制加法计数器设计 jumpserver 添加Windows主机 xxl-job整合到微服务四川山海蓝图抖音账号权重分类 @Secured注解验证无法通过的问题盗贼之海显示无法连接服务器,盗贼之海网络连接不上怎么解决中科探海的海底掩埋物三维实时成像声呐跨模态检索 \| Visual Representation Learning Home Powered By WordPress 苏ICP备17004429号

评分

评论内容

这到底是怎么一回事，身边竟然好多朋友都在问我：“我在丽江，怎么只看到了束河古镇，可是旅游票...

丽江有三大古城， #大研古镇（又名丽江古城）是规模最大也最受欢迎的一个，来丽江就没有人能逃...

机器学习-LDA--景区评论分析 ipython相关推荐

（5）【整合】基于机器学习的酒店评论文本倾向性分析
酒店评论情感分析系统(五)-- [整合]基于机器学习的酒店评论文本倾向性分析本文主要是对之前的第三.四节所介绍的各分块进行整合. 流程: 对GUI界面输入的评论文本,先进行中文分词和去停用词,然后再 ...
网易云评论进行LDA主题模型分析
网易云评论进行LDA主题模型分析前言这个项目是在学校参加竞赛下与另一个同学一起做的,我负责的是对评论进行LDA主题模型的分析.写这篇文章是想记录一下学习过程,有什么地方描述的不对还请大家多多指教, ...
北京理工大学2023年软件工程需求与uml建模——第14组旅游景区智能分析平台项目进度（V3.0最终版）
目录一.甲乙方交流会议记录二.关于游客端小程序与管理端网页的功能优化(原型) 1.游客端小程序 2.管理端网页三.需求规格说明文档一.甲乙方交流会议记录参会人员项目方参与人员:刘玥王鹏宇 ...
从入门到入土：机器学习part01|python|代码分析|初步学习
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
【Python数据分析】文本情感分析——电影评论分析（二）
接上一篇<[Python数据分析]文本情感分析--电影评论分析(一)>. 目录文本向量化词袋模型 TF-IDF 建立模型构建训练集与测试集特征选择方差分析逻辑回归朴素贝叶斯 ...
ML/DL之预测分析类：利用机器学习算法进行预测分析的简介、分析、代码实现之详细攻略
ML/DL之预测分析类:利用机器学习算法进行预测分析的简介.分析.代码实现之详细攻略目录机器学习算法进行预测的简介机器学习算法进行预测的分析机器学习算法进行预测的代码实现机器学习算法进行预测 ...
《R语言机器学习：实用案例分析》——1.2节R的数据结构
本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.2节R的数据结构,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sark ...
《R语言机器学习：实用案例分析》——1.3节使用函数
本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.3节使用函数,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar ...
python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析（图）...
这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...
《R语言机器学习：实用案例分析》——1.8节总结
本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.8节总结,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar), ...

机器学习-LDA--景区评论分析 ipython

词频统计

LDA主题分析

机器学习-LDA--景区评论分析 ipython相关推荐

最新文章

热门文章