酒店评价数据分析

描述‪‬

根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。‬(comment.csv)‬

import jieba‬

test_str = '武汉理工大学是一所世人仰慕的大学' result = jieba.lcut(test_str) # 参数是字符串,结果是将字符串切分为词的列表 print(result) # ['武汉理工大学', '是', '一所', '世人', '仰慕', '的', '大学'‬

文件数据每行包括评论属性和评论内容两个数据,其中评论属性中’1‘代表好评,’0‘代表差评。‬‮‬

要求实现以下功能:‬

文件编码格式为GBK,读取函数示例如下:‬

with open('comment.csv', 'r', encoding='GBK') as f: ls=[i.strip().split(',',maxsplit=1) for i in f.readlines()[1:]‬‮‬

输入n‬‮‬

  1. 如果n为’总评‘,分别输出该文件评论总数,好评条数,差评条数,输出格式参照示例一。
  2. 如果n为’平均‘,输出该文件中所有评论内容的平均长度(不需要排除字母,标点符号和数字),输出四舍五入后的整数,输出格式参照示例二。‬‮‬
  3. 如果n为’好评‘,对文件中所有好评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例三‬‮‬
  4. 如果n为’差评‘,对文件中所有差评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例四‬‮‬

注:3,4两项功能中统计的词语,要求长度不小于2,不是数字组成,并且不是排除词‬‮‬

#排除词 ex=['不错','比较','可以','感觉','没有', '我们','就是','还是','非常','但是', '不过','有点','一个','一般','下次', '携程','不是','晚上','而且','他们', '什么','不好','时候','知道','这样', '这个','还有','总体','位置','客人', '因为','如果','这里','很多','选择', '居然','不能','实在','不会','这家', '结果','发现','竟然','已经','自己', '问题','不要','地方','只有','第二天', '酒店','房间','虽然']‬‮‬

  1. 如果n非以上输入,输出’无数据‘,格式参照示例五

输入输出示例‬‮‬

示例只是输出格式示例,其中数据均与题目无关!

文件获取方式:

链接:https://pan.baidu.com/s/1cv60Ed9v35vpai1ZbbWOng?pwd=ic0z 
提取码:ic0z

import jiebadef readfile():with open('E:\Code FILE\PythonFILE\程序设计作业\comment.csv', 'r') as f:ls = [i.strip().split(',', maxsplit=1) for i in f.readlines()][1:]return lsdef pj(lsn,n):a=0if n=='好评':a=1ls_good=[]for x in ls:if x[0][0]==str(a):ls_good.append(x)# print(ls_good)dict={}for x in ls_good:ls_word=jieba.lcut(x[0])for key in ls_word:if key not in ex:dict[key] = dict.get(key, 0) + 1# print(dict)ls1 = sorted(dict.items(), key=lambda x: x[1] ,reverse=1)ls2=[]for x in ls1:if 2<=len(x[0])<=3:ls2.append(x)print('输出:')for x in ls2[:15]:print(x[0],x[1])ex=['不错','比较','可以','感觉','没有', '我们','就是','还是','非常','但是', '不过','有点','一个','一般','下次', '携程','不是','晚上','而且','他们', '什么','不好','时候','知道','这样', '这个','还有','总体','位置','客人', '因为','如果','这里','很多','选择', '居然','不能','实在','不会','这家', '结果','发现','竟然','已经','自己', '问题','不要','地方','只有','第二天', '酒店','房间','虽然']
ls=readfile()
# print(ls)
n=input('输入:')
if n in['好评','差评']:pj(ls,n)

酒店评价数据分析题目及3、4问答案相关推荐

  1. Python解决文本分析问题,以酒店评价数据分析为例

    如何运用Python解决实际问题上,读文件然后能进行相应分析是很重要. 在这次事例中,用使用jieba库中的lcut函数对数据进行分词, import jieba def total():     p ...

  2. 文本数据分析之中文酒店评论数据分析

    文本数据分析 前言 题目 判别方面 导入数据 可视化原始数据分布 对评论内容的好坏进行统计 结果评论 对评论内容的长度进行统计 结果评论 对评论内容长度的散点分布 结果评论 获取评论内容中形容词的词云 ...

  3. python---酒店评价数据分析

    描述‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬ 根 ...

  4. python爬虫进阶-同城旅游酒店评价(JS逆向)

    目的 获取同城旅游酒店评价信息 详细需求 https://www.ly.com/HotelInfo-52003119.html?spm0=10002.2001.1.0.1.4.31 思路解析 一 .F ...

  5. Hotel booking酒店预订——数据分析与建模

    Hotel booking酒店预订--数据分析与建模:https://zhuanlan.zhihu.com/p/196757364?utm_source=wechat_session 写文章 Hote ...

  6. Python爬虫爬取酒店评价(携程)

    Python爬虫爬取携程酒店评价 审查携程酒店评价页面 最经有个需求是爬携程上某酒店的用户评价,在审查评论界面后发现了以下请求,贴一下: https://hotels.ctrip.com/Domest ...

  7. Smartbi酒店经营管理数据分析漫谈

    市场需求 随着中国酒店业的蓬勃发展,越来越多的酒店使用信息技术来提高自身的管理水平.传统酒店管理与现代信息技术相结合,对酒店做大.做强.管理规范化起到至关重要的作用.同时在信息化的帮助下,酒店行业洗牌 ...

  8. 谭松波酒店评价情感分析代码以及数据集获取

    一:谭松波酒店评价是本地就有的,读者也可以自己爬取微博数据或其他的数据集也可以 链接:https://pan.baidu.com/s/1TrumHVMk-Kc4PJz8INMYbg  提取码:xsa7 ...

  9. 毕业设计之 ---- 基于深度学习的酒店评价的情感倾向分析

    文章目录 概述 项目所需模块 数据 数据说明 字段说明 数据处理 分词处理 停用词处理 样本均衡 建立多层感知机分类模型 训练模型 网络检测率以及检测结果 最后 - 技术解答 - 毕设帮助 概述 本文 ...

最新文章

  1. c语言:输出一个菱形图
  2. java格式错误什么意思_java.io.IOException可能的原因是什么:“文件名,目录名或卷标语法不正确”...
  3. python decorator_python 中的decorator
  4. 调用图片文件夹中的任意图片随机显示_【分享】文字、表格、公式图片识别神器V0.8...
  5. C4D立体风格海报素材|电商万能套用BANNER是美工必收藏
  6. mysql root_mysql root 没有任何权限
  7. 综合应用WPF/WCF/WF/LINQ之一:DEV-WOW 作品源代码公布
  8. Python 序列化模块(json,pickle,shelve)
  9. python_numpy_求L1损失的两种方法
  10. linux 主流 集群 软件,Linux 高可用(HA)集群之Pacemaker详解
  11. flutter 手机定位
  12. 1v1微信聊天测试点
  13. tensorflow中的shape问题
  14. Windows 批处理 一键安装MySQL教程 MySQL绿色安装包下载
  15. [android] app运行在夜神模拟器上
  16. 基于Ocean Connect云平台的照明控制系统设计
  17. bat: %~d0 %cd% %~dp0
  18. android wifi连接流程,(九十三) Android O 连接WiFi AP流程梳理续——保存网络-Go语言中文社区...
  19. JDK9-17开发常用的新特性
  20. 【自嗨笔记#2】微博疫情舆情分析---舆情分析部分

热门文章

  1. 离开武汉的500万人去哪里了?别让他们流浪街头!
  2. Verilog——伪随机码发生器
  3. idea 配置ssm项目后配置文件的简要解析及功能类之间的联系
  4. Python 什么是面向对象 ?
  5. 数据中心供电方式详解
  6. JavaScript中DOM键盘事件,使用键盘方向键控制图形的移动
  7. Unity3D学习资料推荐
  8. 机器学习领域中的一些概念
  9. jupyter拆分类在多个单元格
  10. 2020最新JDK安装及配置教程