文章目录

  • 前言
  • 一、NLP是什么?
  • 二、使用步骤
    • 1.引入库
    • 2.数据分析流程
  • 总结

前言

在产品运营上线后,总是有各种各样的反馈,我们一般需要对这些反馈进行统计,因为这些数据都是非结构化的数据,类似文本消息语音消息,这时候我们可以考虑利用NLP对这些数据进行聚类或者分类,在NLP使用之前,我对NLP的各种产品以及Python自带的库也摸索了一遍,最终出于最优解决方案原则,选择了腾讯的NLP文本处理接口,主要利用了情感分析/智能分词的接口,当然有兴趣的小伙伴也可以尝试利用jieba库,snownlp去进行文本分析,但效果可能没那么好,产生我们反馈迭代的这个需求的动力是优化迭代我们的产品,所以我们需要在产品上寻找最优解决方案,此外,进行反馈的分析目标是对我们客观世界的现象进行聚类or分类,这里则用到一些NLP的技术,技术仅仅是作为实现我们需求分析的一个小环节。
这里我会简单的写几行代码去调取NLP接口进行分析,以及本地用pandas对我们的结果进行收集,关于可视化,后面有时间将会补充,


一、NLP是什么?

处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。NLP主要运用场景,智能客服,智能语音,AI纠错等等场景。

二、使用步骤

1.引入库

代码如下(示例):

import pandas as pd
import openpyxl
import os
import json
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.nlp.v20190408 import nlp_client, models

2.数据分析流程

定义接口请求的id和key,一般会放在env里
SecretId = os.environ.get('TENCENTCLOUD_SECRET_ID', SecretId)
SecretKey = os.environ.get('TENCENTCLOUD_SECRET_KEY', SecretKey)#create client profile
def get_client_profile():cred = credential.Credential(f"{SecretId}", f"{SecretKey}")httpProfile = HttpProfile()httpProfile.endpoint = "nlp.tencentcloudapi.com"clientProfile = ClientProfile()clientProfile.httpProfile = httpProfileclient = nlp_client.NlpClient(cred, "ap-guangzhou", clientProfile)return client# 情感分析
def get_sentiment(text):try:client = get_client_profile()req = models.SentimentAnalysisRequest()params = {"Text": text}req.from_json_string(json.dumps(params))resp = client.SentimentAnalysis(req)print(resp.to_json_string())j = json.loads(resp.to_json_string())return j['Positive']except TencentCloudSDKException as err:print(err)# 分词
def get_participle(text):try:client = get_client_profile()req = models.LexicalAnalysisRequest()params = {"Text": text,}req.from_json_string(json.dumps(params))resp = client.LexicalAnalysis(req)print(resp.to_json_string())j = json.loads(resp.to_json_string())return [i['Word'] for i in j['PosTokens']]except TencentCloudSDKException as err:print(err)# 读取excel文件获取数据并存储到列表中
if __name__ == '__main__':df = pd.read_excel('8-4.xlsx',engine='openpyxl')df['sentiment'] = df['content'].apply(get_sentiment)# 分词还需要进行一些数据结构上的处理,这里不再阐述df['participle'] = df['content'].apply(get_participle)# 导出结果看看df.to_csv("participle.csv",index=False)

情感分析(积极度):

分词的结果(词名 长度 词性):


总结

从产品的PDCA闭环里,技术可以推动我们去归类问题,然后定义产品分析方向的迭代,NLP很好的帮助了A的角色,当然,技术仅仅是辅助,但我们有了分析的数据能更好并能更有说服力地去迭代产品,而不是出于主观思想去定义迭代方向,这将是个很好的思路(数据驱动产品迭代)。

产品分析之用户评论分析相关推荐

  1. python文本挖掘与分析:热剧《延禧攻略》用户评论分析

    需要用到的工具:pycharm编辑器,python3 主要用到的库:re,urllib,requests,time,BeautifulSoup,selenium,numpy,matplotlib,ji ...

  2. python文本挖掘与分析:歌曲《说散就散》网易云音乐平台用户评论分析

    一.准备工作: 1.python3.x 2.编辑器pycharm 3.requests,json,os,base64,codecs,AES,pymysql(存入什么样的数据库就用什么,也可以不用数据库 ...

  3. 数据分析案例-对某宝用户评论做情感分析

    目录 原始数据 绘制词云图 情感分析 原始数据 原始数据为某宝一商品的用户评论数据 绘制词云图 # coding=utf-8import jieba import re import wordclou ...

  4. QQ卖手办,用AI分析用户评论

    作者 | 徐汉彬 指导 | 宋彦 编辑 | Jane 出品 | AI科技大本营 徐汉彬,腾讯鹅漫前台研发团队 Leader,T3-3 级工程师,负责鹅漫U品和 AMS 平台(高峰期 PV 超过 13 ...

  5. AI Challenger 2018:细粒度用户评论情感分析冠军思路总结

    2018年8月-12月,由美团点评.创新工场.搜狗.美图联合主办的"AI Challenger 2018全球AI挑战赛"历经三个多月的激烈角逐,冠军团队从来自全球81个国家.100 ...

  6. 春藤家长学院简易产品分析及用户分析、K12教育市场分析

    春藤家长学院简易产品分析及用户分析 品牌slogan:家长有规划,孩子有未来 藤家长学院是一个聚焦"家庭教育规划"的App,帮助0-18岁孩子的中国家庭,获得优质的教育资源和理念, ...

  7. 基于用户评论情感分析详细设计与技术实现

    基于用户评论情感分析详细设计与技术实现 文章目录 基于用户评论情感分析详细设计与技术实现 前言 一.技术架构 二.分析服务器构建 1.1 创建flask项目 1.2 编写数据库连接脚本,获取用户评论数 ...

  8. python 评论分析_如何利用python实现用户评论挖掘并分析

    1.利用函数nextpage获取所需的id 顾名思义,这是一个"翻下一页"的函数.可以通过读取url中的id进行自动翻页,利用该函数对股票代码进行获取. 以沪深股市为例,在当前页面 ...

  9. 实战项目-用户评论数据情绪分析

    目录 1.基于词典的方法 2.基于词袋或 Word2Vec 的方法 2.1 词袋模型 2.2 Word2Vec 3.案例:用户评论情绪分析 3.1 数据读取 3.2 语料库分词处理 3.3 Word2 ...

最新文章

  1. ROR与社区网站开发
  2. excel大学计算机试题,大学计算机基础 excel测试题 求答案~~喵~~
  3. 寄快递要在面单上写身份证号?市民担心个人信息泄露
  4. how is our custom css style inserted to html
  5. python 获取json中最大值_详细解析 Python 爬取 bilibili 的视频、弹幕以及封面
  6. hdu1466(dp)
  7. 手把手教你用ECharts画折线图
  8. centos php mcrypt_Centos 建议使用epel源
  9. Android九宫格闪烁,js实现九宫格点击按钮随机三个格子闪烁,发生错误
  10. mysql条件变量单引号_mysql语法
  11. 数据结构视频教程 -《新东方计算机考研数据结构强化班》
  12. matlab进化树的下载,mega进化树软件-mega下载 v7.0.14--pc6下载站
  13. java开发微信公众号(订阅号)
  14. 独立IP 独立访客 PV 之间的联系与区别
  15. vue 路由跳转打开新窗口(被浏览器拦截)
  16. 天耀18期 -08.面向对象-上转型【作业】
  17. 数据相关的在职研究生_南方医科大学2020年招收在职博士研究生导师名单及复试考生名单!...
  18. 简述人工神经网络的定义,简述神经网络算法
  19. SAP中采购收货控制中的配置问题分析
  20. UE5学习笔记(二)——3D材质蓝图的常用节点介绍

热门文章

  1. qt opengl 画球体
  2. 中国人为什么喜欢蹲着?
  3. VoIP系统故障排除:7个常见问题处理方法
  4. python怎么合成音乐_Python合成音乐
  5. 李想又要赴美上市了,高中辍学的他凭什么?
  6. Solidity代码规范(官方建议)
  7. 蓝海创意云丨刺杀小说家:中国第一部大规模用虚拟拍摄的真人电影
  8. 蓝海卓越计费管理系统 debug.php 远程命令执行漏洞
  9. 针对韩国开展的一系列韩文类恶意文档定向攻击行动分析 part-1
  10. cadence library builder 16.6基本教程和菜单翻译