数据来源:

(1)电子商务网站提供的网路评论

(2)专门提供网络评论交流平台的网络

(3)文章中使用的数据为网上某商城关于“某品牌中的一种型号纸尿裤(价格75RMB)”的2526条评论


操作------网路评论预处理

使用的是中科院的ICTCLAS分词系统

来源:

ICTCLAS_百度百科
https://baike.baidu.com/item/ICTCLAS/8609504?fr=aladdin


选择十个平论进行词性标志:

名词:  评价的事物,可以统称为特征

形容词: 往往是表示观点的极性词语

副词:  修饰词,具有加强或减轻观点倾向的作用


网络评论中的特征词的提取--------------------通过相关性的数值来确定


在类别相关中,我们需要设置阈值,当每个数据都超过阈值的时候则进行保存-----------------保存之后的特征进行特征与特征之间的相关性计算

F-相关性计算


通过去除冗余的特征就完成了特征集合N的确定


2018-3-7论文网络评论中非结构化信息的表示与研究--------实验分析相关推荐

  1. 2018-3-6论文-网络评论中非结构化信息的应用于研究------(语义矩离)

    语义矩离 用来描述特征词之间的语义相似度. 常用的计算方法主要有:                根据同义词词典求2个词语编码的矩离 在文章中使用了哈工大的<同义词词林>扩展版 (1)每个 ...

  2. 2018-3-3 论文(网络评论中非结构化信息的表示与应用研究)笔记一

    文章立脚点: 大量网络评论的出现,使得产品制造商或消费者很难跟踪己购产品用户的意见和建议,这就给他们的决策造成了额外的困难. 文章思路; 将网络评论中的非结构化信息处理成结构化信息 文章的总体的脉络 ...

  3. 2018-3-10论文(网络评论中非结构化信息表示与应用研究)-----综合评价的实例

    模型步骤: (1)确定针具评价等级.也就是H的值 (2)将结构化表示的网络评论进行分类 (3)确定识别框架 (4)计算得到该类别所有评论初始隶属度.使用Sij表示第i个类别第j个等级的初始隶属度 (5 ...

  4. 2018-3-10论文(网络评论中非结构化信息表示与研究)笔记-----网评评定等级,网评分类,网评信度函数,Dempster法则

    建立证据理论模型的基础理论: (1)证据理论是用来处理不确定性问题的 (2)证据理论允许把整个问题和证据分解为若干个子问题,子证据,然后逐个击破,在利用Dempster合成法则进行解的合成,得到你整个 ...

  5. 2018-3-9 论文(网络评论中非结构化信息表示与研究)笔记---模糊认知图的形式化表示

    定义: 模糊认知图_百度百科 https://baike.baidu.com/item/%E6%A8%A1%E7%B3%8A%E8%AE%A4%E7%9F%A5%E5%9B%BE/20881975?f ...

  6. 2018-3-5 (论文—网络评论中结构化信息处理的应用于研究)笔记三(互信息,信息增益,期望交叉熵,基于词频的方法,CHI统计)

    传统的特征提取的方法: 1.互信息量(Mutual Information MI):评估零个随机变量相关程度(数组额上离散使用了累加,而连续是积分) 百度:互信息_百度百科 https://baike ...

  7. 2018-3-6 (论文—网络评论中非结构信息应用于研究)笔记-----论文中的特征抽取的模型算法

    整体的流程 网络评论预处理------------------->>>>>>利用相关性特征得到网络评论特征抽取的模型算法 特征提取算法模型: 论文46 马尔科夫链( ...

  8. 2018-3-10论文(网络评论非结构化信息表示与应用研究)笔记-----基于证据理论的综合评价模型建立

    证据理论证据合成问题 运用证据理论对商品进行综合评价,在对每一条评论给出就决策矩阵的类别值进行分析合成,让后将其看成不同的证据,然后兼顾不同的一家内进行合成 模型表述----评语等级 (2)评论分类 ...

  9. 2018-3-8(论文--网络评论中的非结构化信息表示与研究)笔记-----基于证据理论的网络评论综合方法

    Why  综合评价?? (1)实际的生活中,我们队网络评论进行结构化处理的目的不仅在存储而是试图利用这些信息对产品进行综合的评定 (2)通过综合评定企业可以知道产品在客户心中的地位以及受欢迎的程度,从 ...

最新文章

  1. android studio下载插件时出现的read time out问题
  2. 设计模式 -- (14)中介者模式
  3. gcc:编译 expected declaration specifiers or ‘...’ before
  4. Linux系统函数read()/write()/pread()/pwrite()的区别
  5. I春秋第四季CTF-Web-Writeup(部分)
  6. 如何完全屏蔽Chrome的提示:请停用以开发者模式运行的扩展程序
  7. java中怎么用代码打出ASCII码字符_JAVA实现打印ascii码表代码
  8. 工作流实战_02_flowable 流程模板导入
  9. Vrep线程之间的切换
  10. 牛客寒假算法基础集训营4
  11. 多x多y的origin图_孖记士多 X 阿婆牛杂!广州的两大本土老字号,搞在一起了!...
  12. (已更新)萤火商城V2.0开源版[uni-app端],轻量级前后端分离的电商系统,支持微信小程序 + H5+ 公众号 + APP
  13. 服务器如何备份系统和配置,windows server 2008和2012如何设置完整备份+增量备份
  14. JAVA小鑫の日常系列故事(七)——小纸条
  15. java hotspot server_Java HotSpot(TM)64位服务器VM警告
  16. Codeforces Round #643 (Div. 2) E. Restorer Distance 题解(三分)
  17. SAGAN——Self-Attention Generative Adversarial Networks
  18. ubuntu-16.04.6安装教程
  19. clip-path的学习和简单使用
  20. 项目awesome-semantic-segmentation-pytorch以及FCN、Unet、deeplabv1、deeplabv2、deeplabv3、deeplabv3+的网络

热门文章

  1. 递归神经网络(Recurrent Neural Networks,RNN)
  2. Java Reflection(十):数组
  3. jquery实现点击页面其他地方隐藏指定元素
  4. 安卓 画板 学习笔记
  5. iSCSI软件套件 介绍
  6. 将类别加入到别人的名称空间内
  7. numpy和torch数据操作对比
  8. Python基础18-常用模块之os、sys、json、pickle、shelve、xml、re、logging、configparse、hashlib等
  9. javascript选择器_如何通过选择正确JavaScript选择器来避免沮丧
  10. 测试django_如何像专业人士一样测试Django Signals