文章主要的内容:

提出了基于关联规则的非结构化网路中有价值信息数据挖掘的方法

总体的思想:

(1)利用特征提取的方法进行初步的分类与识别,提取出不同文本类型的特征,

(2)利用关联规则方法计算各个类型特征之间的关联度,将不同文本类型中较明显的词作为聚类的对象(较明显的词,这个表达好牵强,什么样子的算明显的????应该有一种算法把,评价的而依据)搜搜索出在给定样本数据上具有最大后验概率的文档划分方案,将每个文档信息作为其类别形成的随机符号序列

后验概率??

后验概率_百度百科
https://baike.baidu.com/item/%E5%90%8E%E9%AA%8C%E6%A6%82%E7%8E%87/6106704?fr=aladdin

可以通过贝叶斯公式利用先验概率,求得(先验概率,就是之前就知道的经验)

(3)采用极大似然估计计算出各个符号的频率分布,利用计算的结果完成信息数据挖掘

文章题目——————非结构化网络????

为什么是非结构化网络?、网络??

(1)网络---动态性以及变化的复杂性

非结构化信息/数据     难道是静态的吗??

非结构化网络中价值信息挖掘的研究-------作者提到的一些研究(少而没有力量。这个写法可以参照另一篇论文中的写法《极限学习机类不平衡数据学习算法研究》)

(1)基于K-L变换的非结构化网络有价值信息挖掘(建议:需要写生具体年份以及具体的作者,使得看的有依据,这样的一个算法的说,感觉却的东西多了,没有一点点的根据)该方法先将信息数据空间分解为两个空间向量,利用不同的空间向量的正交特性进行信息数据特征提取和降噪-------------------缺点:稳定性差

正交特性?、:这个说的是建立坐标的意思吗??

(2)基于引入特征倾向性的非结构化网络中有价值信息数据挖掘方法。

该方法先设定词汇的倾向性度量值(也就是评测的单位,标准,参照的依据?,但是为什么引入倾向性,倾向性的意义在哪里?)融合与布尔加权对词汇进行加权处理(很多的论文都会说到加权,加权的目的就是分出个等级优劣,就是谁的话语权比较大,谁说的分量就比较大,权重就大,但是更多的不应该是根据各个的准确的程度分配权值?在结果未知的情况下,怎样确定结果时候正确?那个更倾向于是解??)并且对词汇的倾向性权重进行自适应修改

什么是自适应修改??目的??

自适应_百度百科
https://baike.baidu.com/item/%E8%87%AA%E9%80%82%E5%BA%94/4862182?fr=aladdin

说白了就是:根据不同的情况做自行调整使的结果最佳。比如根据梯度的正负自动的选择X是取大一点还是小一些

常用的自适应的算法:

常用的自适应算法有迫零算法,最陡下降算法,LMS算法,RLS算法以及各种盲均衡算法等。
缺点:无法适应信息数据的快速增长???
计算机的计算速度不是和处理器有关吗?为什么说算法赶不上数据增长啊?

(3)基于中心聚类和语义特征融合的非结构化网络中有价值信息数据挖掘方法

先将文本的特征选择定义为一个多目标优化问题,一特征位数最少作为分类正确率的最该选取,采用遗传方法搜索出最优特征自己,完成价值信息的数据挖掘

不懂

遗传算法: 模拟生物进化理论,就是将自己的优良的DNA遗传给下一代,当然在遗传的过程中也坑内个会发生基因的突变

资源:

遗传算法(python版) - CSDN博客
http://blog.csdn.net/bible_reader/article/details/72782675

2018-3-12论文(非结构化网络中有价值信息数据挖掘研究)笔记一总体思路以及三种目前进行价值信息挖掘的研究思想相关推荐

  1. 2018-3-12论文(非结构网络中有价值信息数据挖掘)笔记二-----作者:关联规则的非结构网络有价值信息数据挖掘(看不懂,看不懂)

    中国知网:<计算机仿真>----------山西农业大学信息科学与工程学院                    林媛 非结构化网络中有价值信息数据挖掘原理 确定信息数据挖掘的历史样本(? ...

  2. 我被“非结构化数据包围了”,请求支援!

    阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%.换句话来说,就是我们都被"非结构化数据"包围了.由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使 ...

  3. 分析非结构化数据和非结构化处理

    文章目录 一.非结构化数据的定义 二.非结构化处理的重要性 三.数据类型 四.非结构化处理的方法和手段 1. 采集 2. 查询 3. 存储 4. 前景 一.非结构化数据的定义 非结构化数据是数据结构不 ...

  4. 独家 | 使用机器学习对非结构化数据加速查询-第2部分(具有统计保证的近似选择查询)...

    作者:Daniel Kang, Edward Gan, Peter Bailis, Tatsunori Hashimoto, and Matei Zaharia 翻译:殷之涵 校对:方星轩 本文约28 ...

  5. 福利 |《非结构化数据分析》书评:探索非结构化数据的魅力

    文末有数据派独家福利哦 在过去的几年里,围绕大数据.物联网和人工智能等信息的宣传铺天盖地.这些新闻源源不断地向我们展示了技术和分析工作如何改变我们的生活和商业模式.将大数据和物联网转化为有实际价值的信 ...

  6. 非结构化WEB数据库与图书馆多媒体信息资源的组织利用

    1 非结构化WEB数据库简介 非结构化WEB数据库,是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的基于INTERNET.INTRANET的数据库,用它不仅可以处理结构化数 ...

  7. 非结构化数据的相关知识

    一.出现原因 信息社会化时代,各行各业在处理相关业务的过程中,都累计了海量的数据信息,随着IT应用的普及和发展,传统的纸质资料存储方式在不断缩减,更多的采用电子信息的存储方式存放在计算机中.这些信息数 ...

  8. 技术20期:结构化数据与非结构化数据:有什么区别?

    查看结构化和非结构化数据.它们的主要区别以及哪种形式最能满足您的业务需求. 并非所有数据都是平等的.有些数据是结构化的,但大部分是非结构化的.结构化和非结构化数据以不同的方式获取.收集和扩展,并且每一 ...

  9. 详解非结构化数据(文档)安全管理解决方案

    随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位.日常的业务过程中,需要处理的大量电子文档.图片.音频.视频等,都属于内容数据范畴. 例如,某银行的无人营业网点的远程业务办理中, ...

最新文章

  1. 如何初始化一个定长ListT
  2. 用户自定义的Javascript函数名字与内置函数或宿主函数名字相同时产生的问题。...
  3. mysql使用Navicat创建分区
  4. jenkins测试c语言接口,Jenkins集成接口测试实践(一)
  5. [原]一些KVM测试过程中的命令笔记(2)分配实例
  6. tfw文件如何导入cad_教你三维家3d设计软件如何导入cad文件
  7. 小白学习Java技术知识点总结,其实学习Java没那么难
  8. 【bzoj1222】[HNOI2001]产品加工 背包dp
  9. WCF学习之旅----基础篇之EnterpriseServices
  10. JavaSE IDEA 使用-面向对象
  11. 计算机国内期刊sci,国内计算机类期刊 SCI收录:
  12. 关于粮食浪费问题的调查报告
  13. java高速公路系统_基于jsp的高速公路收费系统-JavaEE实现高速公路收费系统 - java项目源码...
  14. 利用Python去除图片水印,真的一点都不难!
  15. mysql中分层查询_在mysql中连接任意数量的字符串行(分层查询)
  16. N-Tiers设计系列(二):三层式应用系统架构
  17. uniapp制作App实现下载系列功能
  18. Cocos技术派 | TS版属性面板定义高级用法
  19. JAVA 语言程序设计与数据结构 教材课本源码 和 课后习题答案
  20. 2022-2028年全球与中国洗护发用品行业市场深度调研及投资预测分析

热门文章

  1. 最早接触到的计算机编程语言——c语言
  2. eclipse中如何将java项目转为java Web项目
  3. 进驻宝岛 不闪式3D热潮来临?
  4. C++用数组和链表分别实现Queue
  5. 在DataTable中创建计算列
  6. Linux07-OpenSSH
  7. alpine 交互sh_在这个免费的交互式教程中学习Alpine JS
  8. 宅男抖音某猫协议分析及应用破解
  9. android level list,Android Drawable (levle List selector layer List)
  10. Oracle字符串转BooIean,利用Java的多线程技术实现数据库的访问.pdf