互联网上的所有的数据只有两种,离散型和连续性的。连续性的可以计数的,例如外链数量、关键词出现次数等,这些因素的处理直接采用的是计数,但是由于有些数量或许是非常大的,必须取对数来降低影响,这里就有一个问题http://blog.sina.com.cn/s/blog_5dac285301010jpj.html就是数值较大时候,一旦取了对数会不会降低了影响,zero在这里说了大众点评网的关键词密度过高问题,这里其实是有很多问题,在一定度量上,无论是否取对,数量都是呈现正面效应的,只是起到的作用降低了,这就比如一个加速度问题,力变小了,加速度变小了,但是速度还在增加ing的。 对于离散型数据,一般采用布尔模型或者向量空间模型处理机制,更多的是一个指标的多个纬度,这里最重要的是如何把度大小加入到离散型数据中,是采用带权传递或者给与不同权重分配不一样的比例。不管怎么计算,最终的结果都会呈现出不可控制性,但指标变多时候,不可控制的因素将会大大增加,但是同时也更多范围内满足人们的匹配。 百度和谷歌最大的区别就在于指标的量上是不一样多的,谷歌多,因此所需要的处理能力强,但最终排名会更加的客观,匹配度更加宽广,百度的指标量少,就呈现出中间突出的的状态,这也是两者结果排序最大的差别。 讲了这么多一定有人不耐烦了,这有什么用处呢?我说这个作用太大了,举个最小的例子,很多人看不懂为何某个页面排名异常的好,怎么都思考不出来为何,其实这就是离散型变量的影响,离散型变量呈现的一个最大的特点增加了结果的随机性。 至于如何采用特征权重的处理问题,还有一个最重要的就是结合我们做seo的时候,很多时候她都可以指导我们,比如某个因素做得太好时候,由于会去对数,影响将会降低,我们把握好这个点就可以把工作效率在理论上提高10倍;她也可以帮我们解释很多问题,如根据se的精神,当一个网站原创的文章的不再收录时候,很多人不知道为何会出现这样的机制,亲你知道为何吗?

转载于:https://my.oschina.net/tyseo/blog/529482

特征权重的处理与最终排名相关推荐

  1. 影像组学视频学习笔记(14)-特征权重做图及美化、Li‘s have a solution and plan.

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(14)主要介绍: 特征权重做图及美化 import matplotlib.pyplot as plt %matplotlib inlin ...

  2. WKmeans一种基于特征权重的聚类算法

    1 引例 在前面两篇文章中,我们首先介绍了KmeansKmeansKmeans聚类算法的原理:然后又介绍了一种基于KmeansKmeansKmeans进行改进的Kmeans++Kmeans++Kmea ...

  3. 基于功能连接的认知机器学习预测模型:特征权重可靠吗?

    文章来源于微信公众号(茗创科技),欢迎有兴趣的朋友搜索关注. 利用机器学习方法,可以从个人的功能性大脑连接中预测认知表现.但是预测模型在支持认知的神经生物学加工方面仍存在争议,目前的见解也比较有限.特 ...

  4. fcm算法c语言实现,基于特征权重的FCM算法研究及应用

    摘要: 模糊C-均值(FCM)聚类算法是非监督模式识别中应用范围最广泛的算法之一.但是传统的FCM算法中,设定样本的各维特征对分类效果的贡献水平是相同的.在实际中,由于特征提取不够完善,使得特征矢量中 ...

  5. 特征选择与特征权重区别

    在文本分类的过程中,特征(也可以简单的理解为"词")从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化--特征选择阶段的重要程度量化和将具体文本转化为向量时 ...

  6. 文本分类入门(番外篇)特征选择与特征权重计算的区别

    文本分类入门(番外篇)特征选择与特征权重计算的区别 在文本分类的过程中,特征(也可以简单的理解为"词")从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化- ...

  7. [转]文本分类入门(番外篇)特征选择与特征权重计算的区别

    原文地址:http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html 在文本分类的过程中,特征(也可以简单的理解为"词 ...

  8. Li‘s 影像组学视频学习笔记(14)-特征权重做图及美化

    本笔记来源于B站Up主: 有Li 的影像组学系列教学视频 本节(14)主要介绍: 特征权重做图及美化 import matplotlib.pyplot as plt %matplotlib inlin ...

  9. 通过机器学习得到样本的特征权重

    描述: 计算每个特征对样本集进行划分所获得的信息增益,然后做归一化处理可以得到每个特征的权重 目标: 样本降维 一种算法策略:参考决策树的划分选择 首先引入概念信息熵.信息增益. 信息熵(inform ...

最新文章

  1. sbt配置nexus仓库
  2. RHEL5.3下搭建SSH
  3. 线程池用过吗?ThreadPoolExecutor谈谈你的理解? —— 为什么用线程池?优势?|| 线程池如何使用?
  4. DotNet关键知识点——WPF篇(一)(范德成编辑批注版)
  5. matlab二次二阶距,用Matlab改进一次二阶矩法程序.doc
  6. 数据结构—图的基本概念
  7. Android.DebugTools.Traceview dmtracedump
  8. php+ci+db+debug,[PHP] Web Framework : CodeIgniter MySQL Database 使用教學
  9. 1.shell脚本编程——基础篇(一)
  10. mallplus多商户商城 让支付触手可及,封装了微信支付、QQ支付、支付宝支付、京东支付、银联支付常用的支付方式以及各种常用的接口
  11. rmnet蠕虫病毒样本分析
  12. ctfmon.exe频繁出错的一个解决办法
  13. ORA-01045: user lacks CREATE SESSION privilege; logon denied
  14. Spring DI和AOP简介(一)
  15. 2.words平均长度
  16. Fremont弗里蒙特_US机房测速
  17. U盘启动模式USB-HDD/HDD+/ZIP/ZIP+/CDROM/FDD的区别
  18. 理财入门《小狗钱钱》阅读总结
  19. c++ notify_one()和notify_all()
  20. repo 工具使用手册【转】

热门文章

  1. 学习“写给asp.net的新手学习经验”
  2. C# 从入门到入土(自学笔记)--Day2
  3. 在计算机网络只能共享软件资源,在计算机局域网中,只能共享软件资源,不能共享硬件资源。...
  4. 优化APP性能的三大方法
  5. 禁止PPStream后台程序PPSAP自动运行完美解决方案
  6. python表单交互
  7. 我的世界服务器优化mcbbs,[教程] Minecraft 服务器优化教程
  8. 我的投资案例(3)-看好互联网和金融两大朝阳行业,参投入股垂直金融招聘平台职业梦CareerDream.cn
  9. 业余草微信公众号Markdown编辑器, 适合代码排版
  10. win10电脑启动QQ/TIM遇到QQ安全防护进程,打不开TIM/QQ解决方法