展开全部

取对数作用主要有:缩小数32313133353236313431303231363533e4b893e5b19e31333363386231据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。

2. 取对数后,可以将乘法计算转换称加法计算。

3. 某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。例如,中文分词的mmseg算法,计算语素自由度时候就取了对数,这是因为,如果某两个字的频率分别都是500,频率和为1000,另外两个字的频率分别为200和800,如果单纯比较频率和都是相等的,但是取对数后,log500=2.69897, log200=2.30103, log800=2.90308 这时候前者为2log500=5.39794, 后者为log200+log800=5.20411,这时前者的和更大,取前者。因为前面两个词频率都是500,可见都比较常见。后面有个词频是200,说明不太常见,所以选择前者。

从log函数的图像可以看到,自变量x的值越小,函数值y的变化越快,还是前面的例子,同样是相差了300,但log500-log200>log800-log500,因为前面一对的比后面一对更小。

也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这也是符合生活常识的,例如对于价格,买个家电,如果价格相差几百元能够很大程度影响你决策,但是你买汽车时相差几百元你会忽略不计了。

4. 取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,例如800/200=4, 但log800/log200=1.2616,数据更加平稳,也消弱了模型的共线性、异方差性等。

5. 所得到的数据易消除异方差问题。

6. 在经济学中,常取自然对数再做回归,这时回归方程为 lnY=a lnX+b ,两边同时对X求导,1/Y*(DY/DX)=a*1/X, b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。

回归分析什么时候取对数_为什么相关或回归分析时 x和y取log相关推荐

  1. 回归分析什么时候取对数_技术派|SPSS数据分析心得小结及心得分享!必备收藏...

    作者:徐定德 来源:经管之家,欢迎转载,欢迎分享. 学习数据分析之spss分析工具,可真的不是一般的功夫,真的要很认真和很细心才能做得好spss.下面我来和大家分享一下关于SPSS数据分析心得小结,希 ...

  2. 回归分析什么时候取对数_在线性回归中,什么时候使用自变量的对数代替实际值合适?...

    我总是告诉学生,采用自然对数来转换变量的三个原因.记录变量的原因将决定您是要记录独立变量还是因变量或两者.为了清楚起见,我正在谈论采用自然对数. 首先,如其他海报所指出的那样,提高模型拟合度.例如,如 ...

  3. python 怎么取对数_概率矩阵分解(PMF)及MovieLens上的Python代码

    首先对Probabilistic Matrix Factorization这篇论文的核心公式进行讲解和推导:然后用Python代码在Movielens数据集上进行测试实验. 一. 背景知识 文中作者提 ...

  4. python 怎么取对数_重新开始学习Python 第二十八天 Python 数学模块

    Python数学模块 在程序开发的时候,可能不仅仅需要加减乘除这样的简单运算,还需要乘方.开方.取绝对值等等这样的复杂运算.这一篇文章将要介绍Python的数学内置模块math,这个内置模块能够解决常 ...

  5. python数组取对数_关于python:取列的对数

    我对编程非常陌生(在python中),我想创建一个新变量,该变量是列的对数(来自导入的excel文件). 我尝试过从该站点尝试不同的解决方案,但始终出现错误. 我最新的错误是AttributeErro ...

  6. 回归分析什么时候取对数_冬蜜什么时候取,冬天取蜂蜜的方法

    大家好,我现在分享的是,在冬天是在什么时候取蜜! 冬天在我们南方,取蜜时间是十一月到十二月的时候, 只要温度达到15度以上,蜂蜜封盖了就可以取蜜了, 并且在冬天我们只能取一次,最晚取蜜的时间在十二月的 ...

  7. 如何用java取对数_使用Java中的Math.log获取自然对数值

    要获取数字的自然对数,我们使用java.lang.Math.log()方法.Math.log()方法返回自然对数,即log以double值的底数e为底.如果传递的值为NaN或负数,则结果为NaN.如果 ...

  8. 用python爬取网站_「自如网」关于用python爬取自如网信息的价格问题(已解决) - seo实验室...

    自如网 ###这是一篇求助文,我能获取图片并变成字符串,但是无法获取位移量### 前两坛突发奇想想要爬取自如网的租房数据,本来以为能够请求+美丽+ re能全部搞定,没想到这个网站的反爬机制有点让我搞不 ...

  9. python爬虫爬取房源_手把手教你用Python网络爬虫爬取新房数据

    项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以「惠民之家」 ...

  10. python爬取站_简单python爬虫练习 E站本爬取

    必备条件: 一台能上404的机子.. 过程: 由于也只是初学爬虫,个中技巧也不熟练,写的过程中的语法用法参考了很多文档和博客,我是对于当前搜索页用F12看过去..找到每个本子的地址再一层层下去最后下载 ...

最新文章

  1. swift笔记三 使用xcode
  2. 获取手机idfa_七麦线上公开课:后IDFA时代,链接用户的新生态解决方案
  3. 微信小程序 - 使用npm(第三方包)
  4. 通道抠图--火焰,背景颜色统一为黑色
  5. 前端学习(2877):原生js模块化+绘制弹幕与动画video联动
  6. perl语言编程 第四版_被称作“胶水语言”的PERL,在芯片设计和验证中可以这样使用...
  7. Matlab Tricks(十七)—— 使用 Latex
  8. 南开计算机等级,南开100题分类-全国计算机等级考试上机考试习题集(二级C)(南开大学出版社)...
  9. 流量卡之家:物联网系统解决交通拥堵 全面开启未来绿色出行
  10. 微服务:服务治理来保证高可用
  11. ubuntu16.04下摄像头驱动
  12. 【实例】python 使用beautifulSoup 抓取网页正文 以淘宝商品价格为例
  13. 观海智能观海舆情大数据SaaS云平台
  14. 整理了MariaDB和MySQL数据库历年发布版本和对应关系,方便记忆命令。
  15. 【STM32】NVIC中断优先级管理(中断向量表)
  16. 又一个项目要结项了,项目报告PPT内容节选点纪念一下
  17. 心理测评软件php mysql_心理测评系统
  18. 田纳西大学计算机科学,田纳西大学
  19. ant Design vue中a-row 内容不会垂直居中
  20. 一年前, 打了一份关于谷歌英雄迟暮的草稿, 终究和它一起迟暮了

热门文章

  1. android 仿饿了么地图,微信小程序仿饿了么地址定位、筛选与回传
  2. Solidity编程语言
  3. wsimport命令介绍
  4. imagej得到灰度图数据_【原创】imagej使用达人指南,分享给大家!
  5. php 倒计时插件下载,jQuery自适应倒计时插件
  6. java毕业设计易医就医购药交互平台Mybatis+系统+数据库+调试部署
  7. 移动前端UI库—Frozen UI、WeUI、SUI Mobile,jQuery WeUI,vue-carbon,VUE.YDUI,Muse-UI
  8. mybatis缓存引起的问题
  9. 腾讯云人脸支付常见问题和解答,以及腾讯云人脸支付相关介绍
  10. 机器学习算法 之 逻辑回归算法