转自:http://shenhaolaoshi.blog.sohu.com/

下面是一位朋友的问题,其实每天都有不少同学和朋友向我提问各种学习数据分析、数据挖掘、统计分析等方面的问题,有时候真的很难仔细回答。其实,每个人都有自己的学习路径,还有自己的知识结构和期望的职业生涯,要得到一个统一的答案是困难的!
什么是解决问题:就是在明确实际情况和期望情况之间的差异后,为消除这种差异所采取的行动!在解决具体问题时,要先明确分类问题、差异问题,最后我们才能谈论共性!

我期望解答这个朋友问题可能具有共性,放在博客中,一些见解仅供大家参考:

沈浩老师:

您好!不知道您还记得我不,我是电信的一名新入职员工,在过年前给您写过一封E-mail.我期望自己能够在企业内从事跟数据挖掘的工作,期望通过数据挖掘这个工具来挖掘用户深层次的需求和研究用户的使用习惯及消费特点。
我在网上查阅过一些从事数据挖掘的专家的博客,有人提到如果在企业内从事数据挖掘方面的应用工作,需要掌握相关的数理统计知识,懂得使用相关软件就可以了,请问是这样的吗?还需要掌握数据仓库和程序算法方面的知识吗?因为我从本科到研究生都是学习管理方向的,数学方面的基础相对薄弱,因此想请您指教一下。
另外,如果我要入门,从哪个方面入手比较好呢?有什么合适的参考书吗?请你不吝赐教。
想必您平时的工作很忙,因此对这么唐突的给您写邮件请教而占用您的时间和精力表示歉意。期待您的回复!祝您工作顺利,身体健康!

沈浩的回答:
抱歉,事情太多,如果不追着就忘了!我认为你作为企业员工对数据挖掘感兴趣,最主要的就是从应用和解决问题开始,所以我想把数据挖掘这个狭义定义的内容改成你应该对数据分析感兴趣,数据挖掘只是数据分析的一个重要工具和解决方法之一!

数量统计知识方面:我认为统计思想是数学在实践中最重要的体现,但对于实际工作者最重要的是掌握统计思想,其实统计理论非常复杂,但实际应用往往是比较简单的!比如,很多人都在大学学了假设检验,但实际应用中假设就是看P值是否小于0.05,但是H0是什么?拒绝还是接受的是什么现实问题;要理解!
掌握软件问题:从软件角度学,是非常好的思路,我基本上就是这样学的。我常说编软件的人最懂理论,否则编不出来,编软件的人最知道应用,否则软件买不出去;现在软件越来越友好,把软件自带案例做一遍,你会自觉不自觉的掌握软件解决问题的思路和能解决的问题类型;
**数据仓库问题:**OLAP和数据挖掘是数据仓库建立基础上的两个增值应用,从企业整体角度,数据挖掘应该建立在企业数据仓库完备的基础上。所以说数据仓库是针对企业级数据挖掘应用提出的,但我们应该记住,企业从来不是为了数据挖掘建立数据仓库,而是因为有了数据仓库后必然会提出数据挖掘的需求!现在随着数据挖掘软件的工具智能化,以及数据仓库和ETL工具的接口友好,对数据库层面的要求越来越少;
数学不好可能反应了一个人思考问题的方式或深入理解问题的能力,但数学不是工具是脑具,不断解决问题的过程可以让我们思考问题更数学化!

沈浩老师建议:

不急,一步一步来!先把本职工作中的数据分析问题理解了,干好了!
熟练玩好Excel软件工具,这个可以看《Excel高级应用与数据分析》我写的书,当然有很多Excel论坛和网站,从我的博客就可以连接到。
学习好统计分析方法,我不是单指统计原理,而是统计分析方法,比如回归分析,因子分析等,不断进入统计分析解决问题的思考方式;这个可以看看SPSS软件方面的书和数据案例,通过软件学习解决数据分析的统计问题,这方面的书很多,当然你也可以关注我的博客,不断增加统计分析方法解决数据分析问题的思路,自己对照着完成!
在上述问题有了比较好的理解后,也就是你应该算是一个数据分析能手的时候,开始进入数据挖掘领域,你会发现用数据挖掘思想解决问题具有智能化、自动化的优势,接下来,你需要考虑数据建模的过程,通过学习Clementine软件或SAS的挖掘工具,不断理解数据挖掘与原来的数据分析工具有什么不同或优势!
当前面都是了解并且能够得心应手后,你就要有针对性的掌握你工作所在行业的问题,例如:电信行业的解决方案问题:客户流失、客户价值、客户离网、客户保持、客户响应、客户交叉销售等商业模型,同时与数据分析和数据挖掘统一在一起的解决方案!
接下来,你应该掌握数据库的一些原理和操作,特别是SQL语言的方式
你到了这个阶段,就应该有全面解决问题的能力,比如挖掘出来的知识或商业规则如何推送到营销平台上等等
梳理自己的知识结构,不仅会操作,现在你应该成为专家了,要能够宣扬你的知识能力和领导力,当然也要表明你在数据挖掘领域的专业特长
要经常帮助同事和行业朋友,比如帮助解决数据分析问题,帮助咨询,甚至给大家讲课,这对你的知识梳理和能力的提高非常重要,你的自信心会更强!
有兴趣,可以建立一个博客或什么,不断写点东西,经常思考和总结
结交广泛的朋友!
关于入门的教材:

互联网,其实不用买什么书网络基本都有;要有好的搜索能力,当然包括搜各种软件!
SPSS和Clementine软件的说明和案例,都做一遍;
《数据挖掘——客户关系管理的艺术》不错,当当网上查一下
《调查研究中的统计分析法》——我和柯老师写的,当当网也有
《Excel高级应用与数据分析》——我写的
《数据展现的艺术》——我和博易智讯合作

沈浩老师谈如何学好数据挖掘(推荐)相关推荐

  1. 《孙鑫老师谈如何学好编程》摘要

    <孙鑫老师谈如何学好编程>摘要 1找一本好书 适合你的水平 Amazon排行 Java编程思想 深入浅出MFC 并不太适合初学者 看不懂会打击自信心 把自己的基础告诉别人 去书店实际看一些 ...

  2. [转载] 童裕孙老师谈“如何学好数学基础课”

    数学基础课是高等学校许多专业的学生必修的课程.学生在体验了初入高等学府的激动.兴奋和新奇等感受之后,很快发现高校的学习和中小学有很大差别.这一点特别表现于数学基础课.一些原本在中学里数学成绩不错的学生 ...

  3. 杨鹏谈世纪佳缘推荐算法:基于Spark GraphX,弃GBDT和LR用FM

     杨鹏谈世纪佳缘推荐算法:基于Spark GraphX,弃GBDT和LR用FM 发表于2015-09-30 09:53| 1447次阅读| 来源CSDN| 2 条评论| 作者杨鹏 机器学习推荐算法 ...

  4. 高老师谈网络工程师之路

    高老师谈网络工程师之路 编者按:高骞老师,1999年从事网络至今,获得过CCNP.H3CSE.MCSE.linux工程师.CIW网络安全讲师等资格,任职过联想网络.神州数码.悦扬星汉等知名企业,实施过 ...

  5. 博士申请 | 香港科技大学陈浩老师招收人工智能医疗方向全奖博士/博后

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 香港科技大学 香港科技大学 (The Hong Kong Universi ...

  6. 博士申请 | 香港科技大学陈浩老师招收AI医疗方向全奖博士/博后/RA/实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 香港科技大学 香港科技大学 (The Hong Kong Universi ...

  7. 香港科技大学陈浩老师招收博士后和博士生

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[AI求职]微信技术交流群 香港科技大学陈浩老师领导的人工智能医疗实验室招聘多名博士后.博 ...

  8. 香港科技大学人工智能医疗课题组陈浩老师招收博士生/博士后

    香港科技大学计算机科学与工程系陈浩老师招聘多名博士生.博士后等岗位.陈老师致力于人工智能医疗交叉领域的前沿技术研究和临床应用,拥有丰富的学术和工业经验,为研究组提供充足的资源支持. 香港科技大学 香港 ...

  9. ​香港科技大学人工智能医疗课题组陈浩老师招收博士后/博士生

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> AI算法岗求职群 香港科技大学人工智能医疗课题组陈浩老师招收博士后 香港科技大学陈浩老师 ...

最新文章

  1. 各大品牌液晶显示器工程模式
  2. Download interrupted: URL not found.
  3. python 求函数最大值_遗传算法与Python图解
  4. mysql事务服务_MySQL (事务篇)
  5. HTTP一次完整的http请求所经历的步骤
  6. math.ceil带小数点_Python中带有示例的math.ceil()方法
  7. 跨系统服务器data,跨服务器的数据整合方法及系统 Cross-server data integration method and system...
  8. wxpython2.8_wxPython 2.8 Application Development Cookbook英文pdf版
  9. wps嵌入字体后也不改变_冬至后的君子兰,养护方式要改变,不然过年不开花
  10. CCF201403-1 相反数(解法三)(100分)(废除!!!)
  11. 安全双标准或成拖垮企网防护的新威胁
  12. 斐波那契数列——O(1)算法
  13. PhotoShop2018安装与破解教程
  14. Arcgis应用(十二)栅格数据翻转(Flip)、镜像(Mirror)、重缩放(Rescale)、旋转(Rotate)、移位(Shift)、弯曲(Warp)
  15. 组合公式计算机,(最新整理)排列与组合的概念与计算公式
  16. 织梦cms仿站_文章发布出现WTS-WAF页面
  17. 一份热乎乎的字节面试真题
  18. 白鹭php源码,看源码系列之从运行流程开始-Egret社区-教程文档-白鹭引擎-Egret Engine-免费开源HTML5游戏引擎 - Powered by Discuz!...
  19. 南昌大学科学技术学院计算机专业,南昌大学科学技术学院
  20. Office2013出现”停止工作“问题的解决

热门文章

  1. Python Split函数升级版
  2. 软件分享 pqmagic 8.0中文版优秀硬盘分区管理工具
  3. Hive分析窗口函数之LAG,LEAD,FIRST_VALUE和LAST_VALUE
  4. android里发送邮件mail的几种方式
  5. Qt+MySQL:在Qt中用代码新建数据库
  6. 2021-NCTF pwn方向题目复现
  7. Google VR cardboard开发01
  8. 移花接木之真假baidu
  9. 健身做一个c循环多少钱_做一个懒人,到底要花多少钱?
  10. 品牌VI设计与网站设计