一、目前国内的数据挖掘人员工作领域大致可分为三类。

·        1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。

·        2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。

·        3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。

二、说说各工作领域需要掌握的技能。 
(1).数据分析师

·        需要有深厚的数理统计基础,但是对程序开发能力不做要求。

·        需要熟练使用主流的数据挖掘(或统计分析)工具如BusinessAnalytics and Business Intelligence Software(SAS)、SPSS、EXCEL等。

·        需要对与所在行业有关的一切核心数据有深入的理解,以及一定的数据敏感性培养。

·        经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用》、《Excel 2007 VBA参考大全》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。

(2).数据挖掘工程师

·        需要理解主流机器学习算法的原理和应用。

·        需要熟悉至少一门编程语言如(Python、C、C++、Java、Delphi等)。

·        需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。

·        经典图书推荐:《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C++》、《数据结构》等。

(3).科学研究方向

·        需要深入学习数据挖掘的理论基础,包括关联规则挖掘(Apriori和FPTree)、分类算法(C4.5、KNN、Logistic Regression、SVM等) 、聚类算法(Kmeans、Spectral Clustering)。目标可以先吃透数据挖掘10大算法各自的使用情况和优缺点。

·        相对SAS、SPSS来说R语言更适合科研人员The R Projectfor Statistical Computing,因为R软件是完全免费的,而且开放的社区环境提供多种附加工具包支持,更适合进行统计计算分析研究。虽然目前在国内流行度不高,但是强烈推荐。

·        可以尝试改进一些主流算法使其更加快速高效,例如实现Hadoop平台下的SVM云算法调用平台--web 工程调用hadoop集群。

·        需要广而深的阅读世界著名会议论文跟踪热点技术。如KDD,ICML,IJCAI,Associationfor the Advancement of Artificial Intelligence,ICDM 等等;还有数据挖掘相关领域期刊:ACM Transactionson Knowledge Discovery from Data,IEEETransactions on Knowledge and Data Engineering,Journal of Machine Learning Research Homepage,IEEE Xplore: Pattern Analysis and MachineIntelligence, IEEE Transactions on等。

·        可以尝试参加数据挖掘比赛培养全方面解决实际问题的能力。如SigKDD ,Kaggle: Go fromBig Data to Big Analytics等。

·        可以尝试为一些开源项目贡献自己的代码,比如ApacheMahout: Scalable machine learning and data mining ,myrrix等(具体可以在SourceForge或GitHub.上发现更多好玩的项目)。

·        经典图书推荐:《机器学习》《模式分类》《统计学习理论的本质》《统计学习方法》《数据挖掘实用机器学习技术》《R语言实践》,英文素质是科研人才必备的《Machine Learning: A ProbabilisticPerspective》《Scaling up Machine Learning : Parallel andDistributed Approaches》《Data Mining Using SAS Enterprise Miner :A Case Study Approach》《Python for Data Analysis》等。

数据挖掘人员工作领域大致可分为三类【转知乎某人的观点】相关推荐

  1. 数据挖掘人员工作领域分为哪几类,各自需要掌握哪些知识?

    学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁.技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节.但是技术在结 ...

  2. 数据挖掘学习路线【转知乎某人的观点】

    ---------------------------浓缩精华版-------------------------------- 第一步:数据准备:(70%时间) 获取数据(爬虫,数据仓库) 验证数据 ...

  3. 目前国内的数据科学家岗位,大致可分为哪几类,薪资怎么样?

    目前国内的数据科学家岗位,大致可分为四类:数据开发.数据分析.数据挖掘.数据产品 简单介绍些这几个岗位的主要职责 数据开发: 1.负责数据收集.清洗和规约等工作: 2.提供面向业务的数据服务,完成数据 ...

  4. 字符串第一个出现的单个字符_如何在不编写单个应用程序的情况下找到我的第一个开发人员工作

    字符串第一个出现的单个字符 I've read a lot of different stories from other self-taught developers who've made a s ...

  5. web开发应届生入职_我如何从全职妈妈着手完成第一份Web开发人员工作

    web开发应届生入职 Two years ago I completed my first exercise on "Say Hello to HTML Elements" on ...

  6. UI设计师主要做什么 工作内容大致有哪些

    提及UI设计,很多人都知道它是一门新兴行业,工作内容与美工设计师有交叉,但被问及UI设计师的工作内容具体是什么时,多数人表述不清.UI设计师主要做什么呢? UI设计师简称UID(User Interf ...

  7. java java编码_5个重视Java编码技能的工作领域

    java java编码 在这篇文章中,我们将重点介绍5个重视Java编码技能的工作领域. 人们常说Java是一种垂死的语言,因为近年来它在全球的使用量一直在稳步下降. 但是,使用量的减少并不一定等于J ...

  8. 人工智能开发人员工作流程、看法、工具统计数据

    人工智能开发人员工作流程.看法.工具统计数据 本文目录: 一.人工智能开发所需要的技能和知识 二.开发人工智能需要以下工具 2.1.开发过程中的人工智能工具调查 2.2.AI 工具情绪调查 2.3.A ...

  9. 大学毕业没有实习经历_我是如何在大学毕业后没有实习的情况下获得第一份开发人员工作的...

    大学毕业没有实习经历 by Tim Park 蒂姆·帕克(Tim Park) 我是如何在大学毕业后没有实习的情况下获得第一份开发人员工作的 (How I got my first developer ...

最新文章

  1. JavaScript的主要功能
  2. Oracle Enterprise Manager Cloud Control最新文档合集
  3. c#怎么做windows窗体小程序_个人想做微信小程序怎么做?
  4. K210 / Openmv实现 大津法/Otsu最大类间方差法 自适应二值化
  5. MySQL下bin-log的三种模式(ROW、Statement、Mixed)
  6. 前端 HTML 获取自定义标签tag 的值方法
  7. Hive数据倾斜及处理
  8. 斯坦福-随机图模型-week1.4_
  9. Javascript:学习笔记
  10. 四种模式、五大架构 规划企业物联网蓝图
  11. hadoop交流群261039241
  12. cad打开a3样板图形_CAD如何绘制标准的A3图框(A3图纸样板图)
  13. python源码打包成exe、exe反编译、pyd加密防止反编译
  14. Arcgis操作系列一:shp矢量数据的面积计算
  15. office WPS同时安装,WPS卸载后,文档图标异常解决办法
  16. 乱世王者服务器维护,乱世王者微信534区仰不愧天开服时间表_乱世王者新区开服预告_第一手游网手游开服表...
  17. 电脑开机出现警报音后提示要按F1才能进入的分析处理
  18. 2019第十二届全国大学生信息安全竞赛部分WriteUp
  19. 环状二肽,82863-65-8,cyclo(Leu-Tyr)
  20. 计算机热点方向、历史、未来

热门文章

  1. CPU 中控制器的作用
  2. torch.quantile or np.quantile的计算
  3. windows环境下启动mongodb服务
  4. 经典SQL语句大全转载
  5. 字符(字母)与Ascll码的转换
  6. 背包问题【01 完全 多重】
  7. EXCEL中,当把行高拉到409的时候就不能再拉高了
  8. Windows远程桌面工具连接Ubuntu系统使用总结
  9. 倩女幽魂2首曝 揭秘网易新3D引擎光影特效
  10. linux 16.04系统下载,Ubuntu下载 Ubuntu 16.04 LTS 官方正式版 32位 下载-脚本之家