作者:Charlotte77  数学系的数据挖掘民工  
博客专栏:http://www.cnblogs.com/charlotte77/ 
个人公众号:Charlotte数据挖掘(ID:CharlotteDataMining)

精彩回顾:

数据分析/数据挖掘/机器学习---- 必读书目

1.数据分析和数据挖掘联系和区别

联系:都是搞数据的

区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =。

2.怎么入门

请百度“如何成为一名数据分析师”或者“如何成为一名数据挖掘工程师”。英文好上Quora,不行上知乎,看看入门资料。

3.选哪些书

看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱。

4.用什么语言

数据分析:excel是必须,R是基本,python是进阶。SAS和Matlab给土豪去玩吧。

数据挖掘:python是必须,java/c/c++是基础,hadoop/mapreduce/spark先掌握一点,因为并不是所有公司都有这么大的数据量。

5.需要学数学吗

都需要

数据分析:统计学,概率论,

数据挖掘:高数/数学分析,数值分析,线性代数,凸优化,运筹学(这些是基本)数字信号处理,模式识别,矩阵论(进阶)

6.要不要读研究生

一般来说,只有应届生去找工作会比较看重学历,因为你没有其他可以展示你能力的。但是随着工作时间久了(两年+),你的能力远超于你所在的学校,学历就不重要了。如果要读,建议读计算数学/概率论/模式识别/计算机 方面的研究生,争取发论文(高质量),否则应聘的时候并没有什么影响,当然,有些公司可能会在初筛的时候根据学历筛选人,正常,真想进就多工作几年再社招进去呗,学历不好也不能怪别人对不对。

工作几年后,如果觉得到瓶颈了,可以再去读书,没什么,这个时候可能你更清楚自己需要的是什么。

7.选择去哪个公司

大公司核心职位优先>>中型公司核心职位>大公司边缘职位>优秀的创业小公司核心职位>中型公司边缘职位>坑人的创业小公司边缘职位

原因:

1.大公司数据量多,人才多。能接触到核心项目核心职位是最佳选择。(BAT,网易有道,微软等)

2.中型公司发展快,机会多,压力大,成长快。(美团滴滴58)

3.创业公司慎选,如果有创业公司的offer,一看他们差不差钱,而看他们项目赢不赢利,三看团队技术氛围浓不浓。不差钱+盈利但技术氛围不浓,可以去,但不适合对技术追求高的人;不差钱+技术氛围浓但暂时不盈利,可以考虑,但要搞清楚盈利模式。盈利+技术氛围浓但现在差钱,可以考虑,争取成为核心成员,一旦融资不得了。如果差钱又不盈利技术氛围还差,算了吧,耗不起。

实在不知道怎么选,就看两点:1.数据量大小 2.技术氛围。钱少可以以后赚,技术氛围浓最重要。

8.怎么面试

1.诚实 2.真诚 3.展现你的潜力

9.没有项目经验怎么办

应届生要啥项目经验,本科生就说说自己的毕业论文,数模/ACM/阿里的参赛经历或获奖经历,以及可能会有的实习经历。研究生就说实验室的项目,负责的工作,完成的成果和发表的论文。不要夸大,如实说。

10.要不要培训

因人而异,但不建议。如果连搜索能力和自学能力都没有,就算你入了行,也会过得很痛苦的。更何况高昂的学费和造假的简历了。

11.到底该选数据分析还是数据挖掘

代码能力强直接搞算法,弱就先做数据分析,慢慢来,不着急。想我毕业的时候只会Matlab,后来被领导逼着两星期学了R,一个月学了python,自己在业余学了java,hadoop和spark等,也是一步步来的,不要想一口吃成个大胖子。

12.前途怎么样

我从实习到现在年薪翻了5倍,你说怎样。你要是只冲着钱去呢,去做销售吧;要是喜欢纯数呢,去做研究吧;要是喜欢从数据里发现一些有趣的事情并应用上去,那就来做数据分析/数据挖掘吧。

13.一天的工作大概是怎样的

到公司,跑数据,看结果,调优,跑数据,看结果,看论文,改代码,调优,跑数据,看结果。。。

14.有没有推荐的网站

google(之前被墙了,某个晚上恢复了,马上要回归了,现在不能用的话买个vpn吧,mac本推荐shadowsocks软件)

stack overflow:改bug神器

github:开源大法好!

Quaro:资料搜集地/经验借鉴处

(以及各类招聘网站:我不想学习的时候就看这个,看和自己理想的工作还有多少差距,打鸡血。。)

15.有没有推荐的IDE

sublime text+secureCRE/iterm够用了(mac本,windows的话就下个notepad++和linux就可以了)

各种语言的IDE都可以下一个,调试用。没有推荐,哪个顺手用哪个。

16.用什么电脑

有钱直接上服务器,没钱买个配置高的,实在没钱买个能敲的就行。以后工作有钱了再整个好的。

17.怎么投简历

校招有网申,我没有搞过校招,不太清楚流程。如果错过校招,最好去拉勾周伯通等垂直网站投。不太推荐58/赶集/智联,这些招聘网站上的职位类型主流偏低端,碰到不靠谱的公司概率较大。

18.怎么看岗位要求知道我的工作内容

一个简单的方法:所有数据分析类的岗位要求里写的要求会excel,PPT等的干的都是统计员的活!所有数据分析类的岗位要求里写的要求会GA,pu,uv分析的都是运营部门的!所有数据挖掘岗位里写的要求只有hadoop,spark,ETL的干的都是数据仓库的活!其他的自己看吧,数据挖掘有好几种职位:广告ctr预估的,机器学习的,推荐系统,自然语言处理等等。自己选择吧。反正入门都可以尝试做做。

总之,入门容易深入难,数学不好可以学,但会制约你的发展,代码不好也可以,但也会制约你的职业生涯,所以那些说“我觉得我数学不好代码能力也不强觉得R好难英语也不好看不懂国外的网站学多了会不会掉头发会不会找不到男/女朋友blahblah”的,你开心就好,你的职业生涯掌握在自己手中。

最后,感谢当初把我带入门的彭爱民老师,高芹老师和李海雄老师等等,好想回去看你们啊!!!!!!!

以上是工作半年以来想到的所有新入行的人可能会问的问题,以及我自己踩过的坑的一些总结,不全面,也没什么调理,大家将就看吧。除了以上问题有什么的再问我吧,上班时间不要问哦~(虽然下班也没什么时间,逗玩猫看看书刷刷手机就睡觉了  =  =)。

不要觉得我厉害,我觉得我到现在都是入门级,周围同事搞深度学习码代码码的飞起快被虐惨了,我是渣渣 = =

拜拜~学弟学妹们加油~

公众号后台回复关键字即可学习

回复 R               R语言快速入门免费视频 
回复 统计          统计方法及其在R中的实现
回复 用户画像   民生银行客户画像搭建与应用 
回复 大数据      大数据系列免费视频教程
回复 可视化      利用R语言做数据可视化
回复 数据挖掘   数据挖掘算法原理解释与应用
回复 机器学习   R&Python机器学习入门

数据分析/数据挖掘 入门级选手建议相关推荐

  1. 【原】数据分析/数据挖掘 入门级选手建议

    1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力.数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =. 2.怎么入门 ...

  2. 数据分析 —— 数据挖掘是什么、能干嘛、怎么做

    数据分析 数据挖掘 什么是数据挖掘 数据挖掘:用于寻找数据中隐含的知识,并用于产生商业价值的一种手段 为什么要做数据挖掘 技术和商业就像一对双生子,在互相促进中不断演进发展.随之而来的就是个大公司的业 ...

  3. 数据分析数据挖掘(五)

    数据从 数据分析数据挖掘(三) 去找 一.探索变量的关系 1.事件相互独立的条件: P(AB)=P(A)P(B)则称为事件A和B相互独立,简称A与B独立. P(A)P(B)>0,若A与B独立的充 ...

  4. 数据分析数据挖掘(三)

    前面我自己写的我看着都头大,我看看能不能给大家写的精简点,好理解. 我们需要的数据: 链接:https://pan.baidu.com/s/1xr4x43bfEe4hVWYtwiFGRw 提取码:ya ...

  5. 【数据分析数据挖掘】异常值的判断与去除——3σ 箱线图分析

    [数据分析&数据挖掘]异常值的判断与去除--3σ & 箱线图分析 参考文章: (1)[数据分析&数据挖掘]异常值的判断与去除--3σ & 箱线图分析 (2)https: ...

  6. 数据分析报告中的“建议”部分该怎么写?【简明版】

    作者:陈老师 个人公众号:接地气学堂 陈老师新课:商业分析全攻略 https://edu.hellobi.com/course/308 用数据分析方法解决商业问题,目前已经100+学员加入!5星好评. ...

  7. 大数据分析平台建模及建议

    企业开展大数据分析,首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选择数据源.进行数据抽样选择.数据类型选择.缺失值处理.异常值检测和处理.数据标准化.数据簇分类.变量选择 ...

  8. 06-机器学习.数据分析.数据挖掘的区别于联系

    数据分析:数据分析是指用适当的统计分析方法对手机的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程.在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分 ...

  9. 数据挖掘过来人的建议

    关于数据 挖掘 方面的研究,我原来也走过一些弯路.其实从 数据挖掘 的起源可以发现,它并不是一门崭新的科学,而是综合了 统计 分析 .机器学习.人工智能. 数据库 等诸多方面的研究成果而成,同时与专家 ...

  10. Python 数据分析 数据挖掘 学习路径图

    话不多说,相信看到这篇文章的你一定是对数据分析,数据挖掘有兴趣,或者想从事和方面.本文不再累述python对数据分析的重要,数据分析这门的由来之类的. 在这里,我单刀直入,已我学习数据挖掘3年来的经历 ...

最新文章

  1. THE TOP FILE(top文件详解)
  2. [流媒体]实例解析MMS流媒体协议,下载LiveMediaVideo[4]
  3. 从阿里云下载图片到本地
  4. webuploader 怎么在react中_另辟蹊径搭建阅读React源码调试环境支持所有React版本细分文件断点调试...
  5. 使用Arquillian和LocalStack脱机测试AWS云堆栈
  6. python常用算法包_Python中常用的包--sklearn
  7. 同质异质网络——(F(fraud) A(Analytics) UDPSNT(Wylie_2015))
  8. 夯实Java基础(二十一)——Java反射机制
  9. ue4如何恢复初始状态_UnrealEngine4初始化流程
  10. mysql:Prepared statement needs to be re-prepared解决办法
  11. jQuery UI 插件
  12. 集中式版本控制器和分布式版本控制器的个人理解
  13. 用户运营 - 用户生命周期与CLV
  14. shell同时启多个进程,并等待所有子进程结束
  15. 什么是BACKHAUL
  16. 面试时怎样做精彩的自我介绍
  17. ubuntu 防火墙端口设置
  18. 盒子模型——margin
  19. echarts 地图迁徙 迁入迁出
  20. 浅科普一下计算机发展史阶段及那些不为人知的重要里程碑

热门文章

  1. android调节屏幕亮度
  2. 豪横!1.3 亿的数据毫秒级???居然做到了!!!
  3. 原创整理:92份面试题,累计3625页,肝的太累了!
  4. 值得收藏的130个神器网站
  5. 苹果爸爸发飙,封杀 React Native?
  6. 应用实战:从Redis到Aerospike,我们踩了这些坑
  7. pthread_detach()与pthread_join的区别?
  8. python3.4.3如何获取文件的路径
  9. windows 下 YII2 配置 memcache
  10. 【图文】在windows7 下安装和配置Memcached 64-bit for Windows