数据科学家应遵守的十五个原则
本文转自:http://blog.csdn.net/lhzblog/article/details/20063863,感谢作者Chuck_lee
作为一个数据科学家,我为我的日常工作总结开发出15项原则,这些是我本人也遵循的:
1.不要用数据说谎或吹牛: 对经验性证据要诚实坦率。最重要的是不要用数据自欺欺人。
2.建立永久工具并分享给他人: 花费一些日常工作时间去建立一些能使自己和他人生活变得轻松的工具(补充:我为人人,人人为我)。我们可是该死的人类,我们应该是工具的制造者!
3.不断自我教育: 看在佛祖的份上,你可是个科学家哦。去阅读研究生水平的核心数学和统计方法教材吧,永远不要安逸于你在走廊里从同事那得到的对某个方法的拙劣解释,学习基本原理可以让你玩出花样来。阅读最近的论文,参加研讨会,发表和评论论文。对此没有捷径。
4.提高你的技能: 学好一种语言,这样你才能被称为行家里手。其他语言也要学到能与别人沟通。不要忘记,SQL和英语很象,这个星球上每个白痴都能说,但你只有真正掌握它才可以写出优美的诗篇。学习一种编译性语言、一种解释性语言,和R语言。或者只需要学习R!它是丑陋的,但它会给你一个优势。搞透Matlab,你已经不再是没毕业的学生了。学习Linux,即使你平时使用Windows,学习sed和grep等所有那些东西,你可以用bash和powershell做些奇妙的事情。如果你愿意,也学学Hadoop,但要知道它是一个蹩脚的系统。
5.明白数据科学家有个生存意义 “踢人们屁股并让他们震惊”: 每天做一件与此相关的事。
6.通过向别人展示工作来经常挑战自我:不要害怕一些恶棍会批评你的工作,粉碎他们。如果你想害怕蟑螂的话,那你就不要走路了!
7.不要吝惜知识,也不要害怕问问题: 有些人对他们的知识缺乏信心,不去分享它,原谅他们,但不要成为他们中的一个。
8.先开发出一些思路,然后听取别人的看法,利用他们关于这一领域所知道的知识,但不要让你自己被其束缚: 如果他们真牛到可以用他们所知道的来解决问题,他们就不会来找你要解决方案了。
9.出去和人们在一起,与之交谈,互通有无,他山之石可以攻玉。
10.为你温和的代码建立个令人印象深刻和交互性强的用户界面: 代码是我们的语言(但不是用户的,所以……),让你的代码通过好的UI来闪耀光辉吧。
11.有效使用可视化技术,避免难以理解的图形: 可视化的唯一用途是使数据易于理解而非令人困惑。
12.学习新技术,努力理解经典技术的原理
13.多揽多做: 这就是天才工作的方式。不要害怕提出创造性的想法。你听说过“低调说话,高调做事”?不要觉得这很华丽,这其实是无能鼠辈工作的方式,不要成为他们中的一个。
14.保持创造力和关注: 你可以通过创造力和关注取得成功(咖啡因对这个有点帮助,但别过头儿)。
15.积极起来,努力工作。如果有人想阻止你,只管碾碎他们。
数据科学家应遵守的十五个原则相关推荐
- 数据模型最佳实践_数据科学家应了解软件工程最佳实践
数据模型最佳实践 意见 (Opinion) 介绍 (Introduction) I have been eagerly researching, speaking to friends and tes ...
- 3ml乐谱制作工具_每个数据科学家应在其下一个ml项目中使用两种工具
3ml乐谱制作工具 by Braden Riggs and George Williams (gwilliams@gsitechnology.com) Braden Riggs和George Will ...
- os.popen read()报编码错误_数据科学家易犯的十大编码错误,你中招了吗?
选自 Medium 作者:Norm Niemer 机器之心编译 参与:李诗萌.王淑婷 数据科学家比软件工程师擅长统计,又比统计学家擅长软件工程.听起来牛逼轰轰,事实却是,许多数据科学家有统计学背景,却 ...
- 干货丨从线性回归到无监督学习,数据科学家需要掌握的十大统计技术
不管你对数据科学持什么态度,都不可能忽略分析.组织和梳理数据的重要性.Glassdoor 网站根据大量雇主和员工的反馈数据制作了「美国最好的 25 个职位」榜单,其中第一名就是数据科学家.尽管排名已经 ...
- 2021年大数据常用语言Scala(十五):基础语法学习 元组 重点掌握
目录 元组 重点掌握 定义元组 访问元组 元组 重点掌握 元组可以用来包含一组不同类型的值.例如:姓名,年龄,性别,出生年月.元组的元素是不可变的. 数组: 同一类数据成组 元组: 不同的元素成组 ...
- 大数据之路、阿里巴巴大数据实践读书笔记 --- 第十五章、数据质量
随着IT向DT时代的转变,数据的重要性不言而喻,数据的应用也日趋繁茂,数据正扮演着极其重要的角色.而对于被日益重视的数据,如何保障其质量是一个关注的话题: 数据质量是数据分析结论有效性和准确性的基础, ...
- 【大数据之Hadoop】二十五、生产调优-HDFS核心参数
1 NameNode内存生产配置 Hadoop3.x系列的NameNode内存是动态分配的,可以用jmap -heap 进程号 查看分配的内存. 在hadoop102中NameNode和DataNod ...
- 《数据科学家养成手册》第五章---矛盾的世界笔记
(1)世界中存在继续多相互矛盾的事物.矛盾通常是指事物相互影响和对立的关系.比如太阳的东升的同时没有办法西落. (2)数学中的虚数是与现实世界的实数相对的.虚数和实数的结合形成复数,通过复数构建的矢量 ...
- 宏油庄冒菜餐馆选址必须遵守的十五法则
投资餐饮行业,冒菜加盟最要害的一件事即是餐厅选址.选的方位好,餐饮运营就成功一半.有的运营者总习惯用将来的运营来补偿餐饮方位的缺乏,广告费投了很多,成果 却不抱负,直到资金竭尽才理解过来,但一切都悔之 ...
最新文章
- 接受返回值 server sql_SQL,何必在忆之一(基础篇)
- 体绘制(Volume Rendering)概述之4:光线投射算法(Ray Casting)实现流程和代码(基于CPU的实现)...
- linux配置接口多地址,Linux /etc/network/interfaces配置接口方法
- Python 一次for遍历多个列表及遍历时获取index
- 用PHP忙了一晚上写的图片缩略和图片等比缩放函数
- rfid阅读器的主要任务_RFID阅读器(读写器)的应用领域及其如何使用?
- SpringBoot + Shiro 缓存记住密码
- JSP中动态includ与静态includ的区别
- mqtt判断设备是否在线_如何在 Python 中使用 MQTT
- 当layer动态加载无法勾选 多个复选框时
- pytorch入门——线性回归
- adodb.connection id password windows用户_Windows 12发布了?一款号称可以取代win10的山寨Windows系统...
- Docker日志查看命令
- android 手机本地(office、word)文件预览
- linux幸运字符,删好友后幸运字符怎么找回来
- 【笔记总结】高中英语——其二:名词性从句
- struck.unpack
- AcWing 2041:干草堆(差分)
- 二分搜索几种写法分析
- linux服务器被挖矿的解决办法
热门文章
- 谁是小猪佩奇的幕后大BOSS?| 周末
- 图片未经许可,不可引用(图片外链限制PHP实现原理)
- 计算机访问不了互联网原因,如果计算机的无线网络已连接但无法访问Internet,该怎么办...
- Win32 .Net QA 200509
- 仿LOL项目开发第五天
- 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)
- windows下CMake fdk-aac
- vue 扫码枪 扫码墩 扫码器 中文输入影响 大小写影响 解决方案 js web端扫码枪对接 前端扫码枪 html扫码枪 vue扫码枪
- SS00014.elasticsearch——|HadoopElasticSearch集中式日志分析系统.v14|——|Elasticsearch.v14|
- 广东工业大学2016校赛决赛Problem B	Sward Art Online(分组背包)