作者 | Tyler Folkman

译者 | 香槟超新星,责编 | 郭芮

头图 | CSDN 下载自视觉中国

出品 | CSDN(ID:CSDNnews)

以下为译文:

我觉得题目已经说的很清楚了,所以我们直接开门见山吧。

你手上没有任何数据

在考虑怎么招聘数据科学家之前,你应该先退一步,先考虑一下你的数据。

数据科学家的职责就是从数据中创造价值。如果你连自己手上到底有没有数据都不确定,那这就非常能说明一点——招聘数据科学家的时机还不成熟。

如果你知道自己手上有数据,但却真的不清楚该如何获取,也不知道数据的可靠性或任何细节,那么你应该首先回答上面这几个问题。

如果你的公司对自己的数据资产有着很深的了解,那么雇佣数据科学家就会获益匪浅。你的理解不一定要达到完美无缺的程度才行,但你应当能够为数据科学家指明一些有文档的数据。

对于一名新入职的数据科学家来说,最糟糕的感觉莫过于,在自己刚刚加入一家公司的时候发现这家公司实际上对自己的数据没有任何把握。

你手上的数据不合适

我知道你会怎么想。你读完第一条,然后笑了——谁会在没有数据的时候招聘数据科学家呀。

然而,下一个能说明时机还不成熟的标志是,你有数据,但不是正确的那种。

正确的意思是,数据是关于你想解决的问题的,而且最好是有标记的。我所说的有标记,是指你的数据是否与事件相关。

例如,如果你想让一个数据科学家进入你的公司来建立一个系统,检测你网站上的欺诈行为,你就会需要从你的网站中获取活动数据,并知道你的某一组数据中哪些活动是欺诈行为,哪些不是。知道哪些数据点是欺诈,就可以认为是标记。

现在——你可以不使用标记就解决问题,但如果这是你第一次涉足数据科学,我强烈建议从有标记的数据开始。

如果你的数据还没有标记,那么投入一些时间和资金,请人给你的数据打上标记,或者建立一个可以自动打标记的系统。

你对于想要解决的问题不明确

再说回持有合适的数据这一点。想知道你的数据是否合适,你还必须对于想要解决的问题有一个明确的认识。

这一点怎么强调也不为过。

当然——有可能你雇到了一个伟大的数据科学家,他或她入职的时候面对的是一个模棱两可的问题,然后奇迹发生了。但是不要做这种打算。

明确地知道你想解决的问题,以及你会如何评估结果是否成功,这样可以把你成功的机会放到最大。如果这个问题通常可以由人类轻松解决,那就更好了,因为这就标志着很有可能你同样也可以用数据科学来解决这个问题。

一个很好的例子可能是,你想以70%以上的准确率来检测发表在你的网站上的一条评论的言论是否得当。

你需要的其实是一名分析师

既然已经走到了这一步,那么但愿你已经有了合适的数据和对问题的明确认知。

再往下的一个最大的问题是,公司以为自己需要的是数据科学家,但实际上需要的是分析师。一个数据科学家通常可以胜任分析师的工作内容,但如果你需要的是分析师,那么最好直接请一个分析师。

一般来说,区别在于你是想要预测未来的新事件,还是想要更深刻地理解过去的事件。

举个例子,如果你希望有人来把你的历史销售数据汇总到一个漂亮的表格上,再加上一些总结性的统计数字,那么你需要的就是一个分析师。

分析师对公司的价值可能是非常大的。事实上,他们往往比数据科学家更有价值,因为通常情况下,你交给他们解决的问题更清晰,风险也更低。

你还没有准备好承担数据科学家的真实成本

很少有人知道,数据科学家们的需求其实很多。一旦你雇用了他们,他们就会想要更多的数据,更大的存储和更多的算力。往往你还没反应过来,他们就已经在试图说服你一台10万美元的电脑对你的数据科学项目绝对是至关重要的了。

而且他们说的可能并没错。

所以——在决定雇用一名数据科学家之前,请先考虑一下数据科学家的真实成本。你的IT/基础设施成本肯定是会增加的。

而且,一名数据科学家自身可能不足以产生巨大的价值。为了能以可接受的速度前进,在团队中增加更多的工程师和数据科学家可能会成为一种必要。

你想要的是独角兽和彩虹

与你的一般项目相比,通常数据科学项目风险会更大。很常见的情况是,连问题是否能够被解决都是未知数。你很可能雇了一个数据科学家,最后却在一个难以解决的问题上花费精力。

你需要对一次次的失败保持平和的心态,并且在时间表上宽松一些,这样才能让数据科学项目变得更高效。

这并不是说,你不应该期望你的数据科学团队能带来真正的价值,而是说你应该知道这种回报路径不会是很线性的一个过程。如果你的公司还没有准备好,那么我建议缓一缓再说。

你不知道该如何招聘数据科学家

最后,如果你不懂该如何招聘数据科学家,那就不应该去做这件事。

如今数据科学已经能代表许多不同类型的工作了,这就导致,如果你不了解这个领域,就很难知道自己要找的是什么类型的数据科学家。

比如说,也许你找到的是真正的学术型数据科学家,坐拥多个博士学位,但代码能力很差。又或者你找到的是一个更偏向于工程师的人,只是参加过一些数据科学方面的在线课程。

这两种本身都没什么不好,但根据需求的不同,你的公司可能会招到错误的人选。因此,在招聘数据科学家之前,请确保自己真的能够游刃有余地识别出一个合适的人选来。

原文:https://learningwithdata.com/posts/tylerfolkman/7-reasons-not-to-hire-a-data-scientist/

本文为 CSDN 翻译,转载请注明来源出处。

【End】

更多精彩推荐
☞登 GitHub 趋势榜首德国疫情追踪 App 号称可保疫情隐私数据无忧,你信吗?
☞安卓机+数据线,带你开发部署人脸识别应用☞踢翻这碗狗粮:程序员花 7 个月敲出 eBay,只因女票喜欢糖果盒
☞我佛了!用KNN实现验证码识别,又 Get 到一招
☞如何使用 SQL Server FILESTREAM 存储非结构化数据?这篇文章告诉你
☞加密价格更新周期:看似杂乱无章,实际内藏玄机
你点的每个“在看”,我都认真当成了喜欢

不招聘数据科学家的 7 个理由!相关推荐

  1. 如何成为数据科学家_成为数据科学家的5大理由

    如何成为数据科学家 目录 (Table of Contents) Introduction介绍 Variety of Skills各种技能 Uniqueness独特性 Impact影响力 Remote ...

  2. 免费公开课 | 数据科学家,从入门到精进!【今晚福利】

    <哈佛商业评论>宣布,"数据科学家"是二十一世纪最性感的职业.数据科学家究竟是一群怎样的人?各行各业高薪难求的他们又是如何开启自己的职业生涯的? 滴滴 ~福利卡!!! ...

  3. 十步教你成为数据科学家!

    作者 | Rahul Agarwal 译者 | 弯月,责编 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 以下为译文: 在大学里,我的专业是机械工程师,所以毕业后我进入了钢铁行业. 我每天 ...

  4. 【数据科学家】什么是数据科学家? 一个关键的数据分析角色和一个利润丰厚的职业...

    数据科学家的角色因行业而异,但有一些共同的技能.经验.教育和培训可以帮助你在数据科学职业生涯中占据一席之地. 什么是数据科学家? 数据科学家是分析数据专家,他们使用数据科学从大量结构化和非结构化数据中 ...

  5. 011 《数据科学家访谈录》读后感

    真的万万没有想到,读这样一本访谈录会记录下来这么多的令自己比较有感触的内容.25位各行各业的专家,通过他们的言谈内容,发现其中的通性--强大的撸码能力.扎实的统计数学知识以及沟通交流能力 . 反观自身 ...

  6. 抓取近千分领英资料后,我们发现了数据科学家的秘密……

    全文共4090字,预计学习时长8分钟 获取数据,以洞悉自己想成为的样子 图片来源:David S.A/Pixabay 一个数据科学家是不是非得成为一个Kaggler大师?神经网络究竟该用于图像识别还是 ...

  7. 抓取了1400家科技公司的招聘信息,我发现数据工程师比数据科学家更有市场

    来源:机器之心本文约2300字,建议阅读6分钟掌握工程技能可能是更重要的. 「作为数据科学家,我还有机会吗?」不,你更应该成为数据工程师. 数据无处不在,而且只会越来越多.在过去的 5-10 年内,数 ...

  8. 数据科学家 数据工程师_数据科学家应该对数据进行版本控制的4个理由

    数据科学家 数据工程师 While working in a software project it is very common and, in fact, a standard to start ...

  9. “竞赛是我们招聘的主要渠道”——数据科学家与竞赛小咖畅谈

    2005年,宋宽在马里兰大学完成了博士开题,他的导师John R G Townshend(马里兰大学行为与社会科学院院长)请吃饭以作庆祝.吃饭时闲聊,宋宽问导师夫妇从英国辗转到美国,取得了诸多成就,两 ...

最新文章

  1. Center OS 5.5 下安装 和 配置 Tomcat 7
  2. 迁移学习_Java 10迁移建议
  3. ajax怎么整理,ajax使用整理
  4. JAVA实现HTTPserver端
  5. UISwipeGestureRecognizer 左右事件捕捉
  6. OSI网络体系结构各层协议:
  7. 机器学习(二十二)——推荐算法中的常用排序算法, Tri-training
  8. [转]Xshell连接win10 Linux子系统
  9. int * p =NULL;和*p =NULL的区别a和a的区别
  10. “开源”vs“商业”,差别到底有多大?这篇测试一目了然
  11. [原创] VPDN--PPTP Server
  12. python读取文件路径中有中文_转 python 读取中文文件名/中文路径
  13. matlab根据脉冲计算转速,求不规则脉冲之前的时间间隔,进而求出电机转速
  14. C# 图片预览打印方法
  15. python_体脂率的计算
  16. Internet协议的安全性
  17. 蓝牙Beacon广播数据包格式以及解析
  18. lombok导入报错,版本1.18.12已在maven本地仓库中
  19. 川藏北线-成都老茶馆叹茶
  20. 参加这些学术会议,还怕发不了SCI?

热门文章

  1. [POJ 2891] Strange Way to Express Integers
  2. Could not create the view An unexpected exception……的问题
  3. 黄金周张家界之行(1)
  4. linux locate
  5. Spry Framework入门(四)——XML数据集排序
  6. 多标签分类与BCELoss
  7. 【leetcode】【动态规划】股票买卖
  8. mac gcc安装_16_超级小白Mac Pro下安装superset遇见的坑
  9. python 字典处理_python之高效处理字典、序列的一些语法
  10. 正向代理、反向代理和透明代理的详解