前车之鉴:我在数据科学职位面试中犯过的5个错误
全文共2047字,预计学习时长6分钟
图源:unsplash
我曾经多次参加面试,却总是与offer失之交臂,后来我才发现,我在面试过程中反复地犯了几个关键错误。我从中吸取教训,最终获得了一些数据科学家岗位的入职邀请。
我会特别标出数据科学家要注意的错误,这些也几乎是所有面试要注意的。希望各位免受面试和犯错的煎熬,专注于提升面试技巧,一举拿下心仪公司的数据科学家岗位。
谈论同一个项目
面试数据科学家时,面试官们总会问相似的问题。我原来认为要用一致的答案回复所有人,甚至觉得可以回溯引用同一个项目回答新问题。但请谨记,所有的面试官会在面试结束后相互讨论。这就意味着他们会认为你只会用同一个教育背景或者专业的数据科学项目来应对所有问题,从而做出片面的评价。
总谈论同一个项目会使你看起来经验不足,我就是活生生的例子。面试官说我不断地讲同一个案例,他们想了解其他的情况,以及我是如何处理这些问题的。
我认为用相似的答案回答类似的问题不一定是大错——这种情况下,要确保每个提问的面试官能听到你补充的新细节。但这个问题需要引起你的重视。
不知道是否所有公司都这样认为,因为我往往对某个特定的项目感到自豪并且会引用它来回答每个新问题。此外,基于同一个案例给出的答案也能让面试官全面了解我作为一名数据科学家的资质。
我的问题出在所有答案太过相似,仿佛在过去一年中仅完成了一个项目,这样当然无法打动面试官了。很难说这是一定要克服的问题,但别人提醒过我这是一个错误,所以我吸取了教训并在下次面试时改进了。
没有问足够多的问题
图源:unsplash
这一问题广泛存在,并且大多公司应该也视其为失误。没有提出足够的问题说明你:
· 对公司不感兴趣
· 不够专注导致提不出问题
· 过于自信
· 不好共事
没有人想和自以为是的人共事,那些对公司、公司目标和相应数据科学项目不感兴趣的人同理。最重要的是,提不出足够的问题时,你很像是不愿聆听。不仅适用于数据科学家,所有职业领域都是如此。
自认为面试官知悉我的过往经验
我常在面试和讲故事的时候犯这个错误。面试和讲故事其实是一回事儿。我常常认为面试官了解我的项目背景信息。但他们很可能什么都不知道,有些甚至不会看你的简历。
这话也许会令你震惊,但真的只会有几个公司认真阅读你的简历——但不意味着面试前可以不管简历了,因为面试官可能会就简历上的案例询问细节。再说讲故事,在回答问题的时候你需要设定场景,给出所做项目的基本信息,告诉面试官你可以与股东和非数据科学领域人士共事。
应提及的关键信息:
· 商业问题是什么?
· 为什么想做这个项目?
· 参与者有谁?(产品经理,软件工程师等)
· 过程如何?
· 如何完成的?
· 在宏观商业计划中有何作用?
· 结果如何?
· 完成度如何?
· 帮助到了多少人/节约了多少资本/节约了多少时间?
没有考虑业务影响
图源:unsplash
承接上文的讲故事,你需要确定自己的模型能带来的业务影响。这是数据科学家常犯的错误,因为他们只关注自己的模型及其表现,却忽视了业务影响。你需要用精准且有“影响力”的方式重点介绍结果。很可能项目结果非常有影响力,但没能告知面试官。
你可以这样措辞:“我做了一个决策树模型,将人工流程自动化,节省了50%的时间和50%的成本,为优化产品提供了时间和资本。”
如果不断强调99%的准确率却不提商业影响,面试官会认为你不适合企业,更适合学术。有时,如果整个过程在某种程度上更快、更有影响力,即使降低精度也可以。假设你是雇主,你会想知道谁对企业有用。
没有概述整个数据科学过程
这一点和第一点都是别人提醒过我的——没有概述整个数据科学流程,意思是我在谈论时缺少了主要数据科学项目前后的数据工程和机器学习的组成部分。
面试官想知道:
· 数据如何得来?
· 怎样预处理?
· 根据面向对象编程原则对项目做出了什么改变?
· 怎样做的测试?
· 怎样部署?
· 怎样与产品融合?
这些观点可能不是你的一手经验,但是面试官明白,数据科学家不会同时是该项目的数据工程师,机器学习工程师或软件工程师。他们只是想知道你是否了解全部流程以及各个步骤由谁完成。如果正确回答了这个问题,你在公司的眼里是更为专业的数据科学角色,并且可能会学习数据科学过程的开始或结束部分。
图源:unsplash
避免了这些错误也不能保证你能收到职位的邀请,但它们可能以某种方式起到效果。理解这些观点,能帮助你更好地应对面试中的问题。
推荐阅读专题
留言点赞发个朋友圈
我们一起分享AI学习与发展的干货
编译组:岳馨妍、符馨元
相关链接:
https://towardsdatascience.com/5-data-science-interview-mistakes-ive-made-59afcd41744f
如转载,请后台留言,遵守转载规范
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你
前车之鉴:我在数据科学职位面试中犯过的5个错误相关推荐
- 【数据科学】您将需要的最全面的数据科学/机器学习面试指南
介绍 您是否有志成为数据科学家,但却在努力破解采访?嗯 - 你并不孤单!在数据科学领域中断可能很困难.如果您来自非数据科学背景(很可能是您),那么这一点也是如此. 您从其他有抱负的数据科学家那里听到的 ...
- 数据科学和机器学习中的优化理论与算法(下)
数据科学和机器学习中的优化理论与算法(下) 数据科学和机器学习当前越来越热,其中涉及的优化知识颇多.很多人在做机器学习或者数据科学时,对其中和优化相关的数学基础,包括随机梯度下降.ADMM.KKT 条 ...
- 数据科学和机器学习中的优化理论与算法(上)
数据科学和机器学习中的优化理论与算法(上) 数据科学和机器学习当前越来越热,其中涉及的优化知识颇多.很多人在做机器学习或者数据科学时,对其中和优化相关的数学基础,包括随机梯度下降.ADMM.KKT 条 ...
- 大数据数据科学家常用面试题_进行数据科学工作面试
大数据数据科学家常用面试题 During my time as a Data Scientist, I had the chance to interview my fair share of can ...
- 香港中文大学(深圳)(HKCUSZ)数据科学(DataScience)面试经验(2018/11/3)
这是香港中文大学深圳校区此项目(数据科学)开设的第二年,第一年据说是没有笔试,只有面试. 所以我在网上一直都找不到笔试内容的相关信息. 笔试(1h30min) - 语言 英文 一 . Pyhton 基 ...
- 在数据科学人才教育中不断前行: 《大数据系统基础A、B》课程实践项目中期答辩顺利举行...
为服务国家大数据发展战略,打造多层次.多类型的大数据人才队伍,清华大学大数据能力提升项目之<大数据系统基础A.B>课程实践项目中期答辩于2018年11月14日顺利举行.清华大学软件学院教授 ...
- # 数据科学和机器学习中的优化理论与算法(上)
本场 Chat 从基础知识的角度,用大白话对数据科学和机器学习中用到的最重要的优化理论和算法做个小结. 本场 Chat 内容如下: 优化中涉及的线性代数数学基础 优化理论中最常提到的一些定义.定理 求 ...
- 数据科学工程师面试宝典系列---旅游评论数据中的自然语言处理
NLP的工作 训练中文分词模型:比如jieba.ncej(java分词): 训练中文词性分析模型:名词.形容词.副词.否定词:分词是基础: 评论数据的印象提取(情感分析):关键词分析和聚合: 基于wo ...
- 数据科学在风控中的应用-笔记
风控流程 -信贷风控决策体系流程 客户申请-资料填写-要素验证-合规性验证-规则验证-黑名单-反欺诈-信用评分-放款-贷后管理 -某消费金融公司决策体系流程 禁入规则校验:基本信息校验.人行征信分级 ...
最新文章
- 拒绝了对对象 'XXX' (数据库 'XXX',架构 'dbo')的 SELECT 权限
- 【项目实战】mybatis +vue.js 前后端交互批量删除
- 计算机网络安全管理协议,河西学院校园网络安全管理协议
- 前端学习(175):弹窗
- MVC 模式/Servlet/JSP 编译原理剖析:Servlet 组件到底属于 MVC 模式的哪一层?
- 商标申请的企业法律服务可避免法律风险
- Xshell连接redhat乱码问题
- 嵌入式电路设计(入门)
- 蛮力法 —— 求解迷宫问题 —— DFS和BFS
- Java面试:mysql批量更新
- 5、自写<VBA函数>关于字体与单元格颜色、大小的函数
- yyuc php,yyuc框架介绍
- 统一批量修改word页眉页脚
- 医学知识-CT的窗宽窗位
- 点餐系统,餐厅点餐系统,外卖点餐系统python计算机毕业设计
- 0-5V转4-20mA信号隔离器、0-10V转换器、直流模块
- 摸鱼一小时实现的斗牛Game【Java版】,希望各位友友远离赌博~
- 如果你的天猫魔盒不能看了
- 算法与数据结构 --- 哈夫曼树及其应用
- 30岁的问题,为什么有人说程序员只能干到30岁。