初创公司怎么做销售数据分析

There is no better teacher than experience. No matter how many stories a person hears or how many different scenarios they think about, He/She will find no substitute for real life experienceMy romance with Data Science is no different.

没有比经验更好的老师了。 不管一个人听到多少故事,或者他们想过多少种不同的情景, 他/她都将找不到现实生活中的替代品。我对数据科学的恋爱没有什么不同。

Before ACTUALLY working for a company on real-life projects, My experience and understanding of Data Science were confined to “neat and clean” academic Datasets from Kaggle or hour-long tutorials on Youtube.

在实际为一家公司从事现实项目工作之前,我对数据科学的经验和理解仅限于Kaggle提供的“整洁”学术数据集或YouTube上长达一小时的教程。

Getting close to 78 percent accuracy on the Titanic Dataset gave me that false confidence that I was a soon to be “hot commodity” in the field and don’t get me wrong here.

泰坦尼克号数据集的准确率接近78%,这使我对我很快成为该领域的“热门商品”充满了错误的信心,并没有误解我的意思。

Only the top 5 percent of the people who have participated in the Titanic Dataset has scored more than 80 percent and that is a massive feat but It’s only the beginning.

参与《泰坦尼克号数据集》的人中只有前5%的人得分超过80%,这是一项巨大的成就,但这仅仅是开始。

So here are the five things I learned in my first week as an internee

这是我在被拘禁的第一周里学到的五件事

  1. Real Life Data is going to humble you

    现实生活中的数据会让你感到沮丧

Photo by Carlos Muza on Unsplash
卡洛斯·穆萨 ( Carlos Muza)在 Unsplash上 拍摄的照片

That’s right. Real Life data is leaps and bounds different than the academic or well-structured datasets commonly found on Kaggle.

那就对了。 现实生活中的数据与Kaggle上常见的学术数据或结构良好的数据集有很大的不同。

It’s unclean, It’s highly unstructured and it’s messy to the point that you will probably go through the whole day trying to make sense of what is on the Screen.

这是不干净的,它是高度结构化的,而且很混乱 ,以至于您可能会整天试图了解屏幕上的内容。

Now, I am not saying Datasets like those are not available on the internet, But the real-life dataset I went through had close to a million rows with null values scattered all over the place and based on multiple excel sheets too.

现在,我并不是说像这样的数据集在Internet上不可用,但是我经过的真实数据集有将近一百万行,零值散落在各处,并且也基于多个excel工作表。

I walked into the office like someone “who knew their business”, talking to different people on whether they participated in the Titanic Dataset. Only to leave at the end of the day extremely humbled and realizing that I stood nowhere and had A LOT of ground to cover. So to summarize:

我像一个“知道他们的生意”的人走进办公室,与不同的人讨论他们是否参与了《泰坦尼克号数据集》。 只是在一天结束时离开,我感到非常谦虚,意识到我无处可坐,有很多地面可以掩盖。 总结一下:

The more you know, The more you know you don’t know.

您了解得越多,您所知道的就越不知道。

2. Excel is your BEST Friend

2. Excel是您的最佳朋友

Photo by Mika Baumeister on Unsplash
Mika Baumeister在 Unsplash上 拍摄的照片

I cannot emphasize this point enough. All of the youtube tutorials I went through go over the importance of Python and R and I completely agree with them. These languages are extremely important to learn but I also believe that Excel is JUST as important if not more. A lot of companies have all of their records stored in Excel sheets and if you don’t how to work your way around Excel, You’re going to end up wasting A LOT of time and energy. The ability of Excel to create Pivot tables, remove null values, and overall well present the data is truly underestimated.

我不能足够强调这一点。 我经历的所有youtube教程都超过了Python和R的重要性,我完全同意。 这些语言对于学习非常重要,但我也相信Excel甚至同样重要。 许多公司的所有记录都存储在Excel工作表中,如果您不按照Excel的方式工作,您将最终浪费大量时间和精力。 Excel创建数据透视表,删除空值以及整体呈现​​数据的能力确实被低估了。

3. Focus on One Domain

3. 专注于一个领域

Photo by Scott Graham on Unsplash
Scott Graham在 Unsplash上 拍摄的照片

Data Science in itself is not one particular field. It can and is used in multiple domains such as finance, health, manufacturing, retail, and telecom just to name a few and that’s why Domain knowledge is a MUST to understand the underlying problem.|It’s not possible for an individual to be knowledgeable in all of the mentioned domains and that’s why, only one domain should be focused on and built expertise on.

数据科学本身并不是一个特定的领域。 它可以并且在多个领域中使用,例如金融,健康,制造,零售和电信,仅举几例,这就是为什么领域知识是必须理解潜在问题的原因。 一个人不可能在上述所有领域都具有知识 ,这就是为什么只应集中一个领域并建立专门知识的原因。

4. Focus on the business value of your solution

4. 关注解决方案的商业价值

Photo by Nikita Kachanovsky on Unsplash
Nikita Kachanovsky在 Unsplash上 拍摄的照片

Being a student of the field, I tend to use technical jargon a lot with my fellow aspiring Data Scientists BUT the thing is, Most clients who will receive the end product have little to no knowledge of the technicalities that go into making a machine learning model perform well. They are just interested in ONE simple thing and that is, “How can your solution add value to our business?”.

作为该领域的学生,我倾向于与有抱负的数据科学家一起经常使用技术术语,但事实是,大多数将收到最终产品的客户几乎不了解制作机器学习模型的技术知识表现良好。 他们只对一件简单的事情感兴趣,那就是“您的解决方案如何为我们的业务增加价值?”。

The client does not care whether you used KNN or Logistic Regression and quite frankly, He wouldn’t even know how to differentiate the two.

客户不在乎您是使用KNN还是Logistic回归,坦率地说,他甚至都不知道如何区分两者。

And that’s why when trying to communicate findings to prospective clients, you need to make sure the other person understands what it is that you are trying to communicate. So in short:

这就是为什么在尝试与潜在客户交流发现结果时,您需要确保对方了解您正在尝试交流的含义。 简而言之:

Your technical jargon doesn’t matter if the other person doesn’t see the value in your solution.

如果其他人没有看到您的解决方案中的价值,那么您的技术行话并不重要。

5. Being a good team player is a MUST

5. 做好团队合作是必须的

Photo by Campaign Creators on Unsplash
Campaign Creators在 Unsplash上 拍摄的照片

Unlike, the academic Datasets I worked where I did all of the Data preprocessing, Model preparation, etc, Real life projects involve a WHOLE lot of team play. It’s just not possible for one individual to see a project from conception to completion and that is why the ability to work as a team is extremely important.

与我在所有数据预处理,模型准备等工作过的学术数据集不同,现实生活项目涉及整个团队的大量工作。 一个人从构思到完成都不可能看到一个项目,这就是为什么团队协作的能力非常重要的原因。

结论: (Conclusion:)

My first day as a Data Science internee humbled me. I learned A LOT about what goes into making a successful Data Science project and if I were to give my two cents to anyone starting in the field, I would say, get into a startup or a firm even as an internee and get your hands dirty with real-life projects. Understand the value of your what it is that you are trying to do and be a good team player.

作为数据科学实习生的第一天让我感到沮丧。 我学到了很多有关成功完成数据科学项目的知识,如果我将两分钱捐给从事该领域工作的任何人,我会说,即使是被拘禁的人,也要进入一家初创公司或一家公司, 弄脏你的手与现实生活中的项目。 了解您想要做的一个好团队成员的价值。

Does my learning end here?

我的学习到此结束吗?

I believe it’s just getting started.

我相信这才刚刚开始。

翻译自: https://medium.com/swlh/my-first-week-as-an-internee-at-a-data-science-startup-57785368cf9f

初创公司怎么做销售数据分析


http://www.taodudu.cc/news/show-5884122.html

相关文章:

  • 英超:热刺2-1逆转布莱顿 凯恩补射扳平阿里破门反超
  • jboss esb_与JBoss ESB和LegStar的大型机集成
  • 三星 Galaxy Tab A8 平板 评测
  • 儒豹公布2009年2月热门搜索关键词排行榜
  • 华为手机年轻化转型初见成效,《梦想的声音》传递了哪些讯号?
  • 儒豹公布2009年4月手机搜索热门关键词排行榜
  • 手机搜索公司公布2008年10月份热搜词
  • 手机搜索11月份热搜排行
  • 儒豹牛年元月手机搜索关键词
  • 手机WiFi万能钥匙查看破解的密码和手机查询命令收集
  • 手机WiFi万能钥匙查看破解的password和手机查询命令收集
  • 01 HTML、HTTP协议
  • 前端初级知识点1
  • 黑马程序员Java零基础视频教程_上部(P1-P80)
  • 网上下载论文时,如何转换成常用的word文档?
  • Java数字金额大写转换
  • 【转载】 -- 15条使人醒悟的生活中的定律
  • 行政大厅导航软件-无需安装APP的手机室内导航软件介绍
  • 再谈1
  • Mysql:索引、事务
  • TomcatJSON parse error: Invalid UTF-8 解决办法
  • 请教一下,用R语音跑大数据,程序报错,不知道错在哪里
  • R编程Error处理手册
  • R:报错“Error in gzfile(file, “wb“) : 无法打开链结”,“‘x‘ must be numeric”及中文路径下利用dev.new()绘图
  • R语言 mice包 Error in terms.formula(tmp, simplify = TRUE) : ExtractVars里的模型公式不对
  • 解决R语言xlsx安装遇到加载rjava报错的问题
  • R语言 cannot open the connection 的解决办法
  • Flume启动错误之:Bootstrap Servers must be specified
  • Error:stack overflow分析
  • openssl 学习之SSL/TLS

初创公司怎么做销售数据分析_我在数据科学初创公司实习的第一周相关推荐

  1. 初创公司怎么做销售数据分析_初创公司与Faang公司的数据科学

    初创公司怎么做销售数据分析 介绍 (Introduction) In an increasingly technological world, data scientist and analyst r ...

  2. 初创公司怎么做销售数据分析_为什么您的初创企业需要数据科学来解决这一危机...

    初创公司怎么做销售数据分析 The spread of coronavirus is delivering a massive blow to the global economy. The lock ...

  3. 数据科学领域有哪些技术_领域知识在数据科学中到底有多重要?

    数据科学领域有哪些技术 Jeremie Harris: "In a way, it's almost like a data scientist or a data analyst has ...

  4. 数据科学项目_完整的数据科学组合项目

    数据科学项目 In this article, I would like to showcase what might be my simplest data science project ever ...

  5. 大数据数据量估算_如何估算数据科学项目的数据收集成本

    大数据数据量估算 (Notes: All opinions are my own) (注:所有观点均为我自己) 介绍 (Introduction) Data collection is the ini ...

  6. 深度学习数据更换背景_开始学习数据科学的最佳方法是了解其背景

    深度学习数据更换背景 数据科学教育 (DATA SCIENCE EDUCATION) 目录 (Table of Contents) The Importance of Context Knowledg ...

  7. 微观计量经济学_微观经济学与数据科学

    微观计量经济学 什么是经济学和微观经济学? (What are Economics and Microeconomics?) Economics is a social science concern ...

  8. 熊猫数据集_熊猫迈向数据科学的第一步

    熊猫数据集 I started learning Data Science like everyone else by creating my first model using some machi ...

  9. 深度学习数据自动编码器_如何学习数据科学编码

    深度学习数据自动编码器 意见 (Opinion) When I first wanted to learn programming, I coded along to a 4 hour long Yo ...

最新文章

  1. 万字解读 | SaaS 行业,如何衡量与优化关键指标?
  2. nodejs后台启动
  3. MySQL的查询缓存
  4. 模块化妙用!用vue3实现一个鼠标追踪器和异步加载组件
  5. python 协程_Python多任务协程
  6. oracle 锁表如何解决_Java高并发解决什么方式
  7. 一级计算机技术,《一级考试大参考》自动化技术、计算机技术.pdf
  8. oracle typehandler,Mybatis实现自定义的类型转换器TypeHandler
  9. 传输层的端口与TCP标志中的URG和PSH位
  10. tcpcopy,模拟在线MySQL压力测试的好帮手
  11. colab 上 tensorflow版本切换
  12. 数据库中外连接的三种形式(左连接,右连接,全连接)
  13. win7科学计算机不支持,win7“不支持的硬件,你的电脑使用的处理器专为最新版win...
  14. 6款实用网页开发和设计工具
  15. 偶然接触oracle中的变量
  16. 一法通 万法通 (清)吴獬 著
  17. 网站SEO优化数据分析之跳出率+停留时间
  18. 51la V6蜘蛛统计功能上新
  19. Linux多个小压缩文件合并一个压缩文件命令
  20. HDOJ题目分类大全

热门文章

  1. python小代码13(递归函数匿名函数)
  2. 第三章 多进程——操作系统最核心的视图
  3. 招商专员笔试题目_招商人员专业试题
  4. php 字符串转化为16进制,php将字符串转换成16进制的方法
  5. 看了做人收获感悟笔记
  6. Java通过-jni调用c语言
  7. vtk.js关于vtkCamera
  8. 00942 ora 表存在_ORA-00942:写入数据库中的表时,表或视图不存在错误
  9. JSP include 和 jsp:include 的区别以及使用include动作指令传递参数
  10. CCActionGird3D源码解析