分析工作试用期收获

Have you been hearing the new industry buzzword — Data Analytics(it was AI-ML earlier) a lot lately? Does it sound complicated and yet simple enough? Understand the logic behind models but don't know how to code? Apprehensive of spending too much time learning to code before jumping on the bandwagon?

您最近是否经常听到新的行业流行语-Data Analytics( 早于AI-ML) ? 听起来复杂但足够简单吗? 了解模型背后的逻辑,但不知道如何编码? 担心在投入潮流之前花太多时间学习编码吗?

Worry not, there are some awesome tools available for free for non-coders that can help develop complicated models in no time. These tools are completely free for personal use, extremely easy and intuitive and can help one practice without the hassle of learning how to code.

不用担心,有一些很棒的工具可供非编码器免费使用,这些工​​具可以立即帮助开发复杂的模型。 这些工具完全免费供个人使用,非常简单直观,可以帮助一种实践,而无需学习如何编写代码。

I am an amateurish coder but a big machine learning enthusiast. I can code but I avoid it as much as I can (Thank God for that Recording Macro option in Excel), till the point I cannot avoid it.

我是一个业余编码员,但是非常喜欢机器学习。 我可以编写代码,但我会尽量避免(感谢上帝,感谢Excel中的那个Recording Macro选项),直到无法避免为止。

I was working on developing a model for forecasting traffic on a road and had to try a lot of things when I started looking for non-coder resources and found these gems. I am discussing the best three I found. Again, these are open source for individual users but have priced versions for commercial uses.

我当时正在开发一种用于预测道路交通量的模型,当我开始寻找非编码器资源并发现这些宝石时,不得不尝试很多事情。 我正在讨论我发现的最好的三个。 同样,这些是面向个人用户的开源软件,但是具有商业用途的定价版本。

这些工具不能做什么 (What These Tools Cannot Do)

Please be aware, although these tools remove the need for coding, your understanding of models, basics of data preparation, and statistics should be above the bare minimum. The reason is that when you code, you exactly know what is being done and how, while in most of these tools, default parameters are preloaded, and sometimes the code is not visible to the user. Thus it is easy for model errors to go unnoticed in case the user does not do a thorough QA.

请注意,尽管这些工具消除了对编码的需求,但是您对模型的理解,数据准备的基础知识和统计信息应该高于最低要求。 原因是在编写代码时,您确切地知道正在执行的操作以及如何执行操作,而在大多数这些工具中,默认参数是预加载的,有时代码对用户不可见。 因此,如果用户没有进行全面的质量检查,很容易引起模型错误的注意。

In addition to this, these tools will not tell you which data cleaning technique to use, which model to build, or which statistic to compare instead, the tools will let you do all the above tasks easily and give you more time to think and analyze data.

除此之外,这些工具不会告诉您使用哪种数据清除技术,要构建哪种模型或要比较哪种统计量,这些工具将使您轻松地完成上述所有任务,并给您更多的时间进行思考和分析数据。

Now that you have read all the warnings let us directly dive in.

现在您已经阅读了所有警告,让我们直接潜入。

1. Knime Analytics (1. Knime Analytics)

This is by far, the best tool in the open source domain.

到目前为止,这是开源领域中最好的工具。

Knime is a very intuitive platform that helps create models using drag and drop nodes in a workflow kind of environment. It is built on python, has widgets for data input, data cleaning, modeling (regression, clustering, classification, Neural Networks, etc), statistics, and majorly used representations.

Knime是一个非常直观的平台,可在工作流环境中使用拖放节点帮助创建模型。 它基于python构建,具有用于数据输入,数据清理,建模(回归,聚类,分类,神经网络等),统计信息和主要使用的表示形式的小部件。

It is has a desktop version (I love it) and a Server version for people who want to develop and deploy these model workflows on the web. Installing Knime on your machine is fairly easy, and using it is even more. Below is an example of an NN Model.

它有一个台式机版本( 我喜欢它 )和一个服务器版本,供希望在网络上开发和部署这些模型工作流的人们使用。 在您的计算机上安装Knime非常容易,使用它甚至更多。 以下是NN模型的示例。

There are nodes for every action needed to build a Neural Network. Importing the data, partitioning it, feeding a part to a learner, a predictor (test set), and then a scorer for checking the accuracy of the model. Parameters can be set in nodes that are connected to each other using connectors and can be executed in sequence.

建立神经网络所需的每个动作都有节点。 导入数据,对其进行分区,将零件馈给学习者,预测变量(测试集),然后馈给评分员以检查模型的准确性。 可以在使用连接器相互连接的节点中设置参数,并且可以依次执行。

Credits — Knime Workspace on my Desktop
积分-我桌面上的Knime工作区

2.橙色 (2. Orange)

Orange is an open source machine learning, data visualization, and analysis tool. Orange also works on widgets arranged in a workflow pattern and has some specialized libraries for specific tasks (time series, bioinformatics, etc).

Orange是开源的机器学习,数据可视化和分析工具。 Orange还可以处理按工作流程模式排列的小部件,并具有一些用于特定任务(时间序列,生物信息学等)的专用库。

Orange’s UI is more fluid but its node list is less exhaustive than Knime. It has numerous visualization options and can produce decent data analytics. It is built on python and can help create and evaluate models for regression, classification, NN, clustering, time series among other things.

Orange的UI更加流畅,但其节点列表不如Knime详尽。 它具有多种可视化选项,可以进行体面的数据分析。 它基于python构建,可以帮助创建和评估模型以进行回归,分类,NN,聚类,时间序列等。

Orange Website-Orange网站

3.蓝天统计 (3. BlueSky Statistics)

Bluesky is an R based tool that can be used for data modeling and visualizations. It is open source and available for desktops. It has a rich GUI and it can help ease the learning curve for R newbies as for each function the R code is visible.

Bluesky是基于R的工具,可用于数据建模和可视化。 它是开源的,可用于台式机。 它具有丰富的GUI,它可以帮助R新手简化学习过程,因为R代码可见的每个功能。

BlueSky lacks workflow style architecture & node functionality. Instead, it has functions listed under tabs similar to MS Office ribbon tabs. The beauty of BlueSky is that it is built on R which is an incredibly powerful language for statistical data analysis. It has command editor and as the code is completely visible to the user, it is extremely easy for users to modify the code as they like it. It ensures that regular users of R can save a considerable amount of time using this application.

BlueSky缺乏工作流样式的体系结构和节点功能。 相反,它具有类似于MS Office功能区选项卡的选项卡下列出的功能。 BlueSky的优点在于它基于R,R是一种用于统计数据分析的功能强大的语言。 它具有命令编辑器,并且由于代码对用户完全可见,因此用户可以轻松地随意修改代码。 它确保R的普通用户可以使用此应用程序节省大量时间。

Credits — BlueSky Stats User Manual
积分-BlueSky Stats用户手册

There are numerous data analytics tools available in the market but most of them are not open source. This makes it difficult for individual users who are still in the exploratory phases of data science.

市场上有许多数据分析工具,但是其中大多数不是开源的。 这使得仍处于数据科学探索阶段的个人用户很难。

These three tools are my top favorite to dabble with small Data Analytics problems. They can save an immense amount of time for newbies who might be daunted with the idea of learning to code.

这三个工具是我最喜欢的小数据分析问题。 对于那些可能对学习编码的想法望而却步的新手来说,它们可以节省大量时间。

This list is based on tools available in late 2019. I will update this if I find any more similar tools. I hope you find this story helpful in beginning your journey into Data Analytics!

该列表基于2019年末可用的工具。如果我发现更多类似的工具,我将对其进行更新。 我希望您发现这个故事对您开始数据分析之旅有所帮助!

翻译自: https://towardsdatascience.com/explore-data-analytics-with-zero-coding-skills-for-free-f2c982d1e2d6

分析工作试用期收获


http://www.taodudu.cc/news/show-997386.html

相关文章:

  • 残疾科学家_数据科学与残疾:通过创新加强护理
  • spss23出现数据消失_改善23亿人口健康数据的可视化
  • COVID-19研究助理
  • 缺失值和异常值的识别与处理_识别异常值-第一部分
  • 梯度 cv2.sobel_TensorFlow 2.0中连续策略梯度的最小工作示例
  • yolo人脸检测数据集_自定义数据集上的Yolo-V5对象检测
  • 图深度学习-第2部分
  • 量子信息与量子计算_量子计算为23美分。
  • 失物招领php_新奥尔良圣徒队是否增加了失物招领?
  • 客户细分模型_Avarto金融解决方案的客户细分和监督学习模型
  • 梯度反传_反事实政策梯度解释
  • facebook.com_如何降低电子商务的Facebook CPM
  • 西格尔零点猜想_我从埃里克·西格尔学到的东西
  • 深度学习算法和机器学习算法_啊哈! 4种流行的机器学习算法的片刻
  • 统计信息在数据库中的作用_统计在行业中的作用
  • 怎么评价两组数据是否接近_接近组数据(组间)
  • power bi 中计算_Power BI中的期间比较
  • matplotlib布局_Matplotlib多列,行跨度布局
  • 回归分析_回归
  • 线性回归算法数学原理_线性回归算法-非数学家的高级数学
  • Streamlit —使用数据应用程序更好地测试模型
  • lasso回归和岭回归_如何计划新产品和服务机会的回归
  • 贝叶斯 定理_贝叶斯定理实际上是一个直观的分数
  • 文本数据可视化_如何使用TextHero快速预处理和可视化文本数据
  • 真实感人故事_您的数据可以告诉您真实故事吗?
  • k均值算法 二分k均值算法_使用K均值对加勒比珊瑚礁进行分类
  • 衡量试卷难度信度_我们可以通过数字来衡量语言难度吗?
  • 视图可视化 后台_如何在单视图中可视化复杂的多层主题
  • python边玩边学_边听边学数据科学
  • 边缘计算 ai_在边缘探索AI!

分析工作试用期收获_免费使用零编码技能探索数据分析相关推荐

  1. python生物数据分析师职业技能_数据分析师需要什么技能,数据分析行业都有什么职业?...

    就目前而言,很多人看到了数据分析行业的光明前景,于是就想进入数据分析的行业中,但是,想成为一名合格的数据分析师,需要掌握很多的技能,那么一名合格的数据分析师需要掌握哪些技能呢?现在的数据分析行业中有数 ...

  2. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  3. 用python处理excel数据做函数_如何使用python通过函数式编程完成excel中的数据处理及分析工作...

    Excel是数据分析中最常用的工具,本篇文章通过python与excel的功能对比介绍如何使用python通过函数式编程完成excel中的数据处理及分析工作.在Python中pandas库用于数据处理 ...

  4. lisp6 暖通cad_CAD迷你看图软件_CAD制图工具下载_免费CAD软件下载-华军纯净下载

    大小:554 MB更新时间:2020-05-28软件授权:国产软件 Unity3D2018官方版是一款高效专业的3D游戏开发引擎工具,Unity3D2018官方版便捷实用,号称是最好用的AR和vr开发 ...

  5. 软件测试职业规划、简历编写 面试真题分析 工作日常

    一 卡诺模型 基本型需求 期望型需求 兴奋型需求 二 模型分析 1.对于软件测试工程师来说,需要明确划分自己的三种产品需求 2.确定需求之后,测试优先级划分:基本性需求>期望型需求>兴奋型 ...

  6. 每天都有所收获_使技术保持最新状态会有所收获

    每天都有所收获 感到筋疲力尽? 没有灵感? 或更糟糕的是失业? 也许是时候更新您停滞不前的技能以接管当前公司中的出色新项目,或者使您的简历脱颖而出了. 我的技术出版事业已经持续了将近二十年,因为出版是 ...

  7. 用Excel完成专业化数据统计、分析工作

    使用Excel可以完成很多专业软件才能完成的数据统计.分析工作,比如:直方图.相关系数.协方差.各种概率分布.抽样与动态模拟.总体均值判断,均值推断.线性.非线性回归.多元回归分析.时间序列等.本专题 ...

  8. 罗塞达石碑(Rosetta Stone)V3.3.0-Languages-如师通_免费安卓版

    罗塞达石碑(Rosetta Stone)V3.3.0-Languages-如师通_免费安卓版 Rosetta Stone让您随时随地学好外语 下载地址:http://putpan.com/fs/eWi ...

  9. 工作后,如何免费查论文

    工作后,如何免费查论文 毕业后不能像在学校一样享受下载免费论文的待遇了.免费论文.毕业论文.各专业论文在哪里可以下载?如果你的学校图书馆有数据库,那当然是优先选择,很多学校购买了期刊的数据,校园网内可 ...

最新文章

  1. max7219c语言,(转)MAX7219 C语言版驱动程序
  2. Linux集群和自动化维1.4.2 优化Linux下的内核TCP参数以提高系统性能
  3. Top-down与Bottom-up
  4. RocketMQ报错 service not available now, maybe disk full, CL: 0.95 CQ: 0.95 INDEX: 0.95, maybe
  5. 5万字、97 张图总结操作系统核心知识点
  6. 【hadoop权威指南第四版】第四章hadoop的IO【笔记+代码】
  7. 国内AGV机器人厂家数目统计及区域分布分析
  8. 是否还为制作PPT而烦恼?珍藏的PPT实用网站打包送给你!
  9. Unity 中英文互译插件
  10. iOS 设置导航栏全透明
  11. 2018-2019金融周期下的武汉楼市和政策解析
  12. SN74LVC1G08DBVR
  13. 微信支付 SDK 惊现重大漏洞:黑客可 0 元购买任意商品
  14. ip地址转换成16进制long
  15. BIM+9大技术,你知多少?
  16. 产品交付周期计算公式_使用周期时间指标优化工程团队的交付
  17. R语言在线地图神器:Leaflet for R包(二)基础底图
  18. pytorch版本和cuda版本对应
  19. 逆向工程---IA32寄存器
  20. 使用buildroot构建根文件系统遇到问题【已解决】

热门文章

  1. java----DBUtils知识点补充
  2. 第九篇 并发(进程和线程)
  3. 使用IDEA创建Maven项目和Maven使用入门(配图详解)
  4. Tengine HTTPS原理解析、实践与调试【转】
  5. CLR 与 C++的常用类型转换笔记
  6. VC++和VC++.NET中与图像处理有关的几个概念、结构和类
  7. [个人推荐]函数式编程另类指南[zz]
  8. 一、创建Assetbundle 在unity3d开发的游戏中,无论模型,音频,还是图片等,我们都做成Prefab,然后打包成Assetbundle,方便我们后面的使用,来达到资源的更新。
  9. Ralink5350开发环境搭建
  10. 项目总结SpringMVC相关