什么是数据分析?

数据分析可以描述为清理、转换和处理原始数据以提取可操作的相关信息以帮助企业做出明智决策的过程。数据分析过程提供了有用的见解和统计数据,可以以表格、图表和图形的形式呈现。

在本文中,您将了解如何通过运行 SQL 查询从数据集合中获取有用的信息。此外,您还将学习如何使用图形和图表来呈现该信息。我将使用超市公司不同商店的数据集、PostgreSQL 和 Arctype SQL 客户端。

什么是 PostgreSQL 和 Arctype?

PostgreSQL,也称为 Postgres,是一个免费的开源关系数据库管理系统。Arctype 是一种快速且易于使用的数据库管理工具,用于编写 SQL 查询、构建仪表板以及与您的团队共享数据。

设置 PostgreSQL

要在本教程中使用 Postgres,请导航至Postgres 下载页面并为您的操作系统下载它。它适用于 Linux、macOS 和 Windows。

在您的计算机上安装 Postgres 后,运行以下命令以确认安装。

psql --version

您应该能够看到系统中安装的 Postgres 版本。现在运行如下所示的命令以打开 Postgres 提示符。

sudo -u postgres psql postgres

在命令行上打开 Postgres 后,运行以下命令为 Postgres 设置密码。

\password postgres

要退出 Postgres 提示符,请运行如下所示的命令。

\q

现在让我们在 PostgreSQL 中创建一个名为“超市”的数据库,该数据库将用于存储超市商店 CSV 文件中的数据。我们运行下面的命令。

CREATE DATABASE supermarket;

然后运行如下所示的命令,查看您创建的数据库是否在 Postgres 的数据库列表中。

\l

从下面的屏幕截图可以看出,超市数据库是在 PostgreSQL 中创建的。

Arctype SQL 客户端

要使用 Arctype,请导航至主页并在您的计算机上下载该应用程序。该应用程序可在 Windows、MacOS 和 Linux 上使用。

安装应用程序后,打开它,系统将提示您创建一个帐户,如下所示。

将 Arctype SQL 客户端与 Postgres 集成

创建帐户后,系统将提示您选择数据库。在本例中,选择 Postgres。

下一步是添加 Postgres 凭据以将 Arctype 连接到您的 Postgres 数据库。

根据下面显示的示例填写字段。

  • 名称:超市数据集
  • 主机:127.0.0.1
  • 端口:5432
  • 用户:postgres
  • 密码:*postgres密码*
  • 数据库:超市

注意:使用您在 Postgres 提示符下创建数据库时创建的凭据。

输入 Postgres 凭据后,单击底部的“测试连接”按钮以确保凭据正确。如果凭据正确,点击“测试连接”按钮右侧的“保存”按钮,完成Postgres和Arctype SQL客户端集成,如下图。

使用 Arctype 将 CSV 文件导入 Postgres

我们将导入超市的商店数据集 CSV 文件,您可以通过导航到此Kaggle 网页下载该文件,如下所示。

要使用 Arctype 将 CSV 文件导入 Postgres,请导航至“表”视图。单击表搜索字段旁边的三个点。然后选择“将 CSV 导入表”,如下所示。

接下来,使用出现的文件选择窗口选择您下载的 CSV 文件。选择您的文件并单击“打开”按钮,如下所示。

选择并打开 CSV 文件后,Arctype 将显示 CSV 文件数据的前十行以供预览。如果一切正常,请单击“接受”按钮,如下所示。

单击“接受”按钮后,您将被重定向到配置窗口,如下所示。该窗口允许您确定要将数据存储在何处并选择模式。

如果一切正常,请单击“导入 CSV”按钮开始导入 CSV 文件。打开表数据导入成功;一切都应如下所示。

使用 Arctype 运行 SQL 查询

SQL 查询允许您显示或修改数据库中的数据。在本节中,我将向您展示一些查询,您可以运行这些查询来创建表格、图表或图形来可视化超市的数据。

假设您是超市的老板。您可能想知道有趣的统计数据,例如销售额排名前 10 位的商店。要获得此类见解,您可以运行一个 SQL 查询来创建一个包含前 10 个表现商店的表。然后,您可以通过创建图形或图表来可视化数据。

要使用 Arctype 运行 SQL 查询,请单击 Arctype 窗口右上角的“创建查询”按钮。然后将出现一个屏幕,您可以在其中运行查询,如下所示。

为您的查询指定一个描述性名称,例如“销售额排名前 10 位的商店”。然后编写以下 SQL 查询,根据商店数据确定销售额排名前 10 的商店。

SELECT store_area, store_sales AS Sales FROM stores GROUP BY store_id, store_sales ORDER BY store_sales DESC LIMIT 10;

该查询从商店的表中选择列store_areastore_sales中的数据,其中store_sales已重命名为 Sales。然后数据按名为store_idstore_sales(销售额)的列分组。之后,数据按store_sales 排序,其中销售额从高到低排列。查询将结果限制为前 10 个销售商店区域。

如何使用SQL对数据进行分析和可视化相关推荐

  1. 爬取最好大学网数据、分析并可视化操作

    爬虫爬取数据.分析并可视化操作 本次对最好大学网进行爬虫示例. 1.获取网页响应 def getHTMLText(url):try:resp = request.urlopen(url)html_da ...

  2. 使用python生成词云——聆心云心理健康服务平台数据可视分析和可视化

    实验题目:聆心云心理健康服务平台数据可视分析和可视化 实验目的和要求:统计出在聆心云平台做沙盘游戏的次数.根据各次沙盘游戏所使用的沙具和进行的操作数据进行词云可视化,掌握Python词云制作方法 实验 ...

  3. 对新闻数据的分析与可视化

    该任务是在大学本科的时候的一个小作业,主要是对湾湾的新闻数据进行一个采集分析与可视化,任务比较简单.任务可分为两个部分,一个是爬取中时新闻网站的数据,二是对该数据进行处理与分析. 一.爬取数据数据: ...

  4. Python对阿里巴巴、谷歌、腾讯等六家公司股票数据进行分析与可视化实战(附源码 超详细)

    需要源码请点赞关注收藏后评论区留言私信~~~ 下面针对阿里巴巴.谷歌.亚马逊.Facebook.苹果和腾讯六家公司股票数据进行了分析与可视化描述,数据分析前需要安装互联数据获取包pandas-data ...

  5. 文本数据可视化_非结构化文本数据的分析和可视化

    文本数据可视化 Stuck behind the paywall? Read this article with my friend link here. 卡在收费墙后面? 在这里与我的朋友链接阅读本 ...

  6. java大数据日志分析与可视化设计

    伴随着大数据科技的发展和成熟,越来越多的企业和机构使用大数据来进行分析和决策.其主要的分析数据来源于日志文件,所以对日志文件的分析是很重要的也是很关键的步骤. 本系统实现的功能是,将日志信息生成.日志 ...

  7. 波士顿犯罪数据时空分析及可视化

    文章目录 前言 一.数据描述 二.数据预处理 三.犯罪时空分析 1.犯罪类型分析 2.犯罪时间特征分析 (1)基于年维度 (2)基于月维度 (3)基于日维度 3.犯罪空间特征分析 四.基于犯罪空间理论 ...

  8. Scanpy(六)空间转录组数据的分析与可视化

    目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcriptional simi ...

  9. 【宝可梦数据分析–数据相关性分析及可视化】

    #数据集链接:https://pan.baidu.com/s/1U0XDJmi_lYI84UkPHgpDfA #提取码:1234 #导入相关库并打开CSV文件 import matplotlib.py ...

最新文章

  1. Mysql高级调优篇——第二章:Explain执行计划深度剖析
  2. Kafka团队修改KSQL开源许可,怒怼云厂商
  3. python 关闭窗口事件_python在Linux平台下捕获窗体关闭事件
  4. HTML中的国家名称代码表
  5. python代码设计测试用例_Python单元测试与测试用例简析
  6. java实现多个数字求和_图形化界面
  7. 服务器连交换机配置lacp协议,LACP(链路聚合控制协议)
  8. 二叉堆/二项堆/斐波那契堆
  9. Pazera Free Audio Extractor 中文版 - 轻松将视频背景音乐/对话音频提取出来的免费软件...
  10. matlab中dzdx,MatConvnet工具箱使用手册翻译理解一
  11. # Android12 wifi和4G同时使用
  12. 国外java、IT技术网站
  13. dw html段落首行缩进,使用Dreamweaver8实现文本首行缩进
  14. android 直播推流sdk,Android——直播推流SDK
  15. hdu 4125 Moles
  16. 关于浅拷贝、深拷贝的探究
  17. h61 nvme硬盘_一盒在手,说走就走-ORICO M.2双盘位移动硬盘盒评测
  18. 【JNLP】什么是JNLP
  19. npm ERR! code 128npm ERR! An unknown git error occurrednpm ERR! command git --no-replace-objects l
  20. VSS、VDD 与 VCC 的区别

热门文章

  1. 永远闪亮,网的眼睛 (转)
  2. 4字母域名价值高吗?目前值多少钱?
  3. 自建app服务器架构特点
  4. zabbix配置拓扑图标签及链路流量
  5. 适合小白的 Asyncio 教程!
  6. 加密货币工具和算法大合集
  7. pythonarcgis插件_【直播】基于Python开发ArcGIS插件:Python Add-in丨城市数据派
  8. 2022年G2电站锅炉司炉复习题及模拟考试
  9. 精心总结的表格快捷键
  10. 麻将项目开发--bug mj157