实验背景介绍

了解更多2017云栖大会·成都峰会 TechInsight & Workshop.

本手册为云栖大会Workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《实时数据分析:海量日志数据多维透视》篇所需。主要帮助现场学员熟悉并掌握阿里云数加·分析型数据库AnalyticDB的操作和使用。

实验涉及大数据产品

  • 分析型数据库AnalyticDB

前提准备

必备条件:确保已经获取到实验所需的阿里云账号和密码。

创建AnalyticDB表

通过DMS创建AnalyticDB数据表可以通过可视化建表和SQL窗口建表两种模式。

1.可视化建表

  • step1:进入DMS for AnalyticDB并使用阿里云账号进行登录。
  • step2:选择进入区域华北2,继而点击操作栏中的进入,进入workshop_demo数据库。

  • step3:根据自己获取的阿里云账号后三位数字选择进入对应表组。

【说明】如当前云账号为train00620@aliyun-inc.com,那么选择进入表组workshop_620。

  • step4:右键对应的表组,选择新建表进入可视化创建表模式。

  • step5:配置表名、字段名称、数据类型、主键,选择对应表组、一级分区列和更新方式,如下图所示。

其中表组选择自己云账号对应的表组,一级分区列选择为pv_time,分区方式中的哈希分区数为8.

表属性中表组选择自己账号所对应的表组,表名为pv_abc(abc同为账号后三位数字),如pv_day_620。因为表名在同一个AnalyticDB数据库中应全局唯一。

  • step6:在新建表页面底部,点击保存按钮。
  • step7:在提交变更弹出框中点击确定按钮,直至提示“变更执行成功”,如下图。

2.通过SQL窗口创建表

也可以通过DDL模式创建天浏览量pv的表,pv_day_abc(同上,abc为账号后三位数字)。

  • step1:点击顶部菜单栏中的SQL窗口,进入DDL模式。

  • step2:在SQL窗口中依次复制并执行如下SQL代码。

建表SQL如下:(其中需要注意自己的表名、一级分区列以及建表所属的表组tablegroup属性。)

--统计当天实时浏览量pv
CREATE TABLE pv_day_620 (
pv_time varchar NOT NULL ,
pv_count bigint NOT NULL ,
primary key (pv_time)
)
PARTITION BY HASH KEY(pv_time) PARTITION NUM 8
TABLEGROUP workshop_620
OPTIONS(UPDATETYPE='realtime')
;
  • step3:右键对应的表组,选择刷新查看已经创建成功的表。


由于时间关系,关于区域访问量、按照小时统计浏览量、按设备统计浏览量和统计请求来源量的建表将不在此进行动手操作,但是讲师会给大家讲解。workshop结束后,会将所有指标统计过程的代码开发给大家进行体验。

>>>点击进入《流数据处理:通过StreamSQL分析用户行为》篇

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇...相关推荐

  1. 弄潮儿数据_云数据服务的弄潮儿

    原文链接 作者:Derrick Harris 还记得只能选择两三家云计算数据服务的时候吗?事实上,伴随着云计算的发展,在这几大云平台上已经迅速地构建了很多云数据服务. 本文介绍一些主流并且当前运行良好 ...

  2. 深度数据 点云数据 激光数据

    深度数据:深度图像的外观效果和灰度图像类似,但是深度数据表示的是每个像素点距离深度传感器的实际距离,深度图像和RGB图像的像素点是一一对应的.kinect的红外发射器不断向外发送红外结构光,同时红外接 ...

  3. 《投资时报》报道云创大数据“稳经济”举措

    "紧抓行业未来发展方向,云创数据持续加强对新技术.新产品的创新研发投入,以期构建更强的综合实力壁垒,为"稳经济"做出贡献." 近日,<投资时报>系列 ...

  4. Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

    深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 "昔我十年前,与君始相识." 一瞬间Hadoop也到了要 ...

  5. 无用的“数据”?有用的“大数据”

    "您于14天内到达或途径:'长沙市'.'贵阳市'.'宜宾市'"...... 14亿人,663座城市,960万平方公里,出行信息一码识别,在人海之中将你我精准关联.将出行点滴完整具象 ...

  6. 携手共建国产云生态,巨杉数据库与华云数据完成产品互认证

    日前,由广州巨杉软件开发有限公司与华云数据控股集团有限公司开展的产品兼容测试认证工作顺利完成,经双方共同测试,巨杉数据库SequoiaDB v3.4软件与国产通用型云操作系统安超OS 2020能够稳定 ...

  7. “扎根”信创,华云数据许广彬:做政企上云背后的力量

    ​ 走好自己的路,做好政府和企业用户背后最坚实的力量,帮助他们上好云.用好云. 作者|王修竹 出品|产业家 "云计算与大数据独角兽""中国私有云前三甲企业"&q ...

  8. SDN 云数据中心网络异常行为的智能处理实践

    火炉山蚁群 ┃ 一群自研转型的背锅侠 摘要:云数据中心的网络异常行为不仅对网络设备造成严重业务负荷,同时也显著影响云用户使用感知.云计算环境中的共享资源模式和云用户迥然不同的业务形态,使得云网络分析和 ...

  9. 【PBL项目实战】户外智慧农场项目实战系列——7.Mind+Mixly双平台工业级多合一空气质量传感器数据上云及云端可视化展示

    [PBL项目实战]户外智慧农场项目实战系列--7.Mind+Mixly双平台工业级多合一空气质量传感器数据上云及云端可视化展示 原文链接  https://mp.weixin.qq.com/s/ZEU ...

  10. 天云数据中标某股份制证券公司项目 提供国产企业级人工智能平台服务

    今年4月,某证券有限公司决定就"企业级"人工智能平台产品及技术服务进行招标采购,天云数据中标.标书发出日期为4月1日,投标截止时间为4月21日15:00.不足21天的准备,什么样的 ...

最新文章

  1. ROS_机器人urdf建模仿真实践
  2. TF31003:您的用户帐户没有连接到 Team Foundation Server 的权限
  3. bzoj1045: [HAOI2008] 糖果传递
  4. 变态一把,从internet获取所有手机号以及所在地
  5. 【KMP】重复子串(ybtoj KMP-2)
  6. lppl模型 matlab,对LPPL模型的思考
  7. 如何拿到半数面试公司Offer——我的Python求职之路
  8. eclipse 项目导入时报错invalid project description
  9. 9.6.1 三维数据可视化之散点图
  10. Missing artifact XXXXX:jar:1.9.1 解决错误问题
  11. Python使用Mysql官方驱动(取出dict类型的数据)
  12. 电路布线问题(迷宫问题)
  13. 数学建模——论文排版
  14. Iptables 控制源IP和目的IP来完成访问控制
  15. java面试题学生表成绩表老师表_经典的SQL语句面试题
  16. Oliver Wyman的一年制PTA面试
  17. Apache Jena TDB 常用API
  18. SVN删除tags旧版本失败
  19. 2022年茶艺师(初级)考试题库及茶艺师(初级)作业考试题库
  20. Linux系统内部流量转发机制,使用TC实现基于Linux系统的流量管理

热门文章

  1. 一起来玩树莓派--在docker内安装conda(python3.6)
  2. c++: size_type与 size_t一些概念
  3. Mean Shift算法(2)在OpenCV上的实现目标跟踪——直方图反向投影
  4. 7-176 求n以内最大的k个素数以及它们的和 (20 分)
  5. PAT乙级 1020 月饼
  6. java创建android快捷方式_Android 通过应用程序创建快捷方式
  7. Linux下 查看网络连接状态的命令是,查看Linux操作系统下的网络连接状态命令
  8. c语言双向链表 快速排序,双向链表的快速排序(swift版本)
  9. 怎么增加服务器容量,新睿云服务器硬盘容量怎么增加?
  10. 【LeetCode】智商题 brainteaser(共3题)