通过hadoop上的hive完成WordCount

启动hadoop

ssh localhost
cd /usr/local/hadoop
./sbin/start-dfs.sh
cd /usr/local/hive/lib
service mysql start
start-all.sh

Hdfs上创建文件夹

hdfs dfs -mkdir test1
hdfs dfs -ls /user/hadoop

上传文件至hdfs

hdfs dfs -put ./try.txt test1
hdfs dfs -ls /user/hadoop/test1

启动Hive

hive

创建原始文档表

create table docs(line string)

导入文件内容到表docs并查看

load data inpath '/user/hadoop/tese1/try.txt' overwrite into table docs
select * from docs

  

用HQL进行词频统计,结果放在表word_count里

create table word_count as select word,count(1) as count from (select explode(split(line," ")) as word from docs) word group by word order by word;

  

查看统计结果

show tables;
select * from word_count;

转载于:https://www.cnblogs.com/a565810497/p/9046919.html

hive基本操作与应用相关推荐

  1. Hive基本操作,DDL操作(创建表,修改表,显示命令),DML操作(Load Insert Select),Hive Join,Hive Shell参数(内置运算符、内置函数)等

    1.  Hive基本操作 1.1DDL操作 1.1.1    创建表 建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_nam ...

  2. hive 时间转字符串_2. HIVE 基本操作

    2.1 create table 2.1.1 总述 l CREATE TABLE 创建一个指定名字的表.如果相同名字的表已经存在,则抛出异常:用户可以用 IF NOT EXIST 选项来忽略这个异常. ...

  3. hive(2)——hive基本操作

    前提:开启hadoop,关闭safe模式(关闭safe模式命令:hdfs dfsadmin -safemode leave) (1)创建一个数据库hive_test (2)切换到hive_test ( ...

  4. Hive基本操作入门

    规则语法 大小写规则: 1. hive的数据库名.表名都不区分大小写 2. 建议关键字大写 命名规则: 1. 名字不能使用数字开头 2. 不能使用关键字 3. 尽量不使用特殊符号 库操作语法 创建数据 ...

  5. 【Hive】Hive基本操作

    文章目录 1.创建DataBase 2.查看DataBase相关信息 3.删除DataBase 4.Hive表操作 4.1 创建一个名为cat的表,有两个字段,cat_id,cat_name类型为st ...

  6. 大数据----Hive学习(6)----Hive 基本操作4

    文章目录 函数 1 系统内置函数 2 常用内置函数 2.1 空字段赋值 2.2 CASE WHEN THEN ELSE END 2.3 行转列 2.4 列转行 2.5 窗口函数(开窗函数) 2.6 R ...

  7. 【Hive】hive基本操作 ddl dml

    文章目录 1. ddl 操作 1.1库操作 1.1.1 创建库 1.1.2 查看库 1.1.3 切换库 1.1.4 删除库 1.2 表操作 1.2.1 创建表 1.2.1.0 建表语法及解释 1.2. ...

  8. Hive体系结构(三)元数据库与基本操作

    Hive体系结构(一)架构与基本组成 Hive体系结构(二)Hive的执行原理.与关系型数据库的比较 Hive体系结构(三)元数据库与基本操作 Hive体系结构(四)注意事项与扩展特性 1. Hive ...

  9. Hive的基本操作总结

    文章目录 目录 前言: 1.Hive基本操作 1.1.DDL操作 1.2.DML操作 1.3.Hive Join 总结: 目录 前言: 对于Hive来说最重要的一点就是能够用Hql来进行数据分析.而H ...

最新文章

  1. bom中的event以及一些window的API
  2. Promise 上手
  3. LeetCode 222. 完全二叉树的节点个数(二分查找)
  4. Lua 学习笔记(四)语句与控制结构
  5. php 导出excel 2007,使用PHPExcel导出Excel表
  6. openstack创建的实例不能使用ssh登录
  7. C# 获取当前执行程序路径 获取路径 上上层目录 上层目录
  8. Web开发常用代码:背投广告
  9. 【FPGA教程案例33】通信案例3——基于FPGA的BPSK调制信号产生,通过matlab测试其星座图
  10. hbuilder阻止返回退出的另一种方式
  11. linux设置合上电脑,CentOS7设置笔记本合盖不休眠
  12. SDNU QLU 2022.10.15 新生赛
  13. JAVA_协同过滤算法商品推荐
  14. CH340驱动:出现预安装成功,却没有检测到驱动
  15. 如何实现计算机对人脑的模拟,计算机大脑模拟技术
  16. 使用Django在执行python manage.py startapp myApp创建应用
  17. 学到长痘之 - Spring Boot
  18. ASP.NET Core 正确获取查询字符串参数
  19. 盘点 | 2022年上半年国内的电邮安全事件
  20. 苹果手机丢了如何通过定位找回?iPhone手机丢失定位找回方法

热门文章

  1. 波士顿房价预测学习项目笔记
  2. 斯坦佛编程教程-Unix编程工具(四)
  3. COM 组件设计与应用(六)——用 ATL 写第一个组件(vc.net)
  4. 浅析Struts 体系结构与工作原理(图)
  5. Java多线程编程实战:模拟大量数据同步
  6. OSError: Could not find library geos_c or load any of its variants ['libgeos_c.so.1', 'libgeos_c.so
  7. Qt浅谈之一:内存泄露(总结)
  8. PHP中MD5函数漏洞
  9. Scala 深入浅出实战经典 第96讲:Akka第一个案例动手实战main方法实现中ActorSystem等代码详解...
  10. Unity3D脚本属性