数仓工具—Hive实战之UDF汉字首字母(22)
UDF 汉字首字母
今天这个业务背景其实很简单,就是公司有很多品牌,我们要提取每个名牌的第一个汉字的首字母,例如"宝马"就是 B , 然后"福特" 就是F,“长安” 就是C 。
业务背景差不多就是这样的,关于UDF 我就不再过多介绍了,已经介绍过无数次了,你可以参考前面的文章
- Hive实战之UDF分词
- Hive实战之UDF解析IP地址
- Hive实战之UDF 加密
- Hive 实战之UDF 复杂JSON 处理
所以这里我们直接上代码,出解决思路就可以了
pinyin4j 获取汉字的拼音
pinyin4j是一个开源的流行java库
- 官网地址:http://pinyin4j.sourceforge.net/
- 在线文档:http://pinyin4j.sourceforge.net/pinyin4j-doc/ )
使用来处理中文转换成拼音(汉语拼音,罗马拼音等),功能强大。
添加依赖
数仓工具—Hive实战之UDF汉字首字母(22)相关推荐
- 数仓工具—Hive实战之 UDF GIS(16)
UDF GIS 什么是GIS GIS,全称Geographic Information System(地理信息系统), 也称为Geographic Information Science,即地理信息科 ...
- 数仓工具—Hive实战之full join 经典案例(13)
full join 经典案例 full join 增量数据同步更新 我们知道我们的数仓数据很大一部分是来自业务数据库的,那么这个时候我们数据同步的方式有两种一种是增量同步一种是全量同步,那么这个时候我 ...
- 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步.增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数据进行累计,从而产出计算结果. ...
- 数仓工具—Hive实战之对比分析(15)
对比分析 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,当然最终的目的 .它可以非常直观地看出事物某方面的变化或差距,并且可以准确.量 ...
- 数仓工具—Hive实战之滑动/滚动时间窗口计算(19)
时间滑动计算 今天遇到一个需求大致是这样的,我们有一个业务涉及到用户打卡,用户可以一天多次打卡,我们希望计算出7天内打卡8次以上,且打卡时间分布在4天以上的时间,当然这只是个例子,我们具体解释一下这个 ...
- 数仓工具—Hive实战之占比同比环比(10)
同比环比的计算 测试数据 1,2020-04-20,420 2,2020-04-04,800 3,2020-03-28,500 4,2020-03-13,100 5,2020-02-27,300 6, ...
- 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间:或则适用于数据会发生变化,但是大部分是不变的 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的设计: 有一些表的数据量很大,比如一 ...
- 数仓工具—Hive实战之日活跃周活跃月活(12)
日活跃周活跃月活 日活的定义非常简单,就是今日活跃的用户数,因为定义很简答,所以逻辑很简单,因此它的计算也非常简单.虽然简单,但是它却是我们的业务上非常重要的一个计算指标 日活会受到很多因素的影响,产 ...
- 数仓工具—Hive实战之自关联经典案例(11)
自关联经典案例 其实说到关联我相信很多人都知道,自关联其实是关联的一种,其实我们最常见的是两张不同的表之间的关联,但其实工作中我们能看到的其实还有一种关联,那就是一张表与它自己关联. 下面我们就通过几 ...
最新文章
- 【Java】基本二叉搜索树讲解
- android多行文本框hint居中,在安卓等移动浏览器中placeholder中的文字不垂直居中问题...
- 【分布式】Zookeeper请求处理
- 【全记录】2017云栖大会·北京峰会——企业云上业务优化专场
- 基于几何距离的椭圆拟合
- 一个基于Microsoft Azure、ASP.NET Core和Docker的博客系统
- 简单的01背包和完全背包
- Fork / Join框架vs并行流vs.ExecutorService:最终的Fork / Join基准
- pmd 设置默认规则,只要使用了该规则集就自动使用
- 从Demo到Engine(二) -- Render Queue Sort
- 百面机器学习—13.L1正则化与稀疏性
- MCSA Server 2012 R2 Passthrough Disk
- MCP3421高精度ADC转换器
- 一、rsync +cwrsync实现windows和linux的文件同步
- Matlab机器人工具箱(Robotics Toolbox)学习笔记
- 洛谷P1330 封锁阳光大学(BFS, 并查集)
- 渣土车识别YOLOv5
- 2023 年腾讯云服务器配置价格表出炉(2核2G/2核4G/4核8G/8核16G、16核32G)
- 数据库应用最基础知识!
- 国家质量基础设施(NQI)“一站式”公共服务平台建设方案
热门文章
- 一个学校组织的计算机网络属于,计算机网络基础知识试题及答案
- 小米手机进行测试uiautomator出现的故障
- 老电脑拯救计划——将机械盘的系统迁移到SSD
- 弗洛伊德算法(Java)
- 本地资源库,中央资源库,远程资源库的介绍
- ubuntu apt update时W: GPG error http://ppa.launchpad.net lucid Release没有公钥无法验证NO_PUBKEY签名问题解决
- Python——函数的嵌套
- React教程(二):React组件基础
- c语言打开关闭文件的顺序,C语言1-文件概述、文件的打开与关闭、顺序读写数据文件(1).docx...
- android+饭否+开源,安能饭否:开源的饭否Android客户端