ImmutableBytesWritable其实就是hbase把其封装成的rowkey,如果要通过collect算子收集到客户端driver,涉及到序列化的操作:

new SparkConf().set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

接下来如果要打印出rowkey:

hbaseRDD.map {//new String(rowkey.get()),new String(res.getRow)都可以拿到rowkeycase (rowkey, res) => (new String(rowkey.get()),new String(res.getRow))}

即可

spark里的hbase的ImmutableBytesWritable的打印问题scala相关推荐

  1. Spark 下操作 HBase

    HBase经过七年发展,终于在今年2月底,发布了 1.0.0 版本.这个版本提供了一些让人激动的功能,并且,在不牺牲稳定性的前提下,引入了新的API.虽然 1.0.0 兼容旧版本的 API,不过还是应 ...

  2. java spark环境配置文件_JAVA, SCALA, HADOOP, SPARK里的JAVA_HOME和环境变量设置

    /etc/profile里添加的内容: export JAVA_HOME=/jdk export HADOOP_HOME=/hadoop export SCALA_HOME=/scala export ...

  3. 如何设置EXCEL里标题在每页都打印?

    如何设置EXCEL里标题在每页都打印? "文件"--"页面设置"--"工作表"--点一下"顶端行标题"的红色小键头--用 ...

  4. IDEA 本地调试spark程序 Exception in thread main java.lang.NoSuchMethodError: scala.collection.immutable.

    1.很简单的一测试程序: 2.run运行时:出现ERROR,报错行显示在  new SparkContext 这行. val sc = new SparkContext(conf) Exception ...

  5. spark大批量读取Hbase时出现java.lang.OutOfMemoryError: unable to create new native thread

    这个问题我去网上搜索了一下,发现了很多的解决方案都是增加的nproc数量,即用户最大线程数的数量,但我修改了并没有解决问题,最终是通过修改hadoop集群的最大线程数解决问题的. 并且网络上的回答多数 ...

  6. 2.4-2.5、Hive整合(整合Spark、整合Hbase)、连接方式Cli、HiveServer和hivemetastore、Squirrel SQL Client等

    2.4其它整合 2.4.1Hive整合Spark Spark整合hive,需要将hive_home下的conf下的hive_site.xml放到spark_home下的conf目录下.(3台服务器都做 ...

  7. 干货:Spark RDD写入HBase 优化

    文章目录 一.HBase部分 1-1.hbase.regionserver.handler.count 1-2.压缩 1-3.分裂 1-4.hbase.regionserver.optionallog ...

  8. 大数据相关书籍(包含Java, Scala, R, Linux, Spark, Hadoop, Hive, Hbase, Sqoop, Flume, Strom)

    下面书单,有一部分英文版原版,当然价格也相对高一点,英文版部分需要在在亚马逊搜索 ,中文版大部分在京东有售! <Hadoop核心技术> 翟周伟 著 <Storm分布式实时计算模式 & ...

  9. python使用spark-sql读取数据并可视化_使用Spark SQL读取HBase上的数据

    近日,由华为团队开发的 1.基于部分评估技术,该项目具有强大的数据剪枝和智能扫描特点: 2.支持自定义过滤规则.协处理器等以便支持超低延迟的处理: 3.支持SQL.DataFrame: 4.支持更多的 ...

最新文章

  1. 独家 | 改善AI性别偏见的4种方法
  2. jsp页面发生异常跳转到友好页面
  3. jdk1.8 ::构造函数_在JDK 8中可通过反射获得构造函数/方法参数元数据
  4. rust房屋建造蓝图_都说蓝图,而不是白图、红图,你知道为什么?
  5. java编程有什么独特之处?
  6. python 相关性检验怎么计算p值_不会Python进行时间序列预测?不要紧,大神来教你...
  7. Java B2B2C多用户商城 springboot架构 (五)springboot整合 beatlsql
  8. 第八章:在Spark集群上掌握比较重要的图操作之Property Operators(2)
  9. linux 查看防火墙对应的进程,Linux系统防火墙进程查看的实用方法
  10. 关于打开NVIDIA控制面板闪退问题
  11. android wps页面设置背景图片,如何给手机版WPS的文档设置图片背景
  12. java动态数组大总结
  13. 建立民间贷款集资合法化
  14. 索尼电视android屡次停止,索尼电视撤回安卓8.0固件包:存在无法连接WiFi问题
  15. discuz模板机制解析
  16. 再见,拼多多!再见,黄铮!
  17. automated creative optimization for e-commerce advertising
  18. MathorCup大数据竞赛B题Baseline(持续更新)
  19. StrongSwan安装部署、配置使用方法总结
  20. C++之父B. Stroustrup近期言论

热门文章

  1. vim 命令学习(高级篇)
  2. kbmMW功能 - kbmMWProcess单元(转帖)
  3. mock平台架构及实现
  4. leetcode - Missing Ranges
  5. 关于“因为数据库正在使用,所以无法获得对数据库的独占访问权”的最终解决方案...
  6. linux实验报告用户管理,Linux实验报告-用命令实现用户和组的管理
  7. [系统安全] 九.Windows漏洞利用之MS08-067远程代码执行漏洞复现及深度防御
  8. [LeetCode] Invert Binary Tree - 二叉树翻转系列问题
  9. 5.2 部分依赖图 (Partial Dependence Plot, PDP)
  10. G6 图可视化引擎——简介