1.创建pyspark与mongodb的连接,首先加载依赖包,其有三种方式:

1)直接将其放在在安装spark的jars目录下;

2)在spark_submit中,添加依赖包信息;

3)在创建spark的对象的时候添加依赖信息,具体案例如下图所示

spark = SparkSession
.builder
.appName(‘mongo connection’)
.config(“spark.mongodb.input.uri”, “mongodb://节点:端口号/dev.myCollection?readPreference=primaryPreferred”)
.config(“spark.mongodb.output.uri”, “mongodb://节点:端口号/dev.myCollection”)
.config(‘spark.jars.packages’, “org.mongodb.spark:mongo-spark-connector_2.11:2.4.2”)
.getOrCreate()
备注:

config的信息,都可以在spark_submit中添加。

2.读取mongodb

df1 = (
spark.read
.format(“mongo”)
.option(“database”, ‘dev’)
.option(“collection”, ‘test_mongo_connect’)
.load()
)

3.写入mongodb

df = spark.createDataFrame([(1,), (2,)], [‘a’])
(
df.write
.format(“mongo”)
.mode(“overwrite”)
.option(“database”, ‘dev’)
.option(“collection”, ‘test_mongo_connect’)
.save()
)

pyspark-mongo-input-output相关推荐

  1. 关于OSD::mkfs: ObjectStore::mkfs failed with error (5) Input/output error问题的解决

    环境: ceph L版本12.2.1升级到12.2.12 这个问题是由于升级后进行12.2.12环境中的使用ceph-disk 进行osd部署时出现如下问题,执行命令 ceph-disk -v pre ...

  2. 报错解决transmission: Error: Input/Output error和ls: reading directory '': Input/output error

    transmission: Error: Input/Output error 晚上想用transmission下载新的种子时报错:Error: Input/Output error. 我很奇怪,先运 ...

  3. python3 报错 [Errno 5] Input/output error 没有stdout时使用了print

    过程描述 刚不久用 Tornado 写了一个项目,本打算部署在 Nginx 上,但是因为公司的一些原因就没有使用 Nginx,直接在命令行中启动 当我从命令行以后台的方式启动以后,是可以正常访问的 p ...

  4. colab出现input output error问题

    原因是文件太多,清理一下回收站,尝试用先从 !cp path/to/data.csv local.csv 为什么 drive.mount() 有时会失败,并提示"超时"?为什么在通 ...

  5. Debug Tensorflow: TypeError: Cannot convert a symbolic Keras input/output to a numpy array.

    问题 'Cannot convert a symbolic Keras input/output to a numpy array. ' TypeError: Cannot convert a sym ...

  6. Angular中父子组件传值@Input @Output @ViewChild最全面最简单的总结

    父组件传递给子组件: 值传递方式:@Input既可以传递数据也可以传递方法 传递数据(不举例了) 传递方法 // 父组件定义方法 parentRun(){alert('这是父组件的 run 方法'); ...

  7. html5 填表 表单 input output 与表单验证

    1.<output>     Js计算结果 <form οninput="res.value = num1.valueAsNumber*num2.valueAsNumber ...

  8. linux-x86_64 error,Linux-x86_64 Error: 5: Input/output error的问题

    今天朋友的测试库报错, ORA-27072: File I/O error, Linux-x86_64 Error: 5: Input/output error,数据块已经不能正常启动,看到 Linu ...

  9. docker中java应用new FileOutputStream直接报Input/output error

    为什么80%的码农都做不了架构师?>>>    一个docker容器中跑着java应用,是一个定时任务,每天拉取远端文件包存到本机,命名为:decrypt-20181020 就在这一 ...

  10. 硬盘故障时如何强制关机:Input/output error

    如果硬盘可能会出现锁死或坏道的故障,会造成SHELL命令的失效,包括 reboot,powoff,,shutdown,用正常的命令是没法完成重启的. 执行这些命令,会出现如下IO报错: reboot ...

最新文章

  1. 酷!一键构建我自己的PHP框架的开发环境
  2. 独家 | 成功开发者必备的5项软技能
  3. AAAI 2021放榜:你中了几篇?
  4. ExtJS的xtype列表
  5. WTM系列视频教程:CodeFirst
  6. java 如何导出json文件_java导出json格式文件的示例代码
  7. 组合数学 —— 组合数取模 —— 卢卡斯定理与扩展卢卡斯定理
  8. 2T以上的盘怎么分区, 利用parted创建 linuxTB硬盘GPT分区
  9. MCS-51子程序库-1
  10. ASCII码中文对照表
  11. 中国AI专利数稳居第一!世界各国AI专利深度盘点
  12. 英语语法篇 - 动词的分类和形式
  13. 迅雷发布共享计算与区块链生态 开放技术红利
  14. cv2颜色空间(2)——交互式的颜色检测
  15. 波束形成算法学习笔记之一(Endfire,broadside)
  16. python读书心得体会范文_个人读书心得体会范文五篇
  17. Java面试宝典(2019版)
  18. Windows下打开命令窗口几种方式
  19. AD19画板外框形状失败的解决办法
  20. 【Acm】算法之美—Crashing Balloon

热门文章

  1. 2020年国际学术会议参考列表
  2. 春天来了,苹果M2芯片3月面世!全线换新,单核性能远超M1 Max
  3. 教育部:“博士分流淘汰制”真来了!不合格的导师,退出!
  4. 深度学习准「研究僧」预习资料:图灵奖得主Yann LeCun《深度学习(Pytorch)》春季课程...
  5. 11岁少女叫板支付宝!会写代码的孩子,到底多可怕?
  6. Python设计模式-装饰器模式
  7. Django博客系统(详情页面展示)
  8. DRF工程搭建、环境安装与配置
  9. pandas高级处理-交叉表与透视表
  10. 防火墙产品原理与应用:防火墙产品的技术及实现关于IPV6【寒假】