此文为翻译pyspark 2.0.2,主要介绍pyspark相关使用方法。原文链接问 —— [ Apache pyspark ]

pyspark.sql module

导入Spark SQL和DataFrames包:

-pyspark.sql.SparkSession
-pyspark.sql.DataFrame
-pyspark.sql.Column
-pyspark.sql.Row
-pyspark.sql.DataFrameNaFunctions
-pyspark.DataFrameStatFunctions
-pyspark.sql.Functions
-pyspark.sql.types
-pyspark.sql.Window

A SparkSession can be used create DataFrame, register DataFrame as tables, execute SQL over tables, cache tables, and read parquet files. To create a SparkSession, use the following builder pattern:

spark = SparkSession.builder \.master("local") \.appName("Word Count") \.config("spark.some.config.option", "some-value")\ .getOrCreate()
>>> l = [('Alice', 1)]
>>> spark.createDataFrame(l).collect()
[Row(_1=u'Alice', _2=1)]
>>> spark.createDataFrame(l, ['name', 'age']).collect()
[Row(name=u'Alice', age=1)]>>> d = [{'name': 'Alice', 'age': 1}]
>>> spark.createDataFrame(d).collect()
[Row(age=1, name=u'Alice')]>>> rdd = sc.parallelize(l)
>>> spark.createDataFrame(rdd).collect()
[Row(_1=u'Alice', _2=1)]
>>> df = spark.createDataFrame(rdd, ['name', 'age'])
>>> df.collect()
[Row(name=u'Alice', age=1)]

Pyspark官方文档相关推荐

  1. spark之4:基础指南(源自官方文档)

    spark之4:基础指南(源自官方文档) @(SPARK)[spark, 大数据] spark之4基础指南源自官方文档 一简介 二接入Spark 三初始化Spark 一使用Shell 四弹性分布式数据 ...

  2. spark官方文档_Spark机器学习之Pipeline

    部门的大数据平台支持spark编程了,赶紧跟上步伐看能把分析水平提高到哪一个台阶! 底层是基于数平TDW的,对编程接口进行了封装,管道使用的是 from lib.pipeline import MLP ...

  3. Spark官方文档整理:spark-core

    Spark 官方文档 1,spark 概述 Apache Spark 是一个快速通用的集群计算系统,它提供了提供了java,scala,python和R的高级API,以及一个支持一般图计算的优化引擎. ...

  4. OpenCV-Python官方文档学习笔记(上)

    整理自OpenCV-Python官方文档 一. OpenCV-Python Tutorials 1 安装及验证 2 图片读写,展示 3 视频读写,展示 4 绘图功能(绘制几何形状:线.圆.椭圆.矩形. ...

  5. Ant Design 入门-参照官方文档使用组件

    微信小程序开发交流qq群   173683895    承接微信小程序开发.扫码加微信. 先来一个按钮组件使用的对比,官方文档的(不能直接用)和实际能用的. 官网demo: import { Tabl ...

  6. 坑爹的微软官方文档:SQL无人值守安装

    我在部署项目的时候,需要用批处理无人值守安装SQLserver,.Net等组件. 于是查了微软官方文档,其中一项内容如下: http://msdn.microsoft.com/zh-cn/librar ...

  7. Tomcat官方文档关于数据源配置的内容

    虽然有网上有网友自己总结的文章,但说明得总是不够清晰,还是参考官方文档理解得比较透彻: http://tomcat.apache.org/tomcat-7.0-doc/jdbc-pool.html h ...

  8. python-66:BS4实例--下载BS4官方文档

    2019独角兽企业重金招聘Python工程师标准>>> 前面已经对BS4有了简单的认识和讲解,该讲的都讲了,原本也已经想好了一个实例,但是现在想往后推一推,因为我实在受不了了,我们前 ...

  9. k8s多master建议用几个_Kubernetes 教程之跟着官方文档从零搭建 K8S

    前言 本文将带领读者一起, 参照者 Kubernetes 官方文档, 对其安装部署进行讲解. Kubernetes 更新迭代很快, 书上.网上等教程可能并不能适用于新版本, 但官方文档能. 阅读这篇文 ...

最新文章

  1. 项目Alpha冲刺 10
  2. python爬虫系列:12306票务信息爬虫
  3. cocos2dx标准容器_cocos2dx[3.2](24)——内存管理机制
  4. C++和C#的指针小解
  5. 数据结构栈的知识_数据知识栈
  6. 说三件切身利益的大事!一定要看 减少损失
  7. using filesort和using temporary
  8. TableViewCell,TableView,UITableViewCell
  9. monkey命令详解(二)
  10. 第10章 评价分类结果 学习上
  11. 芒果iOS开发之Swift教程01-Swift基础
  12. Android布局——小米便签编辑界面xml
  13. android发现u盘自动安装apk,安卓自动识别U盘中APK文件并进行安装操作
  14. 6 errors and 0 warnings potentially fixable with the `--fix` option.
  15. python多个if_Python之条件判断/if嵌套/如何写嵌套代码
  16. 感染人数已经超过6千,何时达到峰值?数学统计建模分析告诉你
  17. 设计水杯,门锁的测试用例
  18. 方兴未艾的CORBA
  19. 随机森林python
  20. confluence 使用笔记

热门文章

  1. postgresql仅修改时间戳的时分秒写法
  2. excel转html乱码,EXCEL表格中数字乱码是什么原因?
  3. Double转BigDecimal并保留两位小数出现异常: java.lang.ArithmeticException: Rounding necessary
  4. Ubuntu发烧友三部曲
  5. 身份证男女识别---非线性问题01
  6. manjaro双屏显示
  7. 筑讯建筑:北京玫瑰博物馆——镂空的玫瑰盒子,从建筑外观判断建筑功用
  8. 使用canvas画二维码
  9. python+cv2+pyzbar 二维码画框、角度
  10. python的matplotlib库