Pyspark官方文档
此文为翻译pyspark 2.0.2,主要介绍pyspark相关使用方法。原文链接问 —— [ Apache pyspark ]
pyspark.sql module
导入Spark SQL和DataFrames包:
-pyspark.sql.SparkSession
-pyspark.sql.DataFrame
-pyspark.sql.Column
-pyspark.sql.Row
-pyspark.sql.DataFrameNaFunctions
-pyspark.DataFrameStatFunctions
-pyspark.sql.Functions
-pyspark.sql.types
-pyspark.sql.Window
A SparkSession can be used create DataFrame, register DataFrame as tables, execute SQL over tables, cache tables, and read parquet files. To create a SparkSession, use the following builder pattern:
spark = SparkSession.builder \.master("local") \.appName("Word Count") \.config("spark.some.config.option", "some-value")\ .getOrCreate()
>>> l = [('Alice', 1)]
>>> spark.createDataFrame(l).collect()
[Row(_1=u'Alice', _2=1)]
>>> spark.createDataFrame(l, ['name', 'age']).collect()
[Row(name=u'Alice', age=1)]>>> d = [{'name': 'Alice', 'age': 1}]
>>> spark.createDataFrame(d).collect()
[Row(age=1, name=u'Alice')]>>> rdd = sc.parallelize(l)
>>> spark.createDataFrame(rdd).collect()
[Row(_1=u'Alice', _2=1)]
>>> df = spark.createDataFrame(rdd, ['name', 'age'])
>>> df.collect()
[Row(name=u'Alice', age=1)]
Pyspark官方文档相关推荐
- spark之4:基础指南(源自官方文档)
spark之4:基础指南(源自官方文档) @(SPARK)[spark, 大数据] spark之4基础指南源自官方文档 一简介 二接入Spark 三初始化Spark 一使用Shell 四弹性分布式数据 ...
- spark官方文档_Spark机器学习之Pipeline
部门的大数据平台支持spark编程了,赶紧跟上步伐看能把分析水平提高到哪一个台阶! 底层是基于数平TDW的,对编程接口进行了封装,管道使用的是 from lib.pipeline import MLP ...
- Spark官方文档整理:spark-core
Spark 官方文档 1,spark 概述 Apache Spark 是一个快速通用的集群计算系统,它提供了提供了java,scala,python和R的高级API,以及一个支持一般图计算的优化引擎. ...
- OpenCV-Python官方文档学习笔记(上)
整理自OpenCV-Python官方文档 一. OpenCV-Python Tutorials 1 安装及验证 2 图片读写,展示 3 视频读写,展示 4 绘图功能(绘制几何形状:线.圆.椭圆.矩形. ...
- Ant Design 入门-参照官方文档使用组件
微信小程序开发交流qq群 173683895 承接微信小程序开发.扫码加微信. 先来一个按钮组件使用的对比,官方文档的(不能直接用)和实际能用的. 官网demo: import { Tabl ...
- 坑爹的微软官方文档:SQL无人值守安装
我在部署项目的时候,需要用批处理无人值守安装SQLserver,.Net等组件. 于是查了微软官方文档,其中一项内容如下: http://msdn.microsoft.com/zh-cn/librar ...
- Tomcat官方文档关于数据源配置的内容
虽然有网上有网友自己总结的文章,但说明得总是不够清晰,还是参考官方文档理解得比较透彻: http://tomcat.apache.org/tomcat-7.0-doc/jdbc-pool.html h ...
- python-66:BS4实例--下载BS4官方文档
2019独角兽企业重金招聘Python工程师标准>>> 前面已经对BS4有了简单的认识和讲解,该讲的都讲了,原本也已经想好了一个实例,但是现在想往后推一推,因为我实在受不了了,我们前 ...
- k8s多master建议用几个_Kubernetes 教程之跟着官方文档从零搭建 K8S
前言 本文将带领读者一起, 参照者 Kubernetes 官方文档, 对其安装部署进行讲解. Kubernetes 更新迭代很快, 书上.网上等教程可能并不能适用于新版本, 但官方文档能. 阅读这篇文 ...
最新文章
- 项目Alpha冲刺 10
- python爬虫系列:12306票务信息爬虫
- cocos2dx标准容器_cocos2dx[3.2](24)——内存管理机制
- C++和C#的指针小解
- 数据结构栈的知识_数据知识栈
- 说三件切身利益的大事!一定要看 减少损失
- using filesort和using temporary
- TableViewCell,TableView,UITableViewCell
- monkey命令详解(二)
- 第10章 评价分类结果 学习上
- 芒果iOS开发之Swift教程01-Swift基础
- Android布局——小米便签编辑界面xml
- android发现u盘自动安装apk,安卓自动识别U盘中APK文件并进行安装操作
- 6 errors and 0 warnings potentially fixable with the `--fix` option.
- python多个if_Python之条件判断/if嵌套/如何写嵌套代码
- 感染人数已经超过6千,何时达到峰值?数学统计建模分析告诉你
- 设计水杯,门锁的测试用例
- 方兴未艾的CORBA
- 随机森林python
- confluence 使用笔记
热门文章
- postgresql仅修改时间戳的时分秒写法
- excel转html乱码,EXCEL表格中数字乱码是什么原因?
- Double转BigDecimal并保留两位小数出现异常: java.lang.ArithmeticException: Rounding necessary
- Ubuntu发烧友三部曲
- 身份证男女识别---非线性问题01
- manjaro双屏显示
- 筑讯建筑:北京玫瑰博物馆——镂空的玫瑰盒子,从建筑外观判断建筑功用
- 使用canvas画二维码
- python+cv2+pyzbar 二维码画框、角度
- python的matplotlib库