Python之pyarrow:pyarrow的简介、安装、使用方法之详细攻略

目录

pyarrow的简介

1、项目的主要组成部分包括:

2、Arrow特点

pyarrow的安装

pyarrow的使用方法


pyarrow的简介

用于Apache Arrow的Python库。这个库为Arrow c++库提供的功能提供了Python API,以及用于与panda、NumPy和Python生态系统中的其他软件进行箭头集成和互操作性的工具。Apache Arrow是一个用于内存分析的开发平台。它包含一组技术,使大数据系统能够快速处理和移动数据。

1、项目的主要组成部分包括:

  • The Arrow Columnar In-Memory Format: a standard and efficient in-memory representation of various datatypes, plain or nested
  • The Arrow IPC Format: an efficient serialization of the Arrow format and associated metadata, for communication between processes and heterogeneous environments
  • The Arrow Flight RPC protocol: based on the Arrow IPC format, a building block for remote services exchanging Arrow data with application-defined semantics (for example a storage server or a database)
  • C++ libraries
  • C bindings using GLib
  • C# .NET libraries
  • Gandiva: an LLVM-based Arrow expression compiler, part of the C++ codebase
  • Go libraries
  • Java libraries
  • JavaScript libraries
  • Plasma Object Store: a shared-memory blob store, part of the C++ codebase
  • Python libraries
  • R libraries
  • Ruby libraries
  • Rust libraries

2、Arrow特点

  • Format: Apache Arrow为平面和层次数据定义了一种与语言无关的柱状内存格式,这种格式的组织用于在现代硬件(如cpu和gpu)上进行高效的分析操作。Arrow内存格式还支持零拷贝读取,用于不需要序列化开销的闪电般的数据访问。
  • Libraries: Arrow的库实现了这种格式,并为一系列用例提供了构建块,包括高性能分析。许多流行的项目使用箭头有效地发送柱状数据,或者作为分析引擎的基础。库可用于C、c++、c#、Go、Java、JavaScript、MATLAB、Python、R、Ruby和Rust。请参阅如何安装和启动。
  • Ecosystem:Apache Arrow是由开发人员社区创建并为其服务的软件。我们致力于开放、友好的沟通和协商一致的决策。我们的提交者来自不同的组织和背景,我们欢迎所有人与我们一起参与。

pyarrow的安装

pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple pyarrow

pyarrow的使用方法

Join the mailing list: send an email to dev-subscribe@arrow.apache.org. Share your ideas and use cases for the project.
Follow our activity on JIRA
Learn the format
Contribute code to one of the reference implementations

Python之pyarrow:pyarrow的简介、安装、使用方法之详细攻略相关推荐

  1. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  2. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  3. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  4. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  5. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  6. Python:numpy库中的一些函数简介、使用方法之详细攻略

    Python:numpy库中的一些函数简介.使用方法之详细攻略 目录 numpy库中的一些函数简介.使用方法 1.np.concatenate() 1.1.函数案例 1.2.函数用法 numpy库中的 ...

  7. Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略

    Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...

  8. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  9. BigData之Hive beeline:beeline的简介、使用方法之详细攻略

    BigData之Hive beeline:beeline的简介.使用方法之详细攻略 目录 beeline的简介 beeline的使用方法 1.命令行参数解释 2.beeline的输出格式 2.1.ta ...

  10. ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略

    ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...

最新文章

  1. C语言中auto,register,static,const,volatile的区别
  2. ASP.Net面向对象思想
  3. 常见的安全应用识别技术有哪些?
  4. Docker / 深入理解的容器和镜像
  5. 单调队列优化的背包问题
  6. linux之SQL语句简明教程---SUBSTRING
  7. linux下怎么编译运行C语言程序?
  8. 如何做一个高效率的程序员,对程序员也是很重要。。
  9. 基于Spring Security的认证授权_认证原理_授权流程_Spring Security OAuth2.0认证授权---springcloud工作笔记126
  10. RBM,DBM和DBN之间有什么区别?
  11. php留言板的实验步骤,php留言板实训报告.docx
  12. matlab 颜色代码 大全_空客 | 红、绿、蓝、白,各类颜色代码的含义
  13. 高通QCA9531方案定制开发主板300M 2.4G无线模块面板AP wifi路由模块 用的是什么网络变压器
  14. NFT平台Chair.finance获得Polygon Grant及生态支持
  15. 创灵原始与鸿蒙,上古启示录
  16. Chrome\Edge 更新后访问网站变慢或加载不出来,其他浏览器正常
  17. CodeBlocks 主题美化(编辑器修改主题)
  18. GeoTool常见问题
  19. linux pthread_attr_destory()
  20. 应用及实例,在信用卡业务中的数据挖掘技术分析

热门文章

  1. 数字图像处理实验(12):PROJECT 05-03,Periodic Noise Reduction Using a Notch Filter
  2. Linux下打造仿Mac系统桌面
  3. python包里面的dll是什么_Python中的包ImportError
  4. pthread_join
  5. ubuntu9.10 qq自动退出修复
  6. Ubuntu9.10下安装Thinkpad T400 R29无线网卡
  7. 详谈调用winpcap驱动写arp多功能工具
  8. EasyUI + Bootstrap 界面整合
  9. dos通过for命令截取字符串
  10. 常见宽带错误解决方法