• 计算与推断思维

    • 一、数据科学
    • 二、因果和实验
    • 三、Python 编程
    • 四、数据类型
    • 五、表格
    • 六、可视化
    • 七、函数和表格
    • 八、随机性
    • 九、经验分布
    • 十、假设检验
    • 十一、估计
    • 十二、为什么均值重要
    • 十三、预测
    • 十四、回归的推断
    • 十五、分类
    • 十六、比较两个样本
    • 十七、更新预测
  • 利用 Python 进行数据分析 · 第 2 版
    • 第 1 章 准备工作
    • 第 2 章 Python 语法基础,IPython 和 Jupyter 笔记本
    • 第 3 章 Python 的数据结构、函数和文件
    • 第 4 章 NumPy 基础:数组和向量计算
    • 第 5 章 pandas 入门
    • 第 6 章 数据加载、存储与文件格式
    • 第 7 章 数据清洗和准备
    • 第 8 章 数据规整:聚合、合并和重塑
    • 第 9 章 绘图和可视化
    • 第 10 章 数据聚合与分组运算
    • 第 11 章 时间序列
    • 第 12 章 pandas 高级应用
    • 第 13 章 Python 建模库介绍
    • 第 14 章 数据分析案例
    • 附录 A NumPy 高级应用
    • 附录 B 更多关于 IPython 的内容
  • Python 自然语言处理 第二版
    • 前言
    • 1 语言处理与 Python
    • 2 获得文本语料和词汇资源
    • 3 处理原始文本
    • 4 编写结构化程序
    • 5 分类和标注词汇
    • 6 学习分类文本
    • 7 从文本提取信息
    • 8 分析句子结构
    • 9 构建基于特征的语法
    • 10 分析句子的意思
    • 11 语言学数据管理
    • 后记:语言的挑战
    • 索引
  • 复杂性思维 中文第二版
    • 一、复杂性科学
    • 二、图
    • 三、小世界图
    • 四、无标度网络
    • 五、细胞自动机
    • 六、生命游戏
    • 七、物理建模
    • 八、自组织临界
    • 九、基于智能体的模型
    • 十、兽群、鸟群和交通堵塞
    • 十一、进化
    • 十二、合作进化
    • 附录 A、算法分析
    • 附录 B、阅读列表
  • 数据可视化的基础知识
    • 欢迎
    • 前言
    • 1 简介
    • 2 可视化数据:将数据映射到美学上
    • 3 坐标系和轴
    • 4 颜色刻度
    • 5 可视化的目录
    • 6 可视化数量
    • 7 可视化分布:直方图和密度图
    • 8 可视化分布:经验累积分布函数和 q-q 图
    • 9 一次可视化多个分布
    • 10 可视化比例
    • 11 可视化嵌套比例
    • 12 可视化两个或多个定量变量之间的关联
    • 13 可视化自变量的时间序列和其他函数
    • 14 可视化趋势
    • 15 可视化地理空间数据
    • 16 可视化不确定性
    • 17 比例墨水原理
    • 18 处理重叠点
    • 19 颜色使用的常见缺陷
    • 20 冗余编码
    • 21 多面板图形
    • 22 标题,说明和表格
    • 23 平衡数据和上下文
    • 24 使用较大的轴标签
    • 25 避免线条图
    • 26 不要走向 3D
    • 27 了解最常用的图像文件格式
    • 28 选择合适的可视化软件
    • 29 讲述一个故事并提出一个观点
    • 30 带注解的参考书目
    • 技术注解
    • 参考
  • TutorialsPoint NumPy 教程
  • NumPy 秘籍中文第二版
    • 零、前言
    • 一、使用 IPython
    • 二、高级索引和数组概念
    • 三、掌握常用函数
    • 四、将 NumPy 与世界的其他地方连接
    • 五、音频和图像处理
    • 六、特殊数组和通用函数
    • 七、性能分析和调试
    • 八、质量保证
    • 九、使用 Cython 加速代码
    • 十、Scikits 的乐趣
    • 十一、最新最强的 NumPy
    • 十二、使用 NumPy 进行探索性和预测性数据分析
  • NumPy 初学者指南中文第三版
    • 零、前言
    • 一、NumPy 快速入门
    • 二、从 NumPy 基本原理开始
    • 三、熟悉常用函数
    • 四、为您带来便利的便利函数
    • 五、使用矩阵和 ufunc
    • 六、深入探索 NumPy 模块
    • 七、了解特殊例程
    • 八、通过测试确保质量
    • 九、matplotlib 绘图
    • 十、当 NumPy 不够用时 - SciPy 及更多
    • 十一、玩转 Pygame
    • 附录 A:小测验答案
    • 附录 B:其他在线资源
    • 附录 C:NumPy 函数的参考
  • NumPy 基础知识
    • 零、前言
    • 一、NumPy 简介
    • 二、NumPy ndarray对象
    • 三、使用 NumPy 数组
    • 四、NumPy 核心和子模块
    • 五、NumPy 中的线性代数
    • 六、NumPy 中的傅立叶分析
    • 七、构建和分发 NumPy 代码
    • 八、使用 Cython 加速 NumPy
    • 九、NumPy C-API 简介
    • 十、扩展阅读
  • 精通 NumPy 数值分析
    • 零、前言
    • 一、使用 NumPy 数组
    • 二、NumPy 线性代数
    • 三、使用 NumPy 统计函数对波士顿住房数据进行探索性数据分析
    • 四、使用线性回归预测房价
    • 五、使用 NumPy 对批发分销商的客户进行聚类
    • 六、NumPy,SciPy,Pandas 和 Scikit-Learn
    • 七、高级 NumPy
    • 八、高性能数值计算库概述
    • 九、性能基准
  • NumPy 数组学习手册
    • 零、前言
    • 一、NumPy 入门
    • 二、NumPy 基础
    • 三、使用 NumPy 的基本数据分析
    • 四、使用 NumPy 的简单预测性分析
    • 五、信号处理技术
    • 六、性能分析,调试和测试
    • 七、Python 科学生态系统
  • 精通 SciPy
    • 零、前言
    • 一、数值线性代数
    • 二、插值和近似
    • 三、微分与积分
    • 四、非线性方程式和最优化
    • 五、常微分方程的初值问题
    • 六、计算几何
    • 七、描述性统计
    • 八、推断和数据分析
    • 九、数字图像处理
  • Pandas 秘籍
    • 零、前言
    • 一、Pandas 基础
    • 二、数据帧基本操作
    • 三、开始数据分析
    • 四、选择数据子集
    • 五、布尔索引
    • 六、索引对齐
    • 七、分组以进行汇总,过滤和转换
    • 八、将数据重组为整齐的表格
    • 九、组合 Pandas 对象
    • 十、时间序列分析
    • 十一、Pandas,Matplotlib 和 Seaborn 的可视化
  • Pandas 学习手册中文第二版
    • 零、前言
    • 一、Pandas 与数据分析
    • 二、启动和运行 Pandas
    • 三、用序列表示单变量数据
    • 四、用数据帧表示表格和多元数据
    • 五、数据帧的结构操作
    • 六、索引数据
    • 七、类别数据
    • 八、数值统计方法
    • 九、存取数据
    • 十、整理数据
    • 十一、合并,连接和重塑数据
    • 十二、数据聚合
    • 十三、时间序列建模
    • 十四、可视化
    • 十五、历史股价分析
  • 精通 Pandas
    • 零、前言
    • 一、Pandas 和数据分析简介
    • 二、Pandas 安装和支持软件
    • 三、Pandas 数据结构
    • 四、Pandas 的操作,第一部分 – 索引和选择
    • 五、Pandas 的操作,第二部分 – 数据的分组,合并和重塑
    • 六、处理缺失数据,时间序列和 Matplotlib 绘图
    • 七、统计之旅 – 经典方法
    • 八、贝叶斯统计简介
    • 九、Pandas 库体系结构
    • 十、R 与 Pandas 的比较
    • 十一、机器学习简介
  • NumPy 和 Pandas 数据分析实用指南
    • 零、前言
    • 一、配置 Python 数据分析环境
    • 二、探索 NumPy
    • 三、NumPy 数组上的运算
    • 四、Pandas 很有趣! 什么是 Pandas?
    • 五、Pandas 的算术,函数应用以及映射
    • 六、排序,索引和绘图
  • 精通 Pandas 探索性分析
    • 零、前言
    • 一、处理不同种类的数据集
    • 二、数据选择
    • 三、处理,转换和重塑数据
    • 四、像专业人士一样可视化数据
  • Matplotlib 3.0 秘籍
    • 零、前言
    • 一、Matplotlib 的剖析
    • 二、基本绘图入门
    • 三、绘制多个图表和子图
    • 四、开发可视化来提高发布质量
    • 五、使用高级功能的绘图
    • 六、嵌入文本和表达式
    • 七、以不同格式保存图形
    • 八、开发交互式绘图
    • 九、在图形用户界面中嵌入绘图
    • 十、使用mplot3d工具包绘制 3D 图形
    • 十一、使用axisartist工具包
    • 十二、使用axes_grid1工具包
    • 十三、使用 Cartopy 工具包绘制地理地图
    • 十四、使用 Seaborn 工具包的探索性数据分析
  • Matplotlib 绘图秘籍
    • 零、前言
    • 一、第一步
    • 二、自定义颜色和样式
    • 三、处理标注
    • 四、处理图形
    • 五、文件输出
    • 六、处理地图
    • 七、处理 3D 图形
    • 八、用户界面
  • UCSD COGS108 数据科学实战中文笔记
    • 零、数据科学实战
    • 一、Jupyter 笔记本
    • 二、数据分析
    • 三、Python
    • 四、Python 中的数据科学
    • 五、数据收集
    • 六、数据整理
    • 七、数据清理
    • 八、数据隐私和匿名化
    • 九、使用 Python 进行数据可视化
    • 十、分布
    • 十一、检验分布
    • 十三、普通最小二乘
    • 十四、线性模型
    • 十五、聚类
    • 十六、降维
    • 十七、分类
    • 十八、自然语言处理
    • 附录一、有用的 Python 数据科学包
    • 附录二、git/Github 版本控制工具
  • USF MSDS501 计算数据科学中文讲义
    • 一、起步

      • 1.1 一些动机(音频处理)
      • 1.2 Python 工具的初次尝试
      • 1.3 播放声音
    • 二、设计和构建程序
      • 2.1 编程导论
      • 2.2 在内存中表示数据
      • 2.3 计算模型
      • 2.4 Python 中的编程模式
      • 2.5 数据别名
      • 2.6 使用函数组织你的代码
      • 2.7 如何阅读代码
      • 2.8 面向对象编程
    • 三、关键编程模式
      • 3.1 加载文件
      • 3.2 数据帧
      • 3.3 操纵和可视化数据
    • 四、用于计算和优化的迭代式方法
      • 4.1 生成均匀的随机数
      • 4.2 近似平方根
      • 4.3 单变量梯度下降
    • 五、常见编程工具
      • 5.1 使用 bash 走向胜利
      • 5.2 使用 git 版本控制工具
      • 5.3 在 Amazon Web Services 上启动虚拟机
    • 六、可选
      • 6.1 链表
  • fast.ai 数值线性代数讲义中文版 v2
    • 一、我们为什么在这里
    • 二、SVD 背景消除
    • 三、使用 NMF 和 SVD 的主题建模
    • 四、随机化 SVD
    • 五、LU 分解
    • 六、使用鲁棒回归的 CT 扫描的压缩感知
    • 七、线性回归和健康结果
    • 八、如何实现线性回归
    • 九、PageRank 和特征值分解
    • 十、实现 QR 分解
  • 社交媒体挖掘
    • 第一部分 数据挖掘

      • 1 应了解的编程语言
      • 2 从哪里获取数据
      • 3 用代码获取数据
      • 4 收集自己的 FACEBOOK 数据
      • 5 抓取实时站点
    • 第二部分 数据分析
      • 6 数据分析导论
      • 7 数据可视化
      • 8 数据分析的高级工具
      • 9 在 REDDIT 数据中寻找趋势
      • 10 测量公众人物的 Twitter 活动
      • 11 何去何从
    • 附录
      • 1 编写程序通过 API 获取网站的信息
      • 2 通过解析网页直接获取哔哩某播主的详细信息
      • 3 在离线表格软件中打开和处理 csv 文件
  • 数据科学和人工智能技术笔记
    • 一、向量、矩阵和数组
    • 二、数据准备
    • 三、数据预处理
    • 四、图像预处理
    • 五、文本预处理
    • 六、日期时间预处理
    • 七、特征工程
    • 八、特征选择
    • 九、模型验证
    • 十、模型选择
    • 十一、线性回归
    • 十二、逻辑回归
    • 十三、树和森林
    • 十四、K 最近邻
    • 十五、支持向量机
    • 十六、朴素贝叶斯
    • 十七、聚类
    • 十八、Keras
    • 十九、数据整理(上)
    • 十九、数据整理(下)
    • 二十、数据可视化
    • 二十一、统计学
  • Python 和 Jupyter 机器学习入门
    • 零、前言
    • 一、Jupyter 基础知识
    • 二、数据清理和高级机器学习
    • 三、Web 爬取和交互式可视化
  • Python 数据科学和机器学习实践指南
    • 零、前言
    • 一、入门
    • 二、统计和概率回顾和 Python 实践
    • 三、Matplotlib 和高级概率概念
    • 四、预测模型
    • 五、Python 机器学习
    • 六、推荐系统
    • 七、更多数据挖掘和机器学习技术
    • 八、处理真实数据
    • 九、Apache Spark-大数据机器学习
    • 十、测试与实验设计
  • 精通 Python 数据科学
    • 零、前言
    • 一、原始数据入门
    • 二、推断统计
    • 三、大海捞针
    • 四、通过高级可视化感知数据
    • 五、发现机器学习
    • 六、使用线性回归执行预测
    • 七、估计事件的可能性
    • 八、使用协同过滤生成建议
    • 九、使用集成模型扩展边界
    • 十、通过 K 均值聚类应用细分
    • 十一、通过文本挖掘分析非结构化数据
    • 十二、在大数据世界中利用 Python
  • Python 数据科学本质论
    • 零、前言
    • 一、第一步
    • 二、数据整理
    • 三、数据管道
    • 四、机器学习
    • 五、可视化,见解和结果
    • 六、社交网络分析
    • 七、超越基础的深度学习
    • 八、大数据和 Spark
    • 九、加强您的 Python 基础
  • 数据科学思想
    • 零、前言
    • 一、开发人员对数据科学的看法
    • 二、使用 Jupyter 笔记本和 PixieDust 的大规模数据科学
    • 三、PixieApp 深入了解
    • 四、使用 PixieGateway 服务器将 PixieApp 部署到 Web
    • 五、最佳实践和高级 PixieDust 概念
    • 六、TensorFlow 图像识别
    • 七、大数据和 Twitter 情感分析
    • 八、金融时间序列分析和预测
    • 九、使用图的美国国内航班数据分析
    • 十、最终思想
    • 十一、附录 A:PixieApp 快速参考
  • Python 仿真建模实用指南
    • 序言
    • 第一部分:数值仿真入门
      • 一、仿真模型简介
      • 二、理解随机性和随机数
      • 三、概率和数据生成过程
    • 第二部分:仿真建模算法与技术
      • 四、探索蒙特卡罗仿真
      • 五、基于仿真的马尔可夫决策过程
      • 六、重采样方法
      • 七、利用仿真改进和优化系统
    • 第三部分:实际应用
      • 八、将仿真模型用于金融工程
      • 九、使用神经网络仿真物理现象
      • 十、项目管理建模与仿真
      • 十一、下一步是什么?

下载

Docker

docker pull apachecn0/apachecn-ds-zh
docker run -tid -p <port>:80 apachecn0/apachecn-ds-zh
# 访问 http://localhost:{port} 

PYPI

pip install apachecn-ds-zh
apachecn-ds-zh <port>
# 访问 http://localhost:{port} 

NPM

npm install -g apachecn-ds-zh
apachecn-ds-zh <port>
# 访问 http://localhost:{port} 

贡献指南

本项目需要校对,欢迎大家提交 Pull Request。

请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)

组织介绍

访问我们的主页。

赞助我们

通过平台自带的打赏功能,或点击这里。

ApacheCN 数据科学译文集 20211109 更新相关推荐

  1. ApacheCN 数据科学译文集 20210313 更新

    新增了五个教程: Python 和 Jupyter 机器学习入门 零.前言 一.Jupyter 基础知识 二.数据清理和高级机器学习 三.Web 爬取和交互式可视化 Python 数据科学和机器学习实 ...

  2. ApacheCN 数据科学译文集 2020.8

    协议:CC BY-NC-SA 4.0 不要担心自己的形象,只关心如何实现目标.--<原则>,生活原则 2.3.c 在线阅读 ApacheCN 面试求职交流群 724187166 Apach ...

  3. ApacheCN Asp.NET 译文集 20211126 更新

    ASP.NET Core2 基础知识 零.前言 一.搭建舞台 二.控制器 三.视图 四.模型 五.验证 六.路由 七.RestBuy 八.添加功能.测试和部署 ASP.NET Core3 和 Angu ...

  4. ApacheCN 深度学习译文集 20210125 更新

    新增了七个教程: PyTorch 中文官方教程 1.7 学习 PyTorch PyTorch 深度学习:60 分钟的突击 张量 torch.autograd的简要介绍 神经网络 训练分类器 通过示例学 ...

  5. ApacheCN 深度学习译文集 20210112 更新

    新增了六个教程: TensorFlow 2 和 Keras 高级深度学习 零.前言 一.使用 Keras 入门高级深度学习 二.深度神经网络 三.自编码器 四.生成对抗网络(GAN) 五.改进的 GA ...

  6. ApacheCN 深度学习译文集 20201229 更新

    新增了七个教程: TensorFlow 和 Keras 应用开发入门 零.前言 一.神经网络和深度学习简介 二.模型架构 三.模型评估和优化 四.产品化 TensorFlow 图像深度学习实用指南 零 ...

  7. ApacheCN 深度学习译文集 20201218 更新

    新增了四个教程: Python 人工智能中文版 0 前言 1 人工智能简介 2 人工智能的基本用例 3 机器学习管道 4 特征选择和特征工程 5 使用监督学习的分类和回归 6 集成学习的预测分析 7 ...

  8. ApacheCN C/C++ 译文集 20211201 更新

    笨办法学C 中文版 前言 导言:C的笛卡尔之梦 练习0:准备 练习1:启用编译器 练习2:用Make来代替Python 练习3:格式化输出 练习4:Valgrind 介绍 练习5:一个C程序的结构 练 ...

  9. ApacheCN Java 译文集 20210921 更新

    ApacheCN Java 译文集 20210921 更新 新增了五个教程: Java 设计模式最佳实践 零.前言 一.从面向对象到函数式编程 二.创建型模式 三.行为模式 四.结构模式 五.函数式模 ...

  10. ApacheCN 大数据译文集 20211206 更新

    PySpark 大数据分析实用指南 零.前言 一.安装 Pyspark 并设置您的开发环境 二.使用 RDD 将您的大数据带入 Spark 环境 三.Spark 笔记本的大数据清理和整理 四.将数据汇 ...

最新文章

  1. Python笔记(2)函数
  2. 一道百度算法面试题讲解
  3. CheLunTan.Net无需注册同样享有发帖和回帖权利
  4. 借助Java 8和lambdas,可以一起使用AssertJ和Awaitility
  5. 在Packet Tracer中路由器静态路由配置
  6. 新鲜出炉!大规模神经网络最新综述!
  7. TypeScript入门教程 之 Promise
  8. poj 3260 The Fewest Coins(多重背包+完全背包)
  9. ASP.NET会话(Session)模式
  10. c语言中文内码,用C语言实现常见的三种中文内码转换
  11. 苹果摄像头黑屏_品牌借势:苹果12发布会,王守义十三香领衔,杜蕾斯再出手...
  12. 挂科心得: 驾校重要 教练更加重要(转)
  13. 图像处理——分水岭算法
  14. Android 三大图片缓存原理、特性对比
  15. 笔记本电脑安装CentOS7
  16. vue-video-play使用方法
  17. Unity DOTS 学习笔记2 - 面向数据设计的基本概念(上)
  18. Oracle课程-深入学习文档
  19. #学习笔记#模板语法
  20. cytoscape安装java_搭建java环境——安装GSEA和Cytoscape

热门文章

  1. Telink BDT 的使用方法
  2. 记录This request has been blocked; the content must be served over HTTPS.
  3. 解决Go服务GC时间过长
  4. 能解方程的计算机在线计算,解方程计算器在线计算
  5. jQuery 梁桐老师笔记 - 选择器
  6. mysql 唯一记录_在数据库中能够唯一地标识一个记录被称为 MySQL数据库使用教程...
  7. python 图像相似度;用0-1矩阵表示两幅图像的相似度
  8. 程序员年薪百万,原来是吃到了这样的红利!
  9. 利用python读取SEGY格式数据,主要用于对其快速解析及统计分析。
  10. 上传Android library到JitPack