大数据文摘出品

编译:蒋宝尚

今天,文摘菌给大家介绍几个比较有特色的数据科学模块,这些模块原本是一些教师用来进行教学使用,帮助学生有机会使用与其课程相关的数据集,并指导学生进行数据分析以及帮助理解统计和计算机原理。

一起来看~

模块合集链接:

https://ds-modules.github.io/DS-Modules/

Introduction to Phonetics and Phonolog

这个模块由两个实验组成,实验所用到的数据都是学生自己收集的,并且在这个模块中,学生独立分析数据并编码。在第一个实验室里,学生们研究声音开始以及结束的时间,以及母语口语和身高之间的相关性。在第二个实验中,学生分析元音发音,并将研究个体相互比较,从而揭示单个元数据对特征预测能力的影响。该模块适用于没有编码或统计经验的学生。

Neighborhood Mapping

本模块让学生分析并可视化整个东湾人口普查区的社会经济和人口变化情况。学生们到社区进行定性观察,然后与人口普查数据进行比较。把一些的观察结果组合成一幅地图。该模块适用于没有编码或统计经验的学生。

Macroeconomics

这个模块包含一些宏观经济学问题集。 第一个notebook帮助学生使用Latex公式以及教他们如何插图。 第一个notebook的建模部分可视化了索洛增长模型。该模块还使用自动评分功能可以及时反馈学生提交的作业。同样,该模块也适用于没有编码或统计经验的学生

Chinatown and Culture of Exclusion

使用20世纪-21世纪的人口统计数据,让学生分析一个特定的唐人街随着时间的推移是如何变化的。在实验过程中,学生可以使用一些简单的文本分析方法做相关研究。

Implicit Bias and Social Outcomes

本模块向学生介绍相关和回归分析。学生从一个关于健康结果的数据集和一组关于内隐偏见的数据集中挑选出整个美国的县级数据集。然后,他们将这两个数据集合并,并计算相关性和进行回归预测,从而确定偏见与健康结果之间是否存在相关性。

Moral Foundations Theory

这些模块将政治演讲中的词汇使用与道德基础理论联系起来。这些数据的统计推断和可视化帮助学生寻找保守派和自由派总统候选人之间的修辞差异。然后,学生们将数据驱动的方法作为修辞工具进行研究和批判。

Sumerian Text Analysis

本模块使用一个有趣的数据集,即苏美尔文学电子文本语料库(ETCSL)。这些文本是从六千年前的资料中翻译出来的。在本模块中使用的技术在文本分析中不太常见,如k均值、分层聚类和多维缩放。

Data, Prediction, and Law

利用2016年美国总统竞选演讲的数据,学生从语音文本中挖掘特征,可视化这些特征,并用主成分分析提取特征。该模块最后给出了一个三维特征图的例子,此模块需要学生有一些统计学知识。

最后,在次给出项目合集:

https://ds-modules.github.io/DS-Modules/

推荐阅读:

一大批历史精彩文章啦

详解文本分类之多通道CNN的理论与实践

详解文本分类之DeepCNN的理论与实践

介绍4个大神常用而你不常用的python函数

资源 | 邓力、刘洋等合著的这本NLP经典书籍之情感分析中文版

资源 | 有没有必要把机器学习算法自己实现一遍?


资源 | 没有数学和编程基础,这几个数据科学项目了解一下相关推荐

  1. 24个终极数据科学项目(免费获取资源)

    数据科学项目为你在这个领域的深入研究提供了一个基础.通过实际应用,你不仅可以学习数据科学,也能够写在简历中提升你的资历.在这上边花费的时间越多,你学到的知识就越多. 初级--这部分的数据集很容易处理, ...

  2. 资源 | 想进行数据科学项目却没有数据集?26个数据集网站汇总

    导读:如果用一个句子总结学习数据科学的本质,那就是: 学习数据科学的最佳方法就是应用数据科学. 如果你是初学者,那么每完成一个项目你的能力就会大大提高.如果你是有经验的数据科学从业者,那么你应该懂这个 ...

  3. 零基础使用Swift学习数据科学

    概述 Swift正迅速成为数据科学中最强大.最有效的语言之一 Swift与Python非常相似,所以你会发现2种语言的转换非常平滑 我们将介绍Swift的基础知识,并学习如何使用该语言构建你的第一个数 ...

  4. C++编程基础一 01-我的第一个项目

    1 // 01-第一个项目.cpp: 定义控制台应用程序的入口点. 2 // 3 4 #include "stdafx.h" //自己创建的文件. header .h结尾的都是头文 ...

  5. Linux编程基础——GDB(查看数据)

    查看栈信息 当程序被停住了,首先要确认的就是程序是在哪儿被断住的.这个一般是通过查看调用栈信息来看的.在gdb中,查看调用栈的命令是backtrace,可以简写为bt. (gdb) bt     #0 ...

  6. Python编程基础:计算给定数据的几何平均数,即n个数字连乘结果的n次方根

    代码: data_test = [1, 2, 3, 4, 5]def geometric_mean(data): # 计算几何平均数total = 1for i in data:total *= ir ...

  7. ApacheCN 编程/大数据/数据科学/人工智能学习资源 2019.6

    Special Sponsors 我们组织了一个开源互助平台,方便开源组织和大 V 互相认识,互相帮助,整合资源.请回复这个帖子并注明组织/个人信息来申请加入. 请回复这个帖子来推荐希望翻译的内容.如 ...

  8. 揭秘“21世纪最性感的职业”:数学、编程、沟通和商业技能一个都不能少!...

    你的假期已余额不足! 大数据(ID:hzdashuju)在长假期间 给你推送6篇入门级科普,包括: 数据与隐私 | 自动驾驶 | AI与就业 黄金比例 | 量子计算机 | 数据科学职业 另外还为既聪明 ...

  9. 数学是理工基础,如何才能令人信服?

    随着科技的快速发展,人工智能的重要性日渐显现. 而数学知识蕴含着处理智能问题的基本思想与方法,是理解复杂算法的必备要素.在机器学习工作流程中,数学与代码高度交织在一起,代码通常可以根据数学直观地构建, ...

  10. Python编程:从入门到实践+爬虫开发与项目实战+网络编程基础+项目开发实战

    给还在苦苦自学Python的小伙伴们分享一波学习教程~有了它们,至少能节省50%的时间,少走一半的弯路. 书不在多,而在于精~ <Python编程:从入门到实践>豆瓣评分9.2 本书是针对 ...

最新文章

  1. 4一20ma电流有源与无源区别_4-20 mA电流环的工作原理是怎么样的
  2. Linux基础知识——常用shell命令介绍(一)
  3. 第一个OpenGL程序
  4. mongodb清洗数据
  5. Matlab--绘图及坐标轴命令使用示例
  6. c 打印二叉树_基础扩展 | 22. 遍历二叉树—前序遍历算法的VBA代码解析
  7. “绿坝”最终会不了了之
  8. 信号与系统实验六 傅里叶分析方法的应用
  9. Compass的模块介绍
  10. 新浪云SAE共享型数据库MySQL使用经验
  11. E575: viminfo: Illegal starting char in line:
  12. 【JJ斗地主官网下载】在线斗地主比赛赢大奖,中文棋牌游戏
  13. CAD高版本窗体阵列LISP_[转载]AutoCAD高版本怎么把阵列对话框调出来?
  14. 2020.5.31 牛客“科林明伦杯” A.点对最大值【树形dp】
  15. doc转swf,主流文档在线查看解决方案--类似百度文档功能
  16. Disruptor源码解析三 RingBuffer解析
  17. 如何准备测试数据?用 DbUnit 和 Anthill 控制测试环境
  18. DbContext 查询(二)
  19. [HSR算法-Occlusion Culling]
  20. C++生成dll及dll的调用

热门文章

  1. python时序数据分析--以示例说明
  2. oracle常见sql积累
  3. ANDROID AIDL 1
  4. BizTalk开发系列(二十九) 宏的使用
  5. java day06【类与对象、封装、构造方法】
  6. 数据库中字段的类型选择
  7. 虚控件在GUI编程中的应用
  8. django迁移数据库错误
  9. 密码协议(一)协议概述
  10. limit where group by having select