泰坦尼克号(titanic)数据集字段解释、数据导入实战
泰坦尼克号(titanic)数据集字段解释、数据导入实战
目录
泰坦尼克号(titanic)数据集字段解释、数据导入实战
#数据字段说明
#导入数据
#数据字段说明
# 尽管在沉船事件中幸存下有‘一些运气’因素,但有些人比其他人更容易存活下来,比如女人,孩子和上流社会。
# “最惨的是下流社会的男人”,至少在西方社会是这样的。
#同时也看到了人道的光辉。
passengerid: 乘客 ID
class: 舱位等级 (1 = 1st, 2 = 2nd, 3 = 3rd)**
name: 乘客姓名
sex: 性别
age: 年龄
sibsp: 在船上的兄弟姐妹/配偶个数
parch: 在船上的父母/小孩个数
ticket: 船票信息
fare: 票价
cabin: 客舱
embarked: 登船港口 (C = Cherbourg, Q = Queenstown, S = Southampton)
survived: 变量预测为值 0 或 1(这里 1 表示幸存,0 表示遇难)
pclass: A proxy for socio-economic status (SES) 1st = Upper 2nd = Middle 3rd = Lower
age: Age is fractional if less than 1. If the age is estimated, is it in the form of xx.5
sibsp: The dataset defines family relations in this way… Sibling = brother, sister, stepbrother, stepsister Spouse = husband, wife (mistresses and fiancés were ignored)
parch: The dataset defines family relations in this way… Parent = mother, father Child = daughter, son, stepdaughter, stepson Some children travelled only with a nanny, therefore parch=0 for them.
#导入数据
# df=pd.read_csv("E:\\projects\\EDA\\titanic.csv")
df=pd.read_excel("E:\\projects\\EDA\\titanic.xls")
参考:kaggle
参考:titanic
参考:泰坦尼克号数据集_Kaggle | 泰坦尼克号幸存分析(字段介绍)
泰坦尼克号(titanic)数据集字段解释、数据导入实战相关推荐
- UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战
UCL葡萄酒(red white wine quality)数据集字段解释.数据导入实战 目录 UCL葡萄酒(red white wine quality)数据集字段解释.数据导入实战 #数据字段说明 ...
- R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战
R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...
- R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战
R语言数据包自带数据集之survival包的colon数据集字段解释.数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 ...
- R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战
R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导 ...
- R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战
R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数据 #数 ...
- R语言数据包自带数据集之mtcars数据集字段解释、数据导入实战
R语言数据包自带数据集之mtcars数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之mtcars数据集字段解释.数据导入实战 #会用帮助?或者help函数 #字段说明 #导入包 #导入数据 ...
- Doris Routine Load数据导入实战【每秒导入16w】
Doris Routine Load实战[每秒导入16w] 1. Kafka安装 #1.下载安装包 wget https://dlcdn.apache.org/kafka/3.2.0/kafka_2. ...
- 泰坦尼克号Titanic生存分析(SPSS、R)
目录 泰坦尼克号Titanic生存分析 查看数据基本信息 分析查看其它因子下的存活率情况: 缺失值处理 相关性分析 建立Logistic模型 模型改进 在上述分析的基础上使用其他模型(SVM.随机森林 ...
- MatplotlibSeaborn绘图整理(基于Titanic数据集)【未完待续】
目录 一.Titanic数据集下载 二.Titanic数据集预处理 1数据读取及查看 2数据预处理 三.基于Titanic数据集的Matplotlib&Seaborn绘图 1分布图绘制 1.1 ...
最新文章
- Imagelist 控件
- c语言素数个数_C语言试题及答案
- DEM挖填方分析--基于水平参考面计算
- x210 debug口当普通串口使用
- matlab 类 继承,继承MATLAB中的密封类
- 参考平面及其高度_柱面及其方程
- AWS 人工智能黑客马拉松正式开启!用实力演绎科技向善!
- JZOJ 3504. 运算符(calc)
- 多伦多大学密西莎加计算机科学,解析加国名校多伦多大学密西沙加校区
- mysql 字段存文件_使用数据库(mysql)字段保存文件
- oracle+日誌語句,oracle维护常用sql语句
- 全民健身下的体育消费,是怎么升级的?
- ice 3.6 java_Ice的安装与入门实验(超详细)
- python窗口截图快捷键_python 自定义截图快捷键
- 强化理解指针、指针数组和数组指针(从三味书屋到成华大道)
- 华为高层谈 35 岁危机,程序员如何破年龄之忧?
- 「链节点活动年度总结」2019年区块链行业会议回顾
- TMC4671-LA完全集成伺服控制器电机驱动芯片带FOC控制
- linux下libxml2库使用说明
- dell 笔记本 n卡 deepin驱动