【Kaggle】FIFA球员数据可视化分析(一)
文章目录
- 前言
- 一、目标
- 二、步骤
- 1.处理数据
- 2.构造ES语句
- 总结
前言
提示:文章数据来自kaggle,还发现了https://sofifa.com/这个牛的不得了的网站。
从Kaggle下载了fifa dataset(2015年~2022年),做些分析和可视化练习,分多些篇目来记录吧,争取上半年能完成。
Kaggle上有两篇可以参考学习:
1、https://www.kaggle.com/code/stefanoleone992/fifa-22-players-lineup-visualization-and-more
2、https://www.kaggle.com/code/brightezeoha/fifa-22-data-analysis
一、目标
先做几个简单的:
1、统计球员总数以及每年数量变化情况(新增、退役)
2、球员综合指标变化
3、在综合指标上增加球员价值变化
4、按国家、按年龄、按球员位置统计人数
再来两个难的:
1、综合来看,哪项指标最容易提升
2、综合得分80分以上的球员通常具备什么特质(区分位置),这些特质通常是什么年龄段形成的。
二、步骤
1.处理数据
先定义es索引template,字段太多,挑几个用到的定义下:
{"template": "fifa-players-*","settings": {"index": {"number_of_shards": "5","number_of_replicas": "1"},"analysis":{ "analyzer":{"ik":{"tokenizer":"ik_max_word"}}}},"mappings": {"properties": {"sofifa_id": {"type": "keyword"},"player_url": {"type": "keyword"},"overall": {"type": "keyword"},"potential": {"type": "keyword"},"value_eur": {"type": "keyword"},"wage_eur": {"type": "keyword"},"dob": {"type": "keyword"},"club_name": {"type": "keyword"},"club_position": {"type": "keyword"},"nationality_name": {"type": "keyword"}}},"aliases": {}
}
用logstash把几个csv导入到es里。csv2es.conf文件如下,每个csv导入到一个索引里:
input {file {path => "E:/kaggle/works/dataset/players_15.csv"start_position => "beginning"}
}
filter {csv {separator => ","columns => ["sofifa_id","player_url","short_name","long_name","player_positions","overall","potential","value_eur","wage_eur","age","dob","height_cm","weight_kg","club_team_id","club_name","league_name","league_level","club_position","club_jersey_number","club_loaned_from","club_joined","club_contract_valid_until","nationality_id","nationality_name","nation_team_id","nation_position","nation_jersey_number","preferred_foot","weak_foot","skill_moves","international_reputation","work_rate","body_type","real_face","release_clause_eur","player_tags","player_traits","pace","shooting","passing","dribbling","defending","physic","attacking_crossing","attacking_finishing","attacking_heading_accuracy","attacking_short_passing","attacking_volleys","skill_dribbling","skill_curve","skill_fk_accuracy","skill_long_passing","skill_ball_control","movement_acceleration","movement_sprint_speed","movement_agility","movement_reactions","movement_balance","power_shot_power","power_jumping","power_stamina","power_strength","power_long_shots","mentality_aggression","mentality_interceptions","mentality_positioning","mentality_vision","mentality_penalties","mentality_composure","defending_marking_awareness","defending_standing_tackle","defending_sliding_tackle","goalkeeping_diving","goalkeeping_handling","goalkeeping_kicking","goalkeeping_positioning","goalkeeping_reflexes","goalkeeping_speed","ls","st","rs","lw","lf","cf","rf","rw","lam","cam","ram","lm","lcm","cm","rcm","rm","lwb","ldm","cdm","rdm","rwb","lb","lcb","cb","rcb","rb","gk","player_face_url","club_logo_url","club_flag_url","nation_logo_url","nation_flag_url"]}
}
output {elasticsearch {hosts => "http://127.0.0.1:9200"index => "fifa-players-2015"}
}
2.构造ES语句
1、统计球员总数以及每年数量变化情况(新增、退役)
如下,docs.count列代表球员总数。
# curl -H "Content-Type: application/json" http://127.0.0.1:9200/_cat/indices?v | grep fifa
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open fifa-players-2015 lbXuWKBdRqSTDxHSeVPGGQ 5 1 16155 0 41.9mb 41.9mb
yellow open fifa-players-2016 IDYQNqXvSVmpMuoKSRWGhw 5 1 15623 0 40.5mb 40.5mb
yellow open fifa-players-2017 LdlLQSEGSd6XniAScT5PpA 5 1 17596 0 47.3mb 47.3mb
yellow open fifa-players-2018 lU2cC2FHRBOsQlqWYfkF1g 5 1 17954 0 48.2mb 48.2mb
yellow open fifa-players-2019 wvmoBDSxT9-pAogAVfhqUg 5 1 18085 0 48.8mb 48.8mb
yellow open fifa-players-2022 GyE3v6oZQ9GvLPH-9zcUBg 5 1 19239 0 51.7mb 51.7mb
yellow open fifa-players-2020 omp_E0VKRRGFsPTFZ63kHg 5 1 18483 0 50mb 50mb
yellow open fifa-players-2021 mXz8Gi24QmOI3pW9PL-W7Q 5 1 18944 0 50.8mb 50.8mb
总结
今天就做了处理数据,搭开发环境,部署生产环境。
生产环境地址:http://apr.kunmtech.com
【Kaggle】FIFA球员数据可视化分析(一)相关推荐
- Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测
文章目录 数据集介绍 数据可视化分析前的数据预处理 引入包和数据集 对特征缺失值的处理 保存处理好的数据集 数据可视化分析 申请贷款金额和实际贷款金额的数据分布 每年贷款笔数直方图与每年贷款总金额直方 ...
- 金州勇士4年3冠的成功秘诀!数据可视化分析告诉你答案
作者 | wLsq 来源 | Python数据科学 ▍前言 2015年6月,记得那时候我正在忙着研究生毕业,也是在那个时候,NBA总决赛的开始了.当时,金州勇士队作为一匹黑马收到很多人看好,果然不负所 ...
- 天池赛:世界杯数据可视化分析
目录 前言 一.数据集介绍 二.读取数据,去重 三.夺冠球队进失球率展示 1. 计算进球数.进球率及场次 2. 计算失球数.失球率及场次 3. 夺冠国家进失球率矩阵图 四.夺冠球队顺逆风球情况 ...
- 数据可视化分析票房数据报告_票房收入分析和可视化
数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...
- 【Python】电商用户行为数据可视化分析实战
本文中,云朵君将和大家一起从多个角度使用多个可视化技术,根据各种因素跟踪客户在电子商务网站的花费时间. 关于数据集 数据集来自kaggle -- Machine Hack. 先进电子商务的用户数量激增 ...
- NBA球星数据可视化分析-FineBI
目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <---------------------------------木易白驹 ...
- Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]
目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...
- 超市零售数据可视化分析(Plotly 指南)
CSDN 上不能插入 HTML,可以在 GitHub Page 上查看: https://paradiseeee.github.io/2020/07/30/超市零售数据可视化分析/ 项目首次发布于 K ...
- 计算机书籍-医学图像数据可视化分析与处理
书名:基于深度学习的医学图像数据可视化分析与处理 作者:强彦 出版社:科学出版社 出版时间:2019年01月
最新文章
- Scala 递归学习的例子
- [转]FINDSTR正则表达式小结
- 关于socket和 jsp的几个问题
- 在Linux上安装PostgreSQL
- 图片渲染延迟_前向渲染与延迟渲染
- java比较日期字符串大小写_java 字符串操作和日期操作
- wxWidgets:wxTaskBarIcon 演示
- SpringBoot不支持webapp的解决办法
- HDU - 5008 Boring String Problem(后缀数组+二分)
- 求两个数的最大公约数的3种办法
- 玩ts要注意什么_番禺三维创意拍摄要注意什么
- Js模块化开发的理解
- 算法导论第八章__实现计数排序
- ssm基于儿童教育网站答辩PPT模板
- Python配置opencv并在命令行运行
- kafka常用的操作命令
- 我的世界光影Java优化_我的世界7款超级棒的光影包推荐 让你的世界从此变得真实无比...
- oc实时渲染的图如何导出_最新C4D渲染器全家桶随便用,不仅有OC+阿诺德,还有两款哦...
- 小程序“头脑王者” 因违规被微信下架整改 小程序不可逾越的红线
- GAN评价指标代码(FID、LPIPS、MS-SSIM)
热门文章
- nginx安装、nginx前端配置、后端配置、前后端分离配置、https支持(ssl配置)、负载均衡配置、nginx location详解
- STM32时钟系统了解
- “龙”腾智跃,“万”象更新 | 达索系统专精特新企业SIMULIA解决方案云峰会邀君共探未来
- 股票和竞价以及股票的集合竞价是什么意思
- Qt之预览WPS的word文件
- Discuz! Q 1.0来了!
- 四氨基钴酞菁[Co(TAPC)],cas203860-42-8,齐岳生物提供定制材料
- halcon编程入门七——halco算子大全
- 宽度优先搜索(BFS)
- 一封台积电离职工程师的信