文章目录

  • 前言
  • 一、目标
  • 二、步骤
    • 1.处理数据
    • 2.构造ES语句
  • 总结

前言

提示:文章数据来自kaggle,还发现了https://sofifa.com/这个牛的不得了的网站。

从Kaggle下载了fifa dataset(2015年~2022年),做些分析和可视化练习,分多些篇目来记录吧,争取上半年能完成。

Kaggle上有两篇可以参考学习:
1、https://www.kaggle.com/code/stefanoleone992/fifa-22-players-lineup-visualization-and-more
2、https://www.kaggle.com/code/brightezeoha/fifa-22-data-analysis


一、目标

先做几个简单的:
1、统计球员总数以及每年数量变化情况(新增、退役)
2、球员综合指标变化
3、在综合指标上增加球员价值变化
4、按国家、按年龄、按球员位置统计人数
再来两个难的:
1、综合来看,哪项指标最容易提升
2、综合得分80分以上的球员通常具备什么特质(区分位置),这些特质通常是什么年龄段形成的。

二、步骤

1.处理数据

先定义es索引template,字段太多,挑几个用到的定义下:

{"template": "fifa-players-*","settings": {"index": {"number_of_shards": "5","number_of_replicas": "1"},"analysis":{   "analyzer":{"ik":{"tokenizer":"ik_max_word"}}}},"mappings": {"properties": {"sofifa_id": {"type": "keyword"},"player_url": {"type": "keyword"},"overall": {"type": "keyword"},"potential": {"type": "keyword"},"value_eur": {"type": "keyword"},"wage_eur": {"type": "keyword"},"dob": {"type": "keyword"},"club_name": {"type": "keyword"},"club_position": {"type": "keyword"},"nationality_name": {"type": "keyword"}}},"aliases": {}
}

用logstash把几个csv导入到es里。csv2es.conf文件如下,每个csv导入到一个索引里:

input {file {path => "E:/kaggle/works/dataset/players_15.csv"start_position => "beginning"}
}
filter {csv {separator => ","columns => ["sofifa_id","player_url","short_name","long_name","player_positions","overall","potential","value_eur","wage_eur","age","dob","height_cm","weight_kg","club_team_id","club_name","league_name","league_level","club_position","club_jersey_number","club_loaned_from","club_joined","club_contract_valid_until","nationality_id","nationality_name","nation_team_id","nation_position","nation_jersey_number","preferred_foot","weak_foot","skill_moves","international_reputation","work_rate","body_type","real_face","release_clause_eur","player_tags","player_traits","pace","shooting","passing","dribbling","defending","physic","attacking_crossing","attacking_finishing","attacking_heading_accuracy","attacking_short_passing","attacking_volleys","skill_dribbling","skill_curve","skill_fk_accuracy","skill_long_passing","skill_ball_control","movement_acceleration","movement_sprint_speed","movement_agility","movement_reactions","movement_balance","power_shot_power","power_jumping","power_stamina","power_strength","power_long_shots","mentality_aggression","mentality_interceptions","mentality_positioning","mentality_vision","mentality_penalties","mentality_composure","defending_marking_awareness","defending_standing_tackle","defending_sliding_tackle","goalkeeping_diving","goalkeeping_handling","goalkeeping_kicking","goalkeeping_positioning","goalkeeping_reflexes","goalkeeping_speed","ls","st","rs","lw","lf","cf","rf","rw","lam","cam","ram","lm","lcm","cm","rcm","rm","lwb","ldm","cdm","rdm","rwb","lb","lcb","cb","rcb","rb","gk","player_face_url","club_logo_url","club_flag_url","nation_logo_url","nation_flag_url"]}
}
output {elasticsearch {hosts => "http://127.0.0.1:9200"index => "fifa-players-2015"}
}

2.构造ES语句

1、统计球员总数以及每年数量变化情况(新增、退役)
如下,docs.count列代表球员总数。

# curl -H "Content-Type: application/json"  http://127.0.0.1:9200/_cat/indices?v | grep fifa
health status index                              uuid                   pri rep docs.count docs.deleted store.size pri.store.size
yellow open fifa-players-2015                  lbXuWKBdRqSTDxHSeVPGGQ 5 1   16155  0  41.9mb  41.9mb
yellow open fifa-players-2016                  IDYQNqXvSVmpMuoKSRWGhw 5 1   15623  0  40.5mb  40.5mb
yellow open fifa-players-2017                  LdlLQSEGSd6XniAScT5PpA 5 1   17596  0  47.3mb  47.3mb
yellow open fifa-players-2018                  lU2cC2FHRBOsQlqWYfkF1g 5 1   17954  0  48.2mb  48.2mb
yellow open fifa-players-2019                  wvmoBDSxT9-pAogAVfhqUg 5 1   18085  0  48.8mb  48.8mb
yellow open fifa-players-2022                  GyE3v6oZQ9GvLPH-9zcUBg 5 1   19239  0  51.7mb  51.7mb
yellow open fifa-players-2020                  omp_E0VKRRGFsPTFZ63kHg 5 1   18483  0    50mb    50mb
yellow open fifa-players-2021                  mXz8Gi24QmOI3pW9PL-W7Q 5 1   18944  0  50.8mb  50.8mb

总结

今天就做了处理数据,搭开发环境,部署生产环境。
生产环境地址:http://apr.kunmtech.com

【Kaggle】FIFA球员数据可视化分析(一)相关推荐

  1. Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测

    文章目录 数据集介绍 数据可视化分析前的数据预处理 引入包和数据集 对特征缺失值的处理 保存处理好的数据集 数据可视化分析 申请贷款金额和实际贷款金额的数据分布 每年贷款笔数直方图与每年贷款总金额直方 ...

  2. 金州勇士4年3冠的成功秘诀!数据可视化分析告诉你答案

    作者 | wLsq 来源 | Python数据科学 ▍前言 2015年6月,记得那时候我正在忙着研究生毕业,也是在那个时候,NBA总决赛的开始了.当时,金州勇士队作为一匹黑马收到很多人看好,果然不负所 ...

  3. 天池赛:世界杯数据可视化分析

    目录 前言 一.数据集介绍 二.读取数据,去重 三.夺冠球队进失球率展示 1.  计算进球数.进球率及场次 2.  计算失球数.失球率及场次 3.  夺冠国家进失球率矩阵图 四.夺冠球队顺逆风球情况 ...

  4. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  5. 【Python】电商用户行为数据可视化分析实战

    本文中,云朵君将和大家一起从多个角度使用多个可视化技术,根据各种因素跟踪客户在电子商务网站的花费时间. 关于数据集 数据集来自kaggle -- Machine Hack. 先进电子商务的用户数量激增 ...

  6. NBA球星数据可视化分析-FineBI

    目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <---------------------------------木易白驹 ...

  7. Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]

    目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...

  8. 超市零售数据可视化分析(Plotly 指南)

    CSDN 上不能插入 HTML,可以在 GitHub Page 上查看: https://paradiseeee.github.io/2020/07/30/超市零售数据可视化分析/ 项目首次发布于 K ...

  9. 计算机书籍-医学图像数据可视化分析与处理

    书名:基于深度学习的医学图像数据可视化分析与处理 作者:强彦 出版社:科学出版社 出版时间:2019年01月

最新文章

  1. Scala 递归学习的例子
  2. [转]FINDSTR正则表达式小结
  3. 关于socket和 jsp的几个问题
  4. 在Linux上安装PostgreSQL
  5. 图片渲染延迟_前向渲染与延迟渲染
  6. java比较日期字符串大小写_java 字符串操作和日期操作
  7. wxWidgets:wxTaskBarIcon 演示
  8. SpringBoot不支持webapp的解决办法
  9. HDU - 5008 Boring String Problem(后缀数组+二分)
  10. 求两个数的最大公约数的3种办法
  11. 玩ts要注意什么_番禺三维创意拍摄要注意什么
  12. Js模块化开发的理解
  13. 算法导论第八章__实现计数排序
  14. ssm基于儿童教育网站答辩PPT模板
  15. Python配置opencv并在命令行运行
  16. kafka常用的操作命令
  17. 我的世界光影Java优化_我的世界7款超级棒的光影包推荐 让你的世界从此变得真实无比...
  18. oc实时渲染的图如何导出_最新C4D渲染器全家桶随便用,不仅有OC+阿诺德,还有两款哦...
  19. 小程序“头脑王者” 因违规被微信下架整改 小程序不可逾越的红线
  20. GAN评价指标代码(FID、LPIPS、MS-SSIM)

热门文章

  1. nginx安装、nginx前端配置、后端配置、前后端分离配置、https支持(ssl配置)、负载均衡配置、nginx location详解
  2. STM32时钟系统了解
  3. “龙”腾智跃,“万”象更新 | 达索系统专精特新企业SIMULIA解决方案云峰会邀君共探未来
  4. 股票和竞价以及股票的集合竞价是什么意思
  5. Qt之预览WPS的word文件
  6. Discuz! Q 1.0来了!
  7. 四氨基钴酞菁[Co(TAPC)],cas203860-42-8,齐岳生物提供定制材料
  8. halcon编程入门七——halco算子大全
  9. 宽度优先搜索(BFS)
  10. 一封台积电离职工程师的信