数据是数据分析师最宝贵的财富,可以通过数据做一些有趣的东西,通过数据可以把一些数据分析理论落到实地,而遗憾的是很多数据分析师或者想学数据分析的朋友都不会爬虫或者找不到数据源。本着学习研究的目的我用了几天的下班时间整理了我之前采集的用于研究的数据并上传百度云。数据很多,包括各行各业的的数据,数据大小从几万条到几十万条不等,主要包括

  • 58万条大众点评美食数据
  • 230万条物流线路价格数据
  • 103万条新浪微博用户数据
  • 6万条拉勾招聘信息
  • 6万条豆瓣读书的所有信息
  • 咪蒙所有文章数据
  • 16万条物流网点数据
  • 6万条知乎用户数据
  • 百万条知乎用户之间关系数据

数据预览



数据如何下载?

数据种类繁多,为此我把这些数据、介绍以及数据的下载地址汇集在一起做成了一个小的电子书,存了一点私心。在微信公众号「千珏」后台回复关键词「数据分析」可以获得以上的所有数据。

是读千珏(jue),希望你们都能早日在数据分析师的路上越走越远。
本文转载至:https://zhuanlan.zhihu.com/p/28734289

2019数据分析师必备资源(想成为数据分析师的点进来看看吧,小白也能看得懂嗷)相关推荐

  1. 成都python数据分析师职业技能_想成为数据分析师,需要重点学习什么技能?

    随着科技的创新和发展,数据分析师也越来越吃香,各行各业都需要这种技能分析数据又能实现业务增长的人才,前很多小伙伴也正在转行中.但是,想成为数据分析师需要学习的知识有很多,大家必须建立一个清晰的知识体系 ...

  2. 资源 | 想进行数据科学项目却没有数据集?26个数据集网站汇总

    导读:如果用一个句子总结学习数据科学的本质,那就是: 学习数据科学的最佳方法就是应用数据科学. 如果你是初学者,那么每完成一个项目你的能力就会大大提高.如果你是有经验的数据科学从业者,那么你应该懂这个 ...

  3. 想要成为 NLP 领域的大牛?从 ChatGPT 的 5 大自然语言模型开始了解吧(LM、Transformer、GPT、RLHF、LLM)——小白也能看得懂

    目录 前言 ChatGPT基础科普--知其一点所以然 1. LM 2. Transformer 3. GPT 4. RLHF 5. LLM 参考资料 其它资料下载 前言   如果想在自然语言处理(Na ...

  4. 构建全国统一的数据资产登记体系,是数据资源转变为数据资产的必由之路

    原文刊载于<中国科学院院刊>2022年第10期专题"数据要素市场化配置问题探究",原文标题<关于构建全国统一的数据资产登记体系的思考>.本文为精简改编版. ...

  5. 海量资源!开发人员成功转行数据科学必备清单

    全文共4814字,预计学习时长10分钟 图片来源:pexels.com/@tdcat 现在很多人都想成为一名数据科学家--从博士生到数据分析师.也许开发人员有同样的想法,觉得自己至少应找一些数据科学的 ...

  6. 优秀大数据分析师必备8大技能

    什么是大数据分析师? 简而言之,大数据分析师就是使用技术技能来分析数据和报告见解的人. 通常,大数据分析师可能会使用SQL技能从公司数据库中提取数据,使用编程技能来分析该数据,然后使用沟通技巧来将其结 ...

  7. 独家 | 一份数据工程师必备的学习资源,干货满满(附链接)

    作者:PRANAV DAR 翻译:张玲 校对:车前子 本文约6500字,建议阅读15分钟. 本文首先详细介绍了数据工程的职责.与数据科学家之间的差别以及其不同的工作角色,然后重点列出了很多与核心技能相 ...

  8. 最全攻略:数据分析师必备Python编程基础知识

    导读:本文主要介绍使用Python进行数据分析时必备的编程基础知识,主要涉及Python的基本数据类型.数据结构.程序控制.读写数据等内容. Python编写代码时,是以缩进作为代码块的标识,而不是使 ...

  9. 想从事数据科学相关岗位,这些数学基础“必备”

    很多同学想从事数据科学岗位,对于这个岗位而言,数学知识的储备重要吗? 答案显而易见,掌握好数学对于从事该岗位而言是很重要的.数学一直是任何当代科学学科的基础,几乎所有的现代数据科学技术(包括所有的机器 ...

最新文章

  1. dot--向量或矩阵的点乘
  2. javaScript Code 用javascript确定每月第二个星期五
  3. 开源项目_可能使用到的开源项目集合
  4. 2021-10-11 寻找二叉树结点的前驱或后继结点(用到parent指针)
  5. 全球及中国综艺节目产业营销策略分析及创新格局规划建议报告2021-2027年
  6. MySqlDataReader在Using中使用
  7. java 文件名 类名_java文件名为什么要与类名相同
  8. PJ可能会用到的动态规划选讲-学习笔记
  9. [转载] 10 个最值得 Python 新人练手的有趣项目
  10. Matlab简单教程:条件分支
  11. 技嘉服务器主板装系统,技嘉主板bios设置图解教程
  12. 用Python通过摄像头进行视频录制
  13. linux常中的cat命令,linux下cat命令详解
  14. li 字多出了省略号_css实现DIV,LI等元素超出部分文字用省略号…显示
  15. 在线生成ascii字符画网站字符图案在线生成工具
  16. 2022电工(初级)考题及答案
  17. 支持度、置信度和提升度
  18. QQ盗号成腾讯难解之痛
  19. 效率(1)Excel常用操作技巧
  20. MySQL酒店管理系统课程设计_酒店管理系统的设计与实现(PHP,MySQL)(含录像)

热门文章

  1. Java并发编程--学会他就能抵挡千军万马
  2. linux 无线网卡的安装
  3. 新手上路系列 Web服务器搭建篇——IIS的搭建
  4. markdown:中英文间增加一个空格
  5. Postgresql的使用-2 删除数据库
  6. 专访伯克利 BAIR Blog 编委会成员许华哲:至少在传播科学的任务上,我们希望和企业研究院做得一样好...
  7. 基于SpringBoot的留守儿童爱心网站
  8. Calabash Android 安装及初始化
  9. Xgboost如何画出树?
  10. 【愚公系列】2023年05月 网络安全高级班 038.WEB渗透与安全(红队渗透测试入门指南)