这是天池竞赛中数据集下载的csv文件,在这里当然也可以用wget在linux中进行下载,但这样感觉不太cool。

写了个python程序,文件夹栏

import pandas as pd
import os
from urllib.request import urlretrieve
class download(object):def __init__(self):super(download, self).__init__()def start(self):root=os.getcwd()data=pd.read_csv(root+"/steet_character_detector/data/mchar_data_list_0515.csv")for i in range(data.shape[0]):url=data.iloc[i,2]print(url)local=url.split("/")[-1]local=root+"/steet_character_detector/data/"+localtry:urlretrieve(url, local,self.callbackfunc)  #except Exception as e:print ("Exception")def callbackfunc(self,blocknum, blocksize, totalsize):'''回调函数@blocknum: 已经下载的数据块@blocksize: 数据块的大小@totalsize: 远程文件的大小'''print  ("blocknum  ",blocknum,"blocksize ",blocksize,"totalsize ",totalsize)percent = 100.0 * blocknum * blocksize / totalsizeif percent > 100:percent = 100print ("%.2f%%" % percent,"    ",blocknum *blocksize,"    ",totalsize)
root=os.getcwd()
data=pd.read_csv(root+"/steet_character_detector/data/mchar_data_list_0515.csv")
print(data.head())
if __name__ == '__main__':d = download()d.start()

利用python读取csv文件中url并下载相关推荐

  1. python获取股指_用Python读取csv文件中的沪深300指数历史交易数据

    保存路径:D:\python\用Python读取csv文件中的沪深300指数历史交易数据 程序名称:readcsvhs300.py: 数据名称:沪深300指数历史交易数据.csv: 开发环境:Win7 ...

  2. python计算csv列平均值_利用Python读取CSV文件并计算某一列的均值和方差

    近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据 文件的构成很简单,部分如下所示 总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后 ...

  3. python读取csv求平均数_利用Python读取CSV文件并计算某一列的均值和方差

    近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据 文件的构成很简单,部分如下所示 总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后 ...

  4. python读取CSV文件中温度值绘制3D折线图

    import pyecharts.options as opts from pyecharts.charts import Line3D import random import csv filena ...

  5. python对csv文件中的数据进行分类_利用Python对csv文件中的数据进行排序

    代码如下: #导入包 import pandas as pd from pandas import DataFrame,Series #设置路径 path='C:\\Users\\jyjh\\Desk ...

  6. python怎么读取csv的一部分数据_python批量读取csv文件 如何用python将csv文件中的数据读取成数组...

    如何用python把多个csv文件数据处理后汇总到新csv文件你看这月光多温柔,小编转头还能看见你,一切从未坍塌. 可以用pandas读取数据,首先把文件方同一个文件价里,然后对当前文件价的所有内容循 ...

  7. python读取csv文件的方法-CSV文件在Python中的几种处理方式

    Comma Separated Values,简称CSV,它是一种以逗号分隔数值的文件类型.在数据库或电子表格中,它是最常见的导入导出格式,它以一种简单而明了的方式存储和共享数据,CSV文件通常以纯文 ...

  8. [转载] 利用python对csv文件进行简单的数据分析

    参考链接: Python中的探索性数据分析 利用python对csv文件进行简单的数据分析 在通过爬虫爬取数据后,将数据放到csv文件里,为了方便观察,可以对数据进行简单的分析.下面我将对爬取的51j ...

  9. 技术图文:C# VS. Python 读取CSV文件指南

    背景 CSV 是一种以逗号进行特征分隔的文本文件类型,在数据库或电子表格中是一种非常常见的导入导出格式.本篇图文就以泰坦尼克号船员获救预测( Kaggle)中使用的数据集为例来说明 C#.Python ...

最新文章

  1. NOIp2018集训test-9-7(pm) (联考一day1)
  2. XSS (跨站脚本攻击) 分析与实战
  3. appium 驱动 对应9.0 系统_以后做Appium自动化测试,再也不会踩这些坑了!
  4. TRUNCATE TABLE和PURGE_TABLE的区别
  5. 2018蓝桥杯省赛---java---C---9(小朋友崇拜圈)
  6. 完全用 gnu/linux 工作,怎样完全用 GNU/Linux 工作
  7. 【Java】ASCII类对ASCII码的处理
  8. HALCON:内存管理(Memory Management)
  9. 苹果版App开发心得
  10. 【codevs1295】N皇后问题
  11. item 12: 把重写函数声明为“override”的
  12. JavaScript实现对象的深度克隆及typeof和instanceof【简洁】【分享】
  13. 怎么在云服务器上建网站_如何在云服务器上部署自己的网站?
  14. php考勤管理系统论文,基于PHP的高职院校学生考勤管理系统的研究
  15. 最难学的10大编程语言排行榜,Java只排第三,第一名出乎意料
  16. 阿里 P6 到底应该具备哪些核心能力?
  17. python爬取微信好友头像_使用python itchat包爬取微信好友头像形成矩形头像集的方法...
  18. 学习用Photoshop来设计简单的网页
  19. Elasticsearch 7.X 性能优化
  20. 测试人员需要具备哪些基本技能

热门文章

  1. c语言鸽巢原理,Codeforces 1188C DP 鸽巢原理
  2. 如何在iPhone或iPad上使用Google进行Safari搜索
  3. 高效学习-记不住人名的我如何复述一本书的内容
  4. 信息过载的时代,到底哪些知识值得我们去付费?
  5. 带备忘录的动态规划【leetcode931】
  6. Docker安装Nginx
  7. 操作系统——空闲内存管理
  8. WPS与OFFICE同时存在,怎么设置office为默认打开方式?
  9. java计算机毕业设计商超零售送货到家购物系统源码+系统+数据库+lw文档+mybatis+运行部署
  10. IE6/7/8 CSS兼容性问题和解决方法汇总