在(一)中的时候我们分析了如何获取所有人无忧币的统计情况,接下来开始学着写代码了:

首先第一步我们得把第一个页面的源代码:#coding:utf-8

import urllib

url = 'http://home.51cto.com/index.php?s=/space/1'

content = urllib.urlopen(url).read()

print content

通过简单的几行代码我们就能够得到这个页面的源程序代码了,打印出来看一下,如图:

第一行代码,看到#号我们知道这是一个注释,但是这个注释很特殊,他的作用是指定了utf-8的字符集。由于我们的代码中会涉及到中文,为了能使Python编译器正确识别中文字符,所以需要在代码顶部添加这样一段特殊的注释。

虽然#这个符号在python中表示注释,其实如果用pydev或者别的什么IDE来编写程序的时候,如果开头不声明保存编码格式,会默认使用ASKII码保存,那么代码中有中文就会有问题,即使你的中文是在注释里面。

关于注释的#号我们多提一些:

如果是在linux/unix系统中时,我们看别人的代码总有这样的开头:#!/usr/bin/python

#Filename:XXX.py

在这两段代码中它被称作 组织行 ----源文件的头两个字符是#!,后面跟着一个程序。这行告诉你的Linux/Unix当执行你的程序的时候,它应该运行哪个解释器。

如果需要在代码中使用中文注释,必须在Python文件的最前面加上如我们所写的注释说明:#coding: UTF-8

如果要输出中文,需要在文件最上面加上:# coding: gbk

关于中文处理的问题我发现只要我们使用国语的广大同胞起初都是一个很头痛的问题,等遇到关于中文乱码问题时,我再做一个系统的谈论关于文本编码的知识。

第二行代码就是同过import是用来导入相应的模块。模块其实就是一些函数和类的集合文件,类似于C中的include头文件,这里就是导入urllib模块。

第三行我们想要通过urllib模块中的urlopen(url [,data])函数打开一个HTML文档,这行我们提供该文档的URL地址。函数urlopen不仅可以打开位于远程web服务器上的文件,而 且可以打开一个本地文件,并返回一个类似文件的对象,我们可以通过该对象从HTML文档中读出数据。

第四行一旦打开了HTML文档,我们就可以像使用常规文件一样使用read([nbytes]),readline()和readlines()函数来对文件进行读操作。若要读取整个HTML文档的内容的话,您可以使用read()函数,该函数将文件内容作为字符串返回。

第五行输出。

想用文字解释清楚每一行看似很简单的代码真困难!!!!感觉用多少语言都无法表示清楚一样,不过这样学习到的东西真的很多

下边一节来看看如何能把得到的源代码中提取出我们需要的信息:

我们要从大量的数据中找到无忧币这一块的区域并且把无忧币的数量单独的提取出来,我们要用到find()函数,find函数()能够查找到所要查找的位置并通过切片得到。

一个用python做的完整项目_我从一个小项目学习Python编程的全过程(二)相关推荐

  1. 初学python有几个阶段_零基础如何系统的学习Python 从7个阶段入手

    目前信息化产业发展势头很好,互联网就成为了很多普通人想要涉及的行业,因为相比于传统行业,互联网行业涨薪幅度大,机会也多,所以就会大批的人想要转行来学习Python开发. Python语言的应用 Pyt ...

  2. python大数据培训机构_学大数据开发需要学习python吗

    大数据现在互联网火热的一个名词,而和大数据关键词最紧密的相信就是Java和python了,在一年以前,Java大数据可能是很多培训机构的宣传标语.而到了2018年,python大数据则成为了潮流,无论 ...

  3. python做流程管理平台_[译] Airflow: 一个工作流程管理平台

    Airflow: 一个工作流程管理平台 Airbnb 是一个快速增长的.数据启示型的公司.我们的数据团队和数据量都在快速地增长,同时我们所面临的挑战的复杂性也在同步增长.我们正在扩张的数据工程师.数据 ...

  4. python做动态数据采集仪代理_九四采集器(py/python)采集器设置动态代理IP图文教程...

    说明:为什么要使用动态代理进行采集,主要是因为针对封ip之类问题解决,使用了动态代理ip就无法进行ip封禁,不影响采集. 直入正题,首先要配置搭建采集器,这里不做赘述. 注:下载地址在底部. 采集器配 ...

  5. python大一适合学吗_大一学生是否应该去学习Python?

    首先介绍下我自己,我本科在一所普通一本院校读书,所学专业是机械电子工程.目前同时拿到了包括浙江大学.哈尔滨工业大学.西北工业大学等几所学校的offer,预计明年去西北工业大学读研究生. 1.争取在大一 ...

  6. java有趣项目_有趣的java小项目------猜拳游戏

    package com.aaa; //总结:猜拳游戏主要掌握3个方面:1.人出的动作是从键盘输入的(System.in)2.电脑是随机出的(Random随机数)3.双方都要出(条件判断) import ...

  7. python做些什么项目内容_现在比较流行的python做什么项目最适合?

    摘要: 现在比较流行的python做什么项目最适合?相对其他语言来说python算是简单易学的编程语言了,同时python又和Java一样是开源免费的,可以在各种不同类型的计算机上运行,w... 现在 ...

  8. 【花雕动手做】有趣好玩的音乐可视化系列小项目(26)--LED 超立方体

    偶然心血来潮,想要做一个声音可视化的系列专题.这个专题的难度有点高,涉及面也比较广泛,相关的FFT和FHT等算法也相当复杂,不过还是打算从最简单的开始,实际动手做做试验,耐心尝试一下各种方案,逐步积累 ...

  9. 【花雕动手做】有趣好玩的音乐可视化系列小项目(17)--光导纤维灯

    偶然心血来潮,想要做一个声音可视化的系列专题.这个专题的难度有点高,涉及面也比较广泛,相关的FFT和FHT等算法也相当复杂,不过还是打算从最简单的开始,实际动手做做试验,耐心尝试一下各种方案,逐步积累 ...

  10. 【花雕动手做】有趣好玩的音乐可视化系列小项目(19)--通体光纤灯

    偶然心血来潮,想要做一个音乐可视化的系列专题.这个专题的难度有点高,涉及面也比较广泛,相关的FFT和FHT等算法也相当复杂,不过还是打算从最简单的开始,实际动手做做试验,耐心尝试一下各种方案,逐步积累 ...

最新文章

  1. proc文件系统编程
  2. 区块链的技术——账本是去中心化的分布式存储,加密+校验(哈希二叉树)+多数选举来防止篡改...
  3. android realmax sdk,RealMax推出全新开源AR SDK 框架ARToolKit
  4. 【数据分析】线性回归与逻辑回归
  5. 利用jsonp实现跨域登陆
  6. Android实现圆形圆角图片
  7. 【英语学习】【WOTD】cumulate 释义/词源/示例
  8. UI设计素材|正确使用浮动按钮
  9. Kubernetes(k8s)底层网络原理刨析
  10. 碎阅:一款基于douban及ONE API开发的资讯类App
  11. 什么是基金转换?转换费用如何收取?
  12. 【数学】GPS经纬度坐标转换
  13. 转载:技术大停滞——范式春梦中的地球工业文明:前言
  14. Tcl/Tk快速入门
  15. 软件加密系统Themida应用程序保护指南(二):有哪些保护选项
  16. Unity3d 接入VKSDK登陆和分享 IOS篇
  17. Map遍历 key-value 的4种方法
  18. Zabbix 5.0.12 异常:Zabbix unreachable poller processes more than 75% busy:
  19. linux上好玩的东西
  20. 黑人抬棺用计算机演奏的乐谱,原神乐谱黑人抬棺怎么演奏_乐谱黑人抬棺_3DM手游...

热门文章

  1. java 国际化 properties_java Properties 读取文件,国际化
  2. tp 查询3天内是否有记录_DNF:玩家哭诉没坐过飞机,被吧主实锤打脸,TP制裁强行背锅...
  3. kass中lisp文件,常见的Lisp-获取文件的路径
  4. 计算机软件员证书用途,软考证书的五大好处(详解)
  5. html 按下和松开事件,利用JQuery实现一个键盘按下与松开触发事件
  6. 的训练过程_最全深度学习训练过程可视化工具(附github源码)
  7. 人工智能能否代替大脑_人工智能大脑跟人类大脑的区别,智脑的发展如何?能否超越人脑?...
  8. 计算机一级电子表格怎么打开,xls文件怎么打开?其实很简单
  9. Fatal Error: Unable to find package java.lang in classpath or bootclasspath
  10. 公务员考试中的计算机知识点,2021年度公务员考试计算机基础知识试题.doc