• Python实训-15天-博客汇总表

目录

1、正则表达式

2、爬虫


  

  • 论坛:掘金、csdn、博客园
  • 刷题:力扣、牛客、实验楼
  • 资料: w3、菜鸟、gitee
  1. W3school:https://www.w3school.com.cn/
  2. codecademy(编程学院):https://www.codecademy.cn/
  3. stack Overflow(中文社区):https://www.soinside.com/
  4. stack Overflow(外国社区):https://stackoverflow.com/
  5. leetcode(力扣):https://leetcode-cn.com/
  1. 文件的设计模式
  2. spring的设计模式
  3. ioc、aop
  4. jQuery--->id、class

Java 文件系统(IO流)的设计模式——涉及到很多的接口和类,使用什么结构来设计这些接口和类之间的关系的。
高级-->12000+,没有回答上来。

Spring的设计模式——并不是太底层,如果稍微有面试准备的话,都差不多能回答上来。
高级-->12000+,没有回答上来。

Spring的特征,IOC和AOP——基础理解。
中级-->9000,没有回答上来。

Jquery中的class选择器,如何来定位元素?(初级-->6000)   忘了?没有回答上来
    $('.xxxx')  $('#xxxx')、getElementsByClassName('xxxx')、querySelector('.xxxx')

一线城市是没有他的生存空间的!!
二线城市,郑州,4000左右--->杂活,边角料--->2年或3年对自己的提升非常有限,给自己干废了!!

1、正则表达式

Python中正则表达式的详细教程:https://www.jb51.net/article/65286.htm

# python中的正则
s = '豫B·A696B';
# s中的字母去掉
# "".join(list(filter(str.isdigit, s)))ss = '';
for x in s:if ord(x) < 65 or ord(x) > 91:ss = ss + x;
print(ss)  # 豫·696ss = [x for x in s if ord(x) < 65 or ord(x) > 91]
print("".join(ss))  # 豫·696
#如果在java中遇到这个问题,实现步骤。
String s = '豫B·A696B';
#去掉字母#手动遍历
String ss = "";
for(int i = 0; i < s.length(); i++){if(s.charAt(i) < 65 || s.charAt(i) > 90){ss = ss + s.charAt(i);}
}
System.out.print(ss)#正则【推荐】String ss = s.replaceAll("[A-Z]","");#支持正则
'''
python中的正则
re.sub(pattern, repl, string[, count])pattern正则替换成的内容字符串
将一个字符串中所有满足patter正则的部分,替换成repl
'''
import res = '豫B·A696B';
p = re.compile("[A-Z]");  # 编译生成正则规则
ss = re.sub(p, '', s)
print(ss)  # 豫·696

编程语言有很多种,每一种都适合有不同的应用场景,但是它们的思想和使用都是相通的,要求:起码要足够精通一门。

笔: 铅笔、圆珠笔、彩笔、毛笔,等等,起码要会使用一种笔~

笔<------>写一篇非常好的文章/写出来一副非常美的字/画非常美的画。

大作业--实训报告(分组完成一个小的功能)

2、爬虫

熟练爬虫(第一阶段爬,爬取到的html,就是我们想要的内容)。

  1. 锻炼编程能力和编程思维
  2. 锻炼对编程语法的磨合度
  3. 锻炼基础数据结构的使用(list、dict等)

动手!

爬取起点中文网,第一页(前20)小说的名字/类型/得票数
连接地址:https://www.qidian.com/rank/yuepiao/year2022-month01(2022年1月份的排名)

import requests
from bs4 import BeautifulSoup as BS# 伪装成浏览器
hds = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'}resp = requests.get('https://www.qidian.com/rank/yuepiao/year2022-month01/', headers=hds);print(resp.status_code)  # 200ct = resp.content.decode('utf-8');# print(ct)
# print(ct.index('410334'))bs = BS(ct, 'lxml');names = bs.select('.rank-body .book-mid-info h2 a');
types = bs.select('.rank-body .book-mid-info .author a:nth-child(4)');  # !!!nth-child(4)
# votes = bs.select('.rank-body .book-right-info .total p span span');  # 暂不考虑
print(len(names))  # 20
print(len(types))  # 20
# print(len(votes))# for x in votes:
#     print(x.get_text().decode())# 定位元素后,要么就是获取属性值-->['属性名'],要么就是获取元素内容-->.get_text()bookinfos = [];for i in range(len(names)):name = names[i];tp = types[i];bookinfos.append(name.get_text() + '-' + tp.get_text());print(bookinfos)  # ['星门-玄幻', '明克街13号-都市', ...]

加油。

Python实训day05am【正则表达式、网络爬虫】相关推荐

  1. Python实训day04pm【网络爬虫(文本、图片)】

    Python实训-15天-博客汇总表 目录 1.网络爬虫 1.1.爬取文本 1.2.爬取图片 2.其他知识点 上午题目讲解 昨天的基础题目讲解 爬取非文本(图片) 1.网络爬虫 #bili 视频,爬下 ...

  2. Python实训day06am【网络爬虫(爬取接口)】

    Python实训-15天-博客汇总表 目录 1."from bs4 import BeautifulSoup"解析 2.字体反爬虫 3.网络爬虫 3.1.直接爬取页面html-爬取 ...

  3. Python实训day08am【网络爬虫selenium、图像处理入门】

    Python实训-15天-博客汇总表 目录 1.网络爬虫-selenium(歌曲与歌词) 2.图像处理 2.1.安装库 2.2.图片处理 2.3.马赛克 2.4.副本-缩略图-粘贴-创建新图 2.5. ...

  4. Python实训day12am【网络爬虫大作业简略解析:动态生成html页面、数据写入Excel】

    Python实训-15天-博客汇总表 目录 1.HTML页面设计 2.生成每个城市的HTML页面 2.1.HTML页面代码(weatherTemplate.html) 2.2.实例代码-动态生成htm ...

  5. Python实训day06pm【网络爬虫(爬取接口)-爬取图片与数据】

    Python实训-15天-博客汇总表 目录 练习1 练习2 练习1 ''' 课堂练习2:爬取lol英雄的头像.BP的音乐. 需要找数据接口:https://101.qq.com/#/hero ''' ...

  6. 初学Python实训心得以及一个爬虫例子

    了解Python,学会Python,实战python 通过这次Python实训,我收获了很多,一方面学习到了许多以前没学过的专业知识与知识的应用,另一方面还提高了自我动手做项目的潜力.本次实训是对我潜 ...

  7. Python实训-15天-博客汇总表

    目录 1.课程安排 1.1.课程介绍 1.2.课程目标 2.课件 2.1.课件and录屏 2.2.练习and案例and作业 3.实训博客笔记 第1周-week1 day01 day02 day03 d ...

  8. Python实训day13am【Python网络爬虫综合大作业PPT】

    Python实训-15天-博客汇总表   今天上午大家抓紧时间继续完成实训报告和PPT,有问题我会在群里跟大家说明, 暂时不用上线直播了. 实训结束后,我会在博客上发布网络爬虫综合大作业题目及解析.

  9. Python实训day05pm【JS-DOM-获取元素节点对象、网络爬虫】

    Python实训-15天-博客汇总表 目录 1.CSS选择器 2.网络爬虫 2.1.练习1 2.2.练习2 1.CSS选择器 .rank-body .book-mid-info .author a:n ...

最新文章

  1. NOIP2018 集训(一)
  2. 《Adobe InDesign CS5中文版经典教程》—第1课1.7节使用上下文菜单
  3. 服务容错保护断路器Hystrix之二:Hystrix工作流程解析
  4. 面试题之判断栈的入栈和出栈序列的合法性
  5. 退役笔记一#MySQL = lambda sql : sql + #39; Source Code 4 Explain Plan #39;
  6. python linux命令-Python执行Linux系统命令的4种方法
  7. 数据录入工作,使用VBA
  8. C++中实现回调机制的几种方式
  9. 高性能Javascript:高效的数据访问
  10. 将Doc或者Docx文档处理成html的代码逻辑;统计word中的字数,段数,句数,读取word中文档内容的代码逻辑
  11. Centos7下安装redis
  12. Visual Studio 清单(manifest)导致的问题
  13. Python 查看pip安装的包的位置(查看pip安装包的路径)
  14. 转反射的第一部分:发现和执行
  15. 1 + 2 + 3 + 4 + ⋯
  16. Windows server 2019 - Raid1 搭建+测试
  17. JLU数据结构第七次上机实验解题报告
  18. PAT 乙级 1048 数字加密 (20 分)
  19. 人脸识别(1)---人脸识别长篇研究
  20. 山东理工acm非专业-顺序结构

热门文章

  1. access如何查询两张表的内容_为什么可以的话,不要使用星号 *,而是相应的字段名来进行查询 MySQL内连接如何选择驱动表
  2. 飞飞php2.8采集失败_飞飞影视系统火车头采集器采集发布免登录接口
  3. c语言尚未实现的虚拟函数,编译原理之学习 lua 1.1 笔记 (二) 函数调用与局部变量...
  4. tensorflow打印模型图_[深度学习]TensorRT加速tensorflow实例
  5. 为了OFFER而战,大四那些日子在牛客网和Leetcode刷SQL题目
  6. 七十二、区间合并,插入求交集, 删除被覆盖区间
  7. EM算法和GMM(上)
  8. 今日arXiv精选 | 14 篇 ICCV 2021 最新论文
  9. 叮!请查收本周份「知识图谱」专题论文解读
  10. 深度学习入门之PyTorch学习笔记:深度学习介绍