“希希敬敬对”团队作业——敏捷冲刺5
“希希敬敬对”百度贴吧小爬虫任务计划:今天的团队讨论照片:
今天讨论照片:
龙江腾(队长) 201810775001
完成“把10个页面的数据整合到一个数据组中,并进行排序”的功能,明天完成爬下的发帖主题人信息进行图形化显示的review。
杨希 201810812008
完成“把10个页面的数据整合到一个数据组中,并进行排序”的代码review,明天完成爬下的发帖主题人信息进行图形化显示。
何敬上 201810812004
完成“把10个页面的数据整合到一个数据组中,并进行排序”的功能,明天完成爬下的发帖主题人信息进行图形化显示的review。
遇到的问题:
暂无
燃尽图:
程序代码(基于昨天代码的基础上的更新):
def __analysis(self, htmls):
#root_html获取包含了主题作者和帖子回复数关键字的标签
root_html = re.findall(BDTBCrawler.root_pattern, htmls)
#用anchors这个列表来存放提取出来的主题作者和帖子回复数组成的字典
anchors = []
for html in root_html:
# 提取主题作者(列表类型),并将其转换成字符串
name = re.findall(BDTBCrawler.name_pattern, html)
name = str(name[0])
# #提取回复数(列表类型),并将其转换成整形数字
number = re.findall(BDTBCrawler.num_pattern, html)
number = int(number[0])
#用来记录列表的遍历过程中其子元素——字典中是否有与当前name相同的key值
flag = False
# 遍历anchors列表,如果有相同的主题作者执行回复数累加操作
for i in anchors:
if name == i['name']:
number = i['number'] + number
# print(number)
i.update({'name':i['name'], 'number':number})
flag = True #有与当前作者相同的主题作者
break
if flag == False:
anchor = {'name': name, 'number': number}
anchors.append(anchor)
# print(anchors)
return anchors
#排序算法
def __sort(self, anchors):
anchors = sorted(anchors, key=lambda d: d['number'], reverse=True)
return anchors
程序运行结果部分截图:
转载于:https://www.cnblogs.com/xiaoyoushang/p/10030312.html
“希希敬敬对”团队作业——敏捷冲刺5相关推荐
- “希希敬敬对”团队作业-敏捷冲刺1
"希希敬敬对"百度贴吧小爬虫任务计划 Alpha任务分配计划: 百度贴吧小爬虫项目一共分成10个小的任务,分别分配给不同的同学. 以下是我们的10个任务: 以下是不同的3位组员分别 ...
- “希希敬敬对”团队作业-敏捷冲刺-3
"希希敬敬对"百度贴吧小爬虫任务计划: 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成任务"对贴吧前10页进行爬取任务",明天将完成&qu ...
- “希希敬敬对”团队作业——敏捷冲刺4
"希希敬敬对"百度贴吧小爬虫任务计划: 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成"爬取发帖主题人的主题回复数据"代码review,明 ...
- “希希敬敬对”团队作业-敏捷冲刺2
"希希敬敬对"百度贴吧小爬虫任务计划 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成 "贴吧名字关键字与URL关联"代码检查.明天将要完成 ...
- “希希敬敬对”团队作业——敏捷冲刺7
1"希希敬敬对"百度贴吧小爬虫任务计划: 龙江腾(队长) 201810775001 程序生成exe文件遇到了些问题,程序生成apk文件的review,程序贴吧推广使用的review ...
- “希希敬敬对”团队作业——敏捷冲刺6
1"希希敬敬对"百度贴吧小爬虫任务计划: 龙江腾(队长) 201810775001 完成爬下的发帖主题人信息进行图形化显示的review,明天完成程序生成exe文件,程序生成apk ...
- 团队作业——Alpha冲刺 6/12
团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:编辑界面完成标题栏的开发,以及与已经完成gallery开发的同学,商讨我负责的界面中,图片滑动的具体措施. 明日任务:除了图像识别内容嵌入 ...
- 《团队作业第三、第四周》五小福团队作业--Scrum 冲刺阶段--Day6
<团队作业第三.第四周>五小福团队作业--Scrum 冲刺阶段--Day6 一.项目燃尽图 二.项目进展 [20172301郭恺第六天的进展] 第五天完成的任务: 点击牌会抬起.选中牌的图 ...
- 团队作业——Alpha冲刺 4/12
团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:着手进行编辑界面的布局,插入控件,并进行参数调整. 明日任务:继续完善编辑界面控件,学习控件交互功能. 郭剑南 今日任务:上网查阅学习了关 ...
最新文章
- css表示第一个元素和最后一个元素,CSS第一个和最后一个子元素
- 【Java 注解】自定义注解 ( 注解属性定义与赋值 )
- mysql怎么删除临时表里的数据_谈谈MySQL数据库中临时表的应用
- java面向对象编程集合边框_JAVA 面向对象 集合框架
- php商品报损流程,库存报损
- STM32工作笔记003---认识了解RTOS系统
- linux 常用正则表达式,Linux中基本正则表达式
- JAVA的四则运算规则_java四则运算规则
- Python学习入门基础教程(learning Python)--5.7 Python文件数据记录存储与处理
- 在Eclipse中实现C++ 11的完整支持
- 分布式常见面试题总结(2021)
- 幻方矩阵(魔方矩阵)
- Hadoop源代码分析
- IIC输出模式选择推挽输出还是开漏输出?
- 【java】环境变量安装
- UI设计技巧讲解之PS水墨泼墨效果制作
- Python入门(2)
- 【UE4】搭建局域网内VR直播 UE4.27
- 一首古诗带来的图数据库大冒险
- automator来解决mac terminal终端快速连接
热门文章
- 2018年第九届蓝桥杯 - 国赛 - C/C++大学B组 - B. 激光样式
- 征战蓝桥 —— 2015年第六届 —— C/C++A组第5题——九数组分数
- 1035:等差数列末项计算
- 【STM32】FreeRTOS中断配置
- 【Linux系统编程】线程栈大小
- [Qt教程] 第33篇 网络(三)FTP(一)
- 计算机是管理信息系统的必要条件吗,管理信息系统复习题(有答案)..doc
- java thread 内存泄露_Java ThreadLocal 内存泄露问题分析及解决方法。
- python的代码有哪些_Python有哪些有趣的代码呢,这些代码让
- 自认为有必要学习的Sql 总结,积累 mybatis