“希希敬敬对”百度贴吧小爬虫任务计划:今天的团队讨论照片:

今天讨论照片:

龙江腾(队长) 201810775001

完成“把10个页面的数据整合到一个数据组中,并进行排序”的功能,明天完成爬下的发帖主题人信息进行图形化显示的review。

杨希                   201810812008

完成“把10个页面的数据整合到一个数据组中,并进行排序”的代码review,明天完成爬下的发帖主题人信息进行图形化显示。

何敬上     201810812004

完成“把10个页面的数据整合到一个数据组中,并进行排序”的功能,明天完成爬下的发帖主题人信息进行图形化显示的review。

遇到的问题:

  暂无

燃尽图:

程序代码(基于昨天代码的基础上的更新):

#分析获取到的字符串
    def __analysis(self, htmls):
        #root_html获取包含了主题作者和帖子回复数关键字的标签
        root_html = re.findall(BDTBCrawler.root_pattern, htmls)
        #用anchors这个列表来存放提取出来的主题作者和帖子回复数组成的字典
        anchors = []
        for html in root_html:
            # 提取主题作者(列表类型),并将其转换成字符串
            name = re.findall(BDTBCrawler.name_pattern, html)
            name = str(name[0])
            # #提取回复数(列表类型),并将其转换成整形数字
            number = re.findall(BDTBCrawler.num_pattern, html)
            number = int(number[0])
            #用来记录列表的遍历过程中其子元素——字典中是否有与当前name相同的key值
            flag = False
            # 遍历anchors列表,如果有相同的主题作者执行回复数累加操作
            for i in anchors:
                if name == i['name']:
                    number = i['number'] + number
                    # print(number)
                    i.update({'name':i['name'], 'number':number})
                    flag = True     #有与当前作者相同的主题作者
                    break

if flag == False:
                anchor = {'name': name, 'number': number}
                anchors.append(anchor)
            # print(anchors)
        return anchors

#排序算法
    def __sort(self, anchors):
        anchors = sorted(anchors, key=lambda d: d['number'], reverse=True)
        return anchors

程序运行结果部分截图:

 

转载于:https://www.cnblogs.com/xiaoyoushang/p/10030312.html

“希希敬敬对”团队作业——敏捷冲刺5相关推荐

  1. “希希敬敬对”团队作业-敏捷冲刺1

    "希希敬敬对"百度贴吧小爬虫任务计划 Alpha任务分配计划: 百度贴吧小爬虫项目一共分成10个小的任务,分别分配给不同的同学. 以下是我们的10个任务: 以下是不同的3位组员分别 ...

  2. “希希敬敬对”团队作业-敏捷冲刺-3

    "希希敬敬对"百度贴吧小爬虫任务计划: 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成任务"对贴吧前10页进行爬取任务",明天将完成&qu ...

  3. “希希敬敬对”团队作业——敏捷冲刺4

    "希希敬敬对"百度贴吧小爬虫任务计划: 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成"爬取发帖主题人的主题回复数据"代码review,明 ...

  4. “希希敬敬对”团队作业-敏捷冲刺2

    "希希敬敬对"百度贴吧小爬虫任务计划 今天的团队讨论照片: 龙江腾(队长) 201810775001 完成 "贴吧名字关键字与URL关联"代码检查.明天将要完成 ...

  5. “希希敬敬对”团队作业——敏捷冲刺7

    1"希希敬敬对"百度贴吧小爬虫任务计划: 龙江腾(队长) 201810775001 程序生成exe文件遇到了些问题,程序生成apk文件的review,程序贴吧推广使用的review ...

  6. “希希敬敬对”团队作业——敏捷冲刺6

    1"希希敬敬对"百度贴吧小爬虫任务计划: 龙江腾(队长) 201810775001 完成爬下的发帖主题人信息进行图形化显示的review,明天完成程序生成exe文件,程序生成apk ...

  7. 团队作业——Alpha冲刺 6/12

    团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:编辑界面完成标题栏的开发,以及与已经完成gallery开发的同学,商讨我负责的界面中,图片滑动的具体措施. 明日任务:除了图像识别内容嵌入 ...

  8. 《团队作业第三、第四周》五小福团队作业--Scrum 冲刺阶段--Day6

    <团队作业第三.第四周>五小福团队作业--Scrum 冲刺阶段--Day6 一.项目燃尽图 二.项目进展 [20172301郭恺第六天的进展] 第五天完成的任务: 点击牌会抬起.选中牌的图 ...

  9. 团队作业——Alpha冲刺 4/12

    团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:着手进行编辑界面的布局,插入控件,并进行参数调整. 明日任务:继续完善编辑界面控件,学习控件交互功能. 郭剑南 今日任务:上网查阅学习了关 ...

最新文章

  1. css表示第一个元素和最后一个元素,CSS第一个和最后一个子元素
  2. 【Java 注解】自定义注解 ( 注解属性定义与赋值 )
  3. mysql怎么删除临时表里的数据_谈谈MySQL数据库中临时表的应用
  4. java面向对象编程集合边框_JAVA 面向对象 集合框架
  5. php商品报损流程,库存报损
  6. STM32工作笔记003---认识了解RTOS系统
  7. linux 常用正则表达式,Linux中基本正则表达式
  8. JAVA的四则运算规则_java四则运算规则
  9. Python学习入门基础教程(learning Python)--5.7 Python文件数据记录存储与处理
  10. 在Eclipse中实现C++ 11的完整支持
  11. 分布式常见面试题总结(2021)
  12. 幻方矩阵(魔方矩阵)
  13. Hadoop源代码分析
  14. IIC输出模式选择推挽输出还是开漏输出?
  15. 【java】环境变量安装
  16. UI设计技巧讲解之PS水墨泼墨效果制作
  17. Python入门(2)
  18. 【UE4】搭建局域网内VR直播 UE4.27
  19. 一首古诗带来的图数据库大冒险
  20. automator来解决mac terminal终端快速连接

热门文章

  1. 2018年第九届蓝桥杯 - 国赛 - C/C++大学B组 - B. 激光样式
  2. 征战蓝桥 —— 2015年第六届 —— C/C++A组第5题——九数组分数
  3. 1035:等差数列末项计算
  4. 【STM32】FreeRTOS中断配置
  5. 【Linux系统编程】线程栈大小
  6. [Qt教程] 第33篇 网络(三)FTP(一)
  7. 计算机是管理信息系统的必要条件吗,管理信息系统复习题(有答案)..doc
  8. java thread 内存泄露_Java ThreadLocal 内存泄露问题分析及解决方法。
  9. python的代码有哪些_Python有哪些有趣的代码呢,这些代码让
  10. 自认为有必要学习的Sql 总结,积累 mybatis