最近需要造一部分数据,需要用到人名,与其用脚本生成一些随机组合的汉字,不如在网上爬一些看似真实的姓名,所以找来了姓氏大全的网站,网址:http://www.resgain.net/xsdq.html

上图可以看到有很多不同的姓氏,每个姓氏(又是一个网页)里边有很多名字,这样轻轻松松就可以搞定一些真实的数据了,

此时只需要获取名字即可。

用到的库有urllib2 bs4,首先就是用urllib2获取请求,然后用beautifulsoup将请求内容生成可分析对象,然后查找标签即可,很简单,上代码好了。

# -*- coding: utf-8 -*-

import urllib2

import sys

from bs4 import BeautifulSoup

reload(sys)

sys.setdefaultencoding("utf-8")

def get_name(url):

name_list = []

request = urllib2.Request(url) # 创建对名字大全网站get请求

result = urllib2.urlopen(request) # 发出请求

soup = BeautifulSoup(result.read(), 'html.parser') # 生成可分析对象

if soup.find_all("a",class_="btn btn2"):

for name in soup.find_all("a",class_="btn btn2")[:15]: # 遍历所有的姓氏链接,此处只获取前15个姓氏

url = 'http:' + name.attrs['href'] #找到姓氏链接,再次返回此函数

get_name(url)

elif soup.find_all('a',class_='btn btn-link'):

for name in soup.find_all('a',class_='btn btn-link')[:10]: #找到不同姓氏的名字,此处只获取每个姓氏的前10个

name_list.append(name.text)

# print name.text

return name_list

if __name__ == '__main__':

url = "http://www.resgain.net/xsdq.html"

get_name(url)

python中文名字-Python 批量生成中文姓名(百家姓)相关推荐

  1. 【收藏】Python利用Excel+模板批量生成word文件

    Python利用Excel+模板批量生成word文件 最近帮朋友批量生成小区业主物业费未缴的律师函.朋友那有物业那边的表格数据,包括楼栋-房间号.业主姓名.欠费日期.欠款金额等信息.目的是需要将这些表 ...

  2. python中文昵称-python3随机生成中文字符(随机生成两字或三字的名字)

    第一种方法:Unicode码 在unicode码中,汉字的范围是(0x4E00, 9FBF) import random def Unicode(): val = random.randint(0x4 ...

  3. 【Python实例分析】批量生成海报--自动添加姓名和二维码

    最近参加了老男孩的一个python训练营,里面某项任务是要求在某个海报模板上批量添加姓名和二维码,生成类似下图的海报. 图中我用红色方框标记的是需要修改的地方,先来聊下自己的思路: 1.要进行图片操作 ...

  4. Python NLPIR2016 与 wordcloud 结合生成中文词云

    前叙 该博文继承之前的文章,进一步介绍NLPIR2016的使用,三个内容(利用NLPIR 的发现新词功能自动提取文本内的新词汇,解决worldcloud中英文混合只显示中文的问题,NLPIR与worl ...

  5. python词云 wordcloud+jieba生成中文词云图

    简介 Python+jieba+wordcloud+txt+gif生成动态中文词云 本文基于爬虫爬取某微信号三个月的文章为例,展示了生成中文词云的完整过程.本文需要的两个核心Python类库: jie ...

  6. Python助力性能测试——报文批量生成

    当前,我国金融体系内交易量持续增长,业务场景日趋复杂.系统交易量的增加,临时产生的集中业务需求,都会使服务器面临考验,因此,需要对系统进行性能测试. 在金融系统中,报文处理是必不可少的.各大金融机构间 ...

  7. python条形码库_python批量生成条形码的示例

    在工作中,有时会遇见需要将数字转换为条码的问题,每次都需要打开条码转换的网站,一次次的转换后截图,一两个还行,但是当需要转换的数量较多时,就会显得特别麻烦,弄不好还会遗漏或者重复,为了解决这个问题,使 ...

  8. 使用Python在Excel中批量生成条形码

    2019独角兽企业重金招聘Python工程师标准>>> 最近在研究盘点机盘点的问题,其中有一部分的商品没有的条形码,就想着自个生成条形码.参考了网上的教程,关于Excel批量生成条形 ...

  9. python办公自动化实例(二):批量生成派工单

    场景: 实现效果: 如下图1所示,有如下多条工单,需要向施工单位派发,每条工单都有一个相同模板,如图2所示 图1 图2 通过使用python程序,批量生成这些工单,并转为pdf文件,方便打印,效果如下 ...

  10. python输入名字-Python基础篇--输入与输出

    在任何语言中,输入和输出都是代码最基础的开始, so,先来聊一聊输入和输出 输出 在python中,我们一般用print() 输出,在括号里输入你想输出的信息,用引号包裹起来(单双三都可以),例如我们 ...

最新文章

  1. InfluxDB存储引擎Time Structured Merge Tree——本质上和LSM无异,只是结合了列存储压缩,其中引入fb的float压缩,字串字典压缩等...
  2. Linux怎么创建date文件,Linux下手工创建oracle database
  3. 王爽 汇编 实验10
  4. python处理rgb_如何在Python中读取给定像素的RGB值?
  5. .NET Core 3.1之深入源码理解HealthCheck(二)
  6. 库存商品表html源码,JSP+Servlet+数据库的方式完成一个简易的库存商品管理系统...
  7. 实现类的多态性,方法的重写和重载
  8. (96)Verilog HDL:点灯设计
  9. __attribute__((unused)):可能不会用到,消除编译警告
  10. Dnsmasq原理总结
  11. 栈的增长方向(ZZ)
  12. 在着手开发一款移动应用之前,我们需要考虑哪些因素?
  13. python timepicker_基于react开发的时间选择组件(TimePicker)
  14. 不规则动词过去式和过去分词归纳
  15. Pisces的属性配置文件加载
  16. DBeaver Read-only:No corresponding table column
  17. python微信抢红包神器_用Python实现微信自动化抢红包,再也不用担心抢不到红包了...
  18. 都说程序员越老越“不值钱”,想避免未来也“被优化”,怎么办?
  19. wordpress文章编辑器,wp文章图片排版关键词水印插件
  20. 鼠标移入或悬浮禁用图标,点击事件不生效

热门文章

  1. C++分享笔记:5X5单词字谜游戏设计
  2. 某市有甲、乙、丙、丁四个居民区,自来水有A,B,C三个水库供应
  3. OpenStack Queen 版本变更概述
  4. java apktool if_apktool使用教程
  5. Groovy 快速入门
  6. 计算机设备如何巡检,计算机联锁设备巡检作业指导书.pdf
  7. oracle adpatch 回退,Oracle EBS施用adpatch工具打patch过程
  8. for(in/of)/forEarch的区别和使用
  9. 通过经纬度获取地理位置
  10. Java中文分词组件 - word分词