参考:  https://www.jianshu.com/p/20e41fc65dc8?tdsourcetag=s_pcqq_aiomsg

安装Faker库

pip install Faker

官网

https://faker.readthedocs.io/en/master/

例子:

>>> from faker import Faker
>>> fake2 = Faker() >>> >>> fake2.name() 'Audrey Robinson' >>> fake2.address() '4266 Fritz Shore\nLewischester, AL 24594-7593' >>> fake2.text() 'Odio porro unde sint aliquid beatae. Ex officiis porro nostrum laboriosam deleniti nisi. A aut molestiae ratione ipsam perspiciatis facere.\nDicta incidunt at deleniti recusandae accusamus quisquam.'

每次调用方法 fake.name() 都会产生不同的(随机)结果。这是因为 faker 向 faker.Generator.method_name() 调用了 faker.Generator.format(method_name)

本地化(让他出现中文)

在用 Faker() 创建 faker 实例时,可以为实例指定本地化区域参数,默认为 'en_US`,因此生成的姓名、地址等都是美国的。
要生成中文伪造数据,只需:

>>> fake = Faker("zh_CN")

方法介绍

如上面例子,每次调用 fake 实例的 name()方法时,都会产生不同随机姓名。fake 实例还有很多方法可用,这些方法分为以下几类:

  • address 地址
  • person 人物类:性别、姓名等
  • barcode 条码类
  • color 颜色类
  • company 公司类:公司名、公司email、公司名前缀等
  • credit_card 银行卡类:卡号、有效期、类型等
  • currency 货币
  • date_time 时间日期类:日期、年、月等
  • file 文件类:文件名、文件类型、文件扩展名等
  • internet 互联网类
  • job 工作
  • lorem 乱数假文
  • misc 杂项类
  • phone_number 手机号码类:手机号、运营商号段
  • python python数据
  • profile 人物描述信息:姓名、性别、地址、公司等
  • ssn 社会安全码(身份证号码)
  • user_agent 用户代理

address 地址

>>> fake.country()  # 国家
'奥地利'
>>> fake.city() # 城市 '郑州市' >>> fake.city_suffix() # 城市的后缀,中文是:市或县 '市' >>> fake.address() # 地址 '河北省巢湖县怀柔南宁路f座 169812' >>> fake.street_address() # 街道 '邯郸路W座' >>> fake.street_name() # 街道名 '合肥路' >>> fake.postcode() # 邮编 '314548' >>> fake.latitude() # 维度 Decimal('68.0228435') >>> fake.longitude() # 经度 Decimal('155.964341') 

person 人物

>>> fake.name() # 姓名
'单玉珍'
>>> fake.last_name() # 姓 '潘' >>> fake.first_name() # 名 '琴' >>> fake.name_male() # 男性姓名 '官平' >>> fake.last_name_male() # 男性姓 '安' >>> fake.first_name_male() # 男性名 '文' >>> fake.name_female() # 女性姓名 '许颖' 

barcode 条码

>>> fake.ean8()  # 8位条码
'12771363'
>>> fake.ean13() # 13位条码 '9133134950963' >>> fake.ean(length=8) # 自定义位数条码,只能选8或者13 '20417161' 

color 颜色

>>> fake.hex_color() # 16进制表示的颜色
'#671f6d'
>>> fake.rgb_css_color() # css用的rgb色 'rgb(237,74,237)' >>> fake.rgb_color() # 表示rgb色的字符串 '208,102,218' >>> fake.color_name() # 颜色名字 'Brown' >>> fake.safe_hex_color() #安全16进制色 '#ee4400' >>> fake.safe_color_name() # 安全颜色名字 'maroon' 

company 公司

>>> fake.company() # 公司名
'时空盒数字科技有限公司'
>>> fake.company_suffix() # 公司名后缀 '科技有限公司' 

credit_card 银行信用卡

>>> fake.credit_card_number(card_type=None) # 卡号
'375325478746231' >>> fake.credit_card_provider(card_type=None) # 卡的提供者 'VISA 13 digit' >>> fake.credit_card_security_code(card_type=None)# 卡的安全密码 '450' >>> fake.credit_card_expire() # 卡的有效期 '04/22' >>> fake.credit_card_full(card_type=None) # 完整卡信息 'Maestro\n秀芳 商\n502001016117 04/27\nCVV: 144\n' 

currency 货币

>>> fake.currency_code()  # 货币代码
'HNL'

date_time 时间日期

>>> fake.date_time(tzinfo=None) # 随机日期时间
datetime.datetime(2001, 3, 18, 17, 57, 44) >>> fake.iso8601(tzinfo=None) # 以iso8601标准输出的日期 '1973-11-16T22:58:37' >>> fake.date_time_this_month(before_now=True, after_now=False, tzinfo=None) # 本月的某个日期 datetime.datetime(2017, 11, 1, 14, 33, 48) >>> fake.date_time_this_year(before_now=True, after_now=False, tzinfo=None) # 本年的某个日期 datetime.datetime(2017, 3, 2, 13, 55, 31) >>> fake.date_time_this_decade(before_now=True, after_now=False, tzinfo=None) # 本年代内的一个日期 datetime.datetime(2010, 3, 26, 6, 33, 23) >>> fake.date_time_this_century(before_now=True, after_now=False, tzinfo=None) # 本世纪一个日期 datetime.datetime(2015, 7, 21, 19, 27, 53) >>> fake.date_time_between(start_date="-30y", end_date="now", tzinfo=None) # 两个时间间的一个随机时间 datetime.datetime(2005, 12, 3, 17, 17, 15) >>> fake.timezone() # 时区 'America/Guatemala' >>> fake.time(pattern="%H:%M:%S") # 时间(可自定义格式) '11:21:52' >>> fake.am_pm() # 随机上午下午 'PM' >>> fake.month() # 随机月份 '02' >>> fake.month_name() # 随机月份名字 'August' >>> fake.year() # 随机年 '1974' >>> fake.day_of_week() # 随机星期几 'Sunday' >>> fake.day_of_month() # 随机月中某一天 '02' >>> fake.time_delta() # 随机时间延迟 datetime.timedelta(13371, 27637) >>> fake.date_object() # 随机日期对象 datetime.date(1983, 1, 26) >>> fake.time_object() # 随机时间对象 datetime.time(17, 8, 56) >>> fake.unix_time() # 随机unix时间(时间戳) 1223246848 >>> fake.date(pattern="%Y-%m-%d") # 随机日期(可自定义格式) '1984-04-20' >>> fake.date_time_ad(tzinfo=None) # 公元后随机日期 datetime.datetime(341, 9, 11, 8, 6, 9) 

file 文件

>>> fake.file_name(category="image", extension="png") # 文件名(指定文件类型和后缀名) '增加.png' >>> fake.file_name() # 随机生成各类型文件 '提供.pdf' >>> fake.file_extension(category=None) # 文件后缀 'txt' >>> fake.mime_type(category=None) # mime-type 'image/png' 

internet 互联网

>>> fake.ipv4(network=False)  # ipv4地址
'104.225.105.10' >>> fake.ipv6(network=False) # ipv6地址 'dea6:ca11:39d0:b49f:fff1:82f1:bf88:698b' >>> fake.uri_path(deep=None) # uri路径 'search/categories' >>> fake.uri_extension() # uri扩展名 '.htm' >>> fake.uri() # uri 'https://www.wei.com/terms/' >>> fake.url() # url 'http://zheng.org/' >>> fake.image_url(width=None, height=None) # 图片url 'https://www.lorempixel.com/700/990' >>> fake.domain_word() # 域名主体 'hu' >>> fake.domain_name() # 域名 'hu.cn' >>> fake.tld() # 域名后缀 'com' >>> fake.user_name() # 用户名 'xia13' >>> fake.user_agent() # UA 'Opera/8.33.(Windows NT 5.1; an-ES) Presto/2.9.171 Version/10.00' >>> fake.mac_address() # MAC地址 'd6:38:cc:2a:76:b2' >>> fake.safe_email() # 安全邮箱 'mingli@example.net' >>> fake.free_email() # 免费邮箱 'tao44@gmail.com' >>> fake.company_email() # 公司邮箱 'jingzhong@wang.cn' >>> fake.email() # 邮箱 'changjun@hao.com' 

job 工作

>>> fake.job()#工作职位
'Dealer'
>>> fake.job() 'Musician' 

lorem 乱数假文

>>> fake.text(max_nb_chars=200) # 随机生成一篇文章
'语言无法应用为什一点国内.要求完成如何世界电脑发布作品.经济不同教育个人科技全国.\n在线学生发布信息上海状态.\n联系一次通过其实介绍世界.增加也是使用成功那个.\n商品免费管理公司.留言自己这种内容.\n次数内容知道这样女人感觉.操作他的生产出现如何报告文章只有.\n个人文化中心不能发布最新.质量一下提高.感觉最大工具表示最后计划.这是还有次数结果其实特别.' >>> fake.word() # 随机单词 '能力' >>> fake.words(nb=3) # 随机生成几个字 ['国家', '经营', '结果'] >>> fake.sentence(nb_words=6, variable_nb_words=True) # 随机生成一个句子 '重要更多我们作品地方增加.' >>> fake.sentences(nb=3) # 随机生成几个句子 ['制作上海学生.', '方式汽车一样技术帮助欢迎.', '说明一种深圳经营电话帖子.'] >>> fake.paragraph(nb_sentences=3, variable_nb_sentences=True) # 随机生成一段文字(字符串) '非常环境位置有限发展首页行业.情况对于出现部门这种觉得.产品以后因为虽然由于日本不同.' >>> fake.paragraphs(nb=3) # 随机生成成几段文字(列表) ['就是发布要求有关这里国际.美国设备深圳经营.首页也是支持报告.', '决定可是只有发现开始一直.最后有些项目正在深圳关系决定.下载注册图片更多进行他的那些.', '必须他们发生数据准备联系.同时这样内容学校精华.'] 

misc 杂项

>>> fake.binary(length=10)  # 随机二进制字符串(可指定长度)
b'U\xa9@\x1e\x96\xe7\xca\x82\x14f' >>> fake.language_code() # 随机语言代码 'tg' >>> fake.md5(raw_output=False) # 随机md5,16进制字符串 'cc4feebe419791332bbcff5e0fdf084a' >>> fake.sha1(raw_output=False) # 随机sha1,16进制字符串 '8ac0e9980f880860b6e45ae6fd257cc847b7ae8d' >>> fake.sha256(raw_output=False) # 随机sha256,16进制字符串 '033151f173f4a389e38e7df2363d89741f752c474e7bdfa2ee0a794bf0b505b5' >>> fake.boolean(chance_of_getting_true=50) # 随机真假值(得到True的几率是50%) False >>> fake.null_boolean() # 随机真假值和null >>> fake.null_boolean() True >>> fake.password(length=10, special_chars=True, digits=True, upper_case=True, lower_case=True) # 随机密码(可指定密码策略) 'F%722TJg_U' >>> fake.locale() # 随机本地代码 'hy_AM' >>> fake.uuid4() # 随机uuid 'a50d17e7-bc4f-37a3-27b3-04a24fdd0055' >>> 

phone_number 电话号码

>>> fake.phone_number() # 手机号码
'13334603608'
>>> fake.phonenumber_prefix() # 运营商号段,手机号码前三位 158 

python python数据

>>> fake.pyint()  # 随机int
7775
>>> fake.pyfloat(left_digits=None, right_digits=None, positive=False) # 浮点数 -84901.5586333 >>> fake.pydecimal(left_digits=None, right_digits=None, positive=False) # 随机高精度数 Decimal('-12273687068527.0') >>> fake.pystr(min_chars=None, max_chars=20) # 随机字符串(可指定长度) 'cblutNKFIyegfcHPrjzx' >>> fake.pybool() # 随机bool值 True >>> fake.pyiterable(nb_elements=10, variable_nb_elements=True) # 随机iterable ['ODfeVvcbAjPDBGwzljQw', 'https://www.tan.cn/list/category/homepage.php', 'YQlrsFkBieyKYaXlCljJ', Decimal('42778240911787.2'), Decimal('957411812.6383'), 'TGbqZufoiUXLQTZDrVcP', 'http://yan.com/posts/tags/search/terms.php', 3.680492634254, 'min57@hotmail.com', datetime.datetime(2001, 8, 16, 6, 10, 49), 'xMMOjlETIgKGqVGTrChG', 'yong83@xu.cn'] >>> fake.pylist(nb_elements=10, variable_nb_elements=True ) # 随机生成一个list ['KXQMXAkcEMSLfnIZkgJb', 'BtowiRsuIqyyULnSYYdr', datetime.datetime(2011, 10, 10, 14, 44, 2), datetime.datetime(2008, 5, 10, 1, 38, 38), 'juan47@hotmail.com', 'QEsdUpEqHLpThyWCjkNx', Decimal('-801375867.9'), 'ucDyeZnHAXfZtkwdVUbR', 4707, datetime.datetime(1974, 8, 7, 1, 54, 29)] >>> fake.pydict(nb_elements=10, variable_nb_elements=True) # 随机字典 {'其中': 9047, '一直': 'AUiUjuqccIdVAWSqzDbW', '选择': 'ddong@hotmail.com', '开发': datetime.datetime(1972, 10, 20, 14, 14, 9), '电影': 'KYmolBhkjSRxloXXFUUT', '文化': 2681, '这里': 'uyang@yahoo.com', '不会': 'ZPkwuxWsrJSHMNuFiWEx', '社会': 'CiujeaZMZSuyYwuKzEdN'} >>> fake.pyset(nb_elements=10, variable_nb_elements=True) # 随机set {'bhe@hotmail.com', 'http://fu.cn/list/home.htm', 'MlJluVirRkofBnKNtphM', 296, 'ghoUSHkuEGmCzlJFKyHZ', datetime.datetime(2008, 4, 4, 2, 55, 4), 'AgbynHjdvwYpUkbMsfqr', 8751, 9649, 'tangguiying@hotmail.com', Decimal('5727570036.91'), 'HmDkExndcQIOaTtsSpsc', 'hjQlLLXuHVVzENEwoHJK'} >>> fake.pytuple(nb_elements=10, variable_nb_elements=True) # 随机tuple ('http://www.cai.com/index/', datetime.datetime(1973, 7, 28, 2, 12, 23), 'khltJQMYJvIDRMYodviZ', 'uJezUsEqiHaiFxwOPWvl', 'qojwZHyytBSQQavkDaTu', 'AHUCHYuVJTHnoSEuQDSY', 1012, 'uEYVuzeTlgVhrnCATfKw', 'https://www.zhou.com/categories/tags/main/', 'LbLSFZPeATtzHvbmYhGr') >>> fake.pystruct() # 随机生成3个有10个元素的python数据结构 ([datetime.datetime(1996, 10, 26, 7, 35, 26), datetime.datetime(1998, 2, 28, 17, 20, 8), 'qianming@hotmail.com', 'yEWMrpTqtAHfbxqldGrb', 'YgKYOnrjuthOrOXhlYIl', datetime.datetime(1994, 12, 10, 0, 55, 30), Decimal('-6865068.3'), 'SYHFHiFvJlRVPcCKumUM', -8619.4354, 'kwGipwcASeALLeKdaWBi'], {'同时': 'BvtYdkNTHwZNMiIIRwKd', '空间': 310959668662.457, '特别': 'PZQDBuuQWkcdryMloyKS', '音乐': Decimal('-7219015925.0'), '项目': 'https://www.zhou.cn/main.php', '回复': 30.408750841, '显示': 'etZMrsjXJgZpDfZWhpoS', '大小': 7472, '类型': 'OsjpxgLqnTcdVOlHoMoP', '什么': 'http://www.xia.com/posts/app/index/'}, {'朋友': {0: -415025.243093017, 1: [1799, 585, 'shu@hotmail.com'], 2: {0: 9980, 1: 'qnOnFTzGnsjvXGybBnMF', 2: ['http://zheng.cn/list/search/tag/faq.html', Decimal('964285276661463.0')]}}, '发生': {1: -5339010.6134, 2: [datetime.datetime(1987, 6, 23, 15, 21, 45), 'SvSpvKqTXlJvdQhHScwM', 'PZjKOYzZzoNVsHLRcARQ'], 3: {1: 'https://www.yan.cn/register/', 2: 2191, 3: ['HMHKQuLRBQaaAypRbtHU', datetime.datetime(2014, 5, 24, 3, 32, 36)]}}, '我的': {2: 'linxia@yahoo.com', 3: ['http://gu.com/about.php', 'DhzpWYkgLCobGSHDLXzI', 1420], 4: {2: datetime.datetime(1986, 2, 22, 4, 50, 12), 3: 'rRHwQQzkpAMBQxwVITBa', 4: [datetime.datetime(

转载于:https://www.cnblogs.com/kaibindirver/p/11298147.html

Python的伪造数据生成器:Faker相关推荐

  1. Python之数据分析(规范数据生成器Faker,学习、数据分析、开发测试专用)

    文章目录 写在前面 一.生成数据写入csv文件中 二.基础信息 三.邮箱信息 四.地理信息 五.数字信息 六.时间信息 七.网络基础信息 八.浏览器信息 九.文本与文本加密信息 写在前面 无论是在我们 ...

  2. python进行随机数据生成——Faker的使用

    在需要使用到大批量数据的时候,即可以使用随机数据进行生成操作 Faker的介绍 Faker是python方向的一个第三方库,主要用来创造伪数据,使用Faker,人们不再需要手动或者手写随机数来生成数据 ...

  3. python测试框架数据生成工具最全资源汇总

    xUnit frameworks 单元测试框架 frameworks 框架 unittest - python自带的单元测试库,开箱即用 unittest2 - 加强版的单元测试框架,适用于Pytho ...

  4. python 神奇的第三方库 -Faker

    在做数据处理和数据分析的时候,我们总是少不了测试数据,比如你想对设一个合理的数据清洗方案,但有的时候事先能够找一些样例做测试,但大多数的情况是我们自己构建一个测试数据.但对于我这个选择困难症的人,每次 ...

  5. 命名管道 win7未响应_大数据分析Python建立分析数据管道

    如果您曾经想通过流数据或快速变化的数据在线学习Python,那么您可能会熟悉数据管道的概念.数据管道允许您通过一系列步骤将数据从一种表示形式转换为另一种表示形式.数据管道是数据工程的关键部分,我们将在 ...

  6. Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式

    木易 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又一款懒人神器问世了: Visual Studio Code的扩展,基于CodeBERT的Python文档字符串生成器. 看来现在,这群偷 ...

  7. Python装饰器、生成器、内置函数、Json-Day05

    装饰器 装饰器本质上就是一个python函数,它可以让其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值也是一个函数对象.它经常用于有切面需求的场景,比如:插入日志.性能测试.事务处理 ...

  8. python关键字列表的表达式,python 列表推导和生成器表达式的使用

    序列 序列是指一组数据,按存放类型分为容器序列与扁平序列,按能否被修改分为不可变序列与可变序列. 容器序列与扁平序列 容器序列存放的是对象的引用,包括list.tuple.collections.de ...

  9. python之迭代器,生成器

    一,迭代器 1.1什么是可迭代对象? 字符串.列表.元组.字典.集合都可以被for循环,说明他们都是可迭代的. 我们怎么来证明这一点呢? from collections import Iterabl ...

  10. python清洗文本数据_02.数据预处理之清洗文本信息

    准备30万条新闻数据 编号 新闻类别 新闻数量(条) 1 财经 37098 2 教育 41963 3 科技 65534 4 时政 63086 5 体育 65534 6 娱乐 65534 yield生成 ...

最新文章

  1. p1522 牛的旅行 Cow Tours
  2. 设计模式学习笔记(十六:桥接模式)
  3. MySQL常见备份与恢复方案
  4. 进阶篇-安卓系统:2.多点触控的交互处理
  5. 2021辽宁大洼高中高考成绩查询,2021大洼高中最后一跑——励志高考,逆袭人生...
  6. Linux 下的多线程下载工具
  7. php中now()的用法,PHP中的NOW()函数
  8. jquery-file-upload限制文件上传大小和文件个数
  9. Linux命令行解析参数之getopt_long
  10. 笑死人不偿命,你敢进来看看吗
  11. 栅栏密码(Fence crypto)
  12. 银行开发专业术语解释和银行系统开发架构的设计思想
  13. 物联网“智能水表”产品简要分析——从人民日报官微推送的NB-IoT应用谈起
  14. Java soso移动大厅项目
  15. 开氏温度与摄氏度换算_【知识分享】柴油密度与温度的关系
  16. Termux 速成指南
  17. JSP内置对象Session——setAttribute/getAttibute/removeAttribute
  18. 让人喷饭的郭德纲语录
  19. PEPC丨磷酸烯醇丙酮酸羧化酶应用实例展示
  20. 零散知识点20180403

热门文章

  1. mac ios自动化 appium-doctor 安装opencv4nodejs爬坑记录
  2. python ocr文字识别竖排繁体_小巧免费的图片文字识别OCR软件 支持简体识别和竖排繁体中文...
  3. envi神经网络分类原理,ENVI神经网络分类
  4. Java中new一个对象是一个怎样的过程?JVM中发生了什么?
  5. 计算机网络技术计划书,开设计算机网络技术专业项目可研计划书5喜欢就下吧(样例3)...
  6. 安信可云服务器,4g dtu测试,利用安信可进行透传测试
  7. 《大数据》2022年第4期目次摘要
  8. MATLAB中的数组
  9. Scrum和TFS2010
  10. php读取剪贴板内容,jQuery获取剪贴板内容的方法