下面是一个示例函数,它可能创建一个随机的格式良好的UTF-8序列,如Unicode 5.0.0的表3-7所定义:#!/usr/bin/env python3.1

# From Table 3–7 of the Unicode Standard 5.0.0

import random

def byte_range(first, last):

return list(range(first, last+1))

first_values = byte_range(0x00, 0x7F) + byte_range(0xC2, 0xF4)

trailing_values = byte_range(0x80, 0xBF)

def random_utf8_seq():

first = random.choice(first_values)

if first <= 0x7F:

return bytes([first])

elif first <= 0xDF:

return bytes([first, random.choice(trailing_values)])

elif first == 0xE0:

return bytes([first, random.choice(byte_range(0xA0, 0xBF)), random.choice(trailing_values)])

elif first == 0xED:

return bytes([first, random.choice(byte_range(0x80, 0x9F)), random.choice(trailing_values)])

elif first <= 0xEF:

return bytes([first, random.choice(trailing_values), random.choice(trailing_values)])

elif first == 0xF0:

return bytes([first, random.choice(byte_range(0x90, 0xBF)), random.choice(trailing_values), random.choice(trailing_values)])

elif first <= 0xF3:

return bytes([first, random.choice(trailing_values), random.choice(trailing_values), random.choice(trailing_values)])

elif first == 0xF4:

return bytes([first, random.choice(byte_range(0x80, 0x8F)), random.choice(trailing_values), random.choice(trailing_values)])

print("".join(str(random_utf8_seq(), "utf8") for i in range(10)))

由于Unicode标准的庞大性,我无法对此进行彻底的测试。还要注意字符的分布并不均匀(但是序列中的每个字节都是)。

python随机生成中文字符串_用Python生成随机UTF-8字符串相关推荐

  1. python随机生成中文句子_关于python:从语法或Ngrams生成随机句子?

    我正在编写一个程序,该程序应该吐出一个我自己选择的复杂性的随机句子. 举一个具体的例子,我想通过吐出语法结构的有效句子并使用我已经学习过的单词来帮助我的语言学习. 尽管我愿意接受其他想法,但我想使用p ...

  2. python画图显示中文乱码_解决Python pandas plot输出图形中显示中文乱码问题

    解决方式一: import matplotlib #1. 获取matplotlibrc文件所在路径 matplotlib.matplotlib_fname() #Out[3]: u'd:\\Anaco ...

  3. python解析pdf中文乱码_使用Python第三方库pdfminer提取PDF内容,并解决中文编码不支持的问题...

    这两天刚好完成一个提取人行简版征信报告PDF所有数据的小项目,中间踩了很多坑,尤其是对于汉字编码问题度娘也不太灵.为了方便后人,在这里记录下在这个过程中我遇到的问题以及我的解决方法. 我用的是mac系 ...

  4. python随机生成英文字母_在Python中生成随机字母

    有没有一种方法可以在Python中生成随机字母(如random.randint,但用于字母)? random.randint的范围功能会很好,但是拥有仅输出随机字母的生成器总比没有好. 简单: > ...

  5. c++ 随机字符串_关于Python的随机数模块,你必须要掌握!

    所谓七夕 前几天的文章这个七夕节,用Python为女友绘制一张爱心照片墙吧!收获了最近以来最高的浏览量,没枉费我熬到夜里3点赶出来的热点文章.有付出就总会有所回报,只是看这天来的早晚而已.七夕一个人看 ...

  6. python随机生成一组数据_使用Python random模块生成随机数据实例

    在本节中,我们将学习如何使用random模块(random)在Python中生成随机数和数据.该模块为各种分布(包括整数,浮点数(实数))实现了伪随机数生成器. 本文的目标: 以下是我们将在本文中介绍 ...

  7. python处理中文字符串_处理python字符串中的中文字符

    # -*- coding:utf-8 -*- import sys,os txta = open('a.txt','r') str = '' for line in txta: str += line ...

  8. python数据写入表格生成图片_使用Python制作一个GUI界面,将随机生成的姓名存入到Excel文件中...

    前面内容,我们详细介绍了如何使用Python生成一定数量的随机姓名. 生成一些随机姓名 如何用Python生成若干个随机姓名?男女取名有方法,不能千篇一律 之前,也提到过,我们在一些项目中,需要若干个 ...

  9. python查询和替换一个文本字符串_【Python】python面试题

    一些Python面试题 1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只 ...

  10. python数据项目分析实战技法_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(1/2)...

    第9章--随机森林项目实战--气温预测(1/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...

最新文章

  1. WPF WindowStyle为None
  2. 声场模型如何区分近场和远场
  3. 5.1 HTML5表单的创建
  4. 【机器学习基础】数学推导+纯Python实现机器学习算法12:贝叶斯网络
  5. python docx包_[Python02] Python-docx包的使用,快速处理 Word 文件!
  6. flv 自动播放 html autostart=true,《网页制作之FLV视频播放代码的编写.doc
  7. HTML-meta标签
  8. jquery 性能优化与实践
  9. linux时间与日期函数,Linux时间日期函数
  10. mysql日志恢复的时间格式_mysql binlog 日志恢复数据
  11. GridView网格控件
  12. 利用在线技术更改图片清晰度
  13. 一个简单的例子由易到难理解动态规划
  14. Beats:为 Filebeat 配置 inputs
  15. 解密红杉资本加密局,一个女人选择 ALL IN
  16. C#代码审计实战+前置知识
  17. 华为慧通面试后----我的首篇blog
  18. 计算机二级python基础知识总结-江苏省计算机二级python样卷
  19. C#读取和写入注册表
  20. c语言双缓冲怎么用,C语言游戏编程:GDI怎么实现双缓冲绘图去掉闪烁

热门文章

  1. 你真的懂redis的数据结构了吗?redis内部数据结构和外部数据结构揭秘
  2. 密码控件安全技术浅析及攻击实例
  3. Scrapy Architecture overview--官方文档
  4. Kafka设计解析(五):Kafka Benchmark--转
  5. graylog2+syslog-ng+mongodb构建集中管理日志服务器 --转载
  6. 探索 ConcurrentHashMap 高并发性的实现机制--转
  7. 解决 ERROR: JDWP Transport dt_socket failed to initialize, TRANSPORT_INIT(510)异常
  8. 若依项目linux部署
  9. springboot简易集成mybatisPlus+多数据源
  10. fastText、TextCNN、TextRNN……这里有一套NLP文本分类深度学习方法库供你选择 作者:机器人圈 / 微信号:ROBO_AI发表时间 :2017-07-28 图:pixabay