我正在研究关于收入分配的项目......我想生成用于测试理论的随机数据 . 假设我有N = 5个国家,每个国家有n = 1000人口,我想为每个人口中的每个人产生随机收入(正态分布),收入的约束在0到1之间,并且在相同的平均值和不同的标准所有国家的偏差 . 我使用函数rnorm(n,meanx,sd)来完成它 . 我知道UNIFORM DISTRIBUTION(runif(n,min,max)有一些设置min,max但没有rnorm的参数 . 因为rnorm没有提供设置min和max值的参数 . 我必须编写一段代码检查随机数据集,看它们是否满足我的[0,1]约束 .

我成功生成了n = 100的收入数据 . 但是,如果我增加n = k次100,例如 . n = 200,300 ...... 1000 . 我的节目挂了 . 我可以看到为什么程序挂起,因为它只是随机生成数据而没有min,max的约束 . 因此,当我使用较大的n时,我将成功生成的概率小于n = 100 . 并且循环再次运行:生成数据,检查失败 .

从技术上讲,为了解决这个问题,我想把n = 1000分成小批量,比方说b = 100 . 由于rnorm在范围[0,1]中成功生成100个样本并且它是正态分布,如果我为每批100个样本分别运行10次100个样本的循环,它将很好地工作 . 然后,我会将10 * 100个样本的所有数据收集到一个1000的数据中,供以后分析 . 但是,在数学上说话,我不确定n = 1000的正态分布约束是否仍然通过这种方式得到满足 . 我附上了我的代码 . 希望我的解释对你很清楚 . 你的所有意见对我的工作都非常有用 . 非常感谢 .

# Update:

# plot histogram

# create the random data with same mean, different standard deviation and x in range [0,1]

# Generate the output file

# Generate data for K countries

#---------------------------------------------

# Configurable variables

number_of_populations = 5

n=100 #number of residents (*** input the number whish is k times of 100)

meanx = 0.7

sd_constant = 0.1 # sd = sd_constant + j/50

min=0 #min income

max=1 #max income

#---------------------------------------------

batch =100 # divide the large number of residents into small batch of 100

x= matrix(

0, # the data elements

nrow=n, # number of rows

ncol=number_of_populations, # number of columns

byrow = TRUE) # fill matrix by rows

x_temp = rep(0,n)

# generate income data randomly for each country

for (j in 1:number_of_populations){

# 1. Generate uniform distribution

#x[,j]

# 2. Generate Normal distribution

sd = sd_constant+j/50

repeat

{

{

x_temp

is_inside = TRUE

for (i in 1:n){

if (x_temp[i]max) {

is_inside = FALSE

break

}

}

}

if(is_inside==TRUE) {break}

} #end repeat

x[,j]

}

# write in csv

# each column stores different income of its residents

working_dir= "D:\\dataset\\"

setwd(working_dir)

file_output = "random_income.csv"

sink(file_output)

write.table(x,file=file_output,sep=",", col.names = F, row.names = F)

sink()

file.show(file_output) #show the file in directory

#plot histogram of x for each population

#par(mfrow=c(3,3), oma=c(0,0,0,0,0))

attach(mtcars)

par(mfrow=c(1,5))

for (j in 1:number_of_populations)

{

#plot(X[,i],y,'xlab'=i)

hist(x[,j],main="Normal",'xlab'=j)

}

java生成呈现正态分布的数_生成0和1范围内的正态分布数据相关推荐

  1. 生成对抗网络gan原理_生成对抗网络(GAN)的半监督学习

    前言 如果您曾经听说过或研究过深度学习,那么您可能就知道MNIST, SVHN, ImageNet, PascalVoc或者其他数据集.这些数据集都有一个共同点: 它们由成千上万个有标签的数据组成. ...

  2. 生成模型和判别模型_生成模型和判别模型简介

    生成模型和判别模型 Intro 介绍 Recently I gave a presentation at work, where I explained how I solved some probl ...

  3. java 随机生成不重复的数字_生成8位随机不重复的数字编号的方法

    生成随机不重复的数字编号在某些情况下也会用到,本文以生成8位随机不重复的数字编号为例与大家分享下具体的实现过程,感兴趣的朋友可以参考下 package com.jjinfo.common.util; ...

  4. java实现订单未支付失效_生成订单后一段时间不支付订单会自动关闭的功能该如何实现?...

    业务场景 我们以订单功能为例说明下:生成订单后一段时间不支付订单会自动关闭.最简单的想法是设置定时任务轮询,但是每个订单的创建时间不一样,定时任务的规则无法设定,如果将定时任务执行的间隔设置的过短,太 ...

  5. java压测请求线程数_程序员撕开京东 618 大促压测的另一面 | 原力计划

    作者 | 天涯泪小武 责编 | 王晓曼 出品 | CSDN博客 前天618大促演练进行了全链路压测,在此之前刚好我的热key探测框架也已经上线灰度一周了,小范围上线了几千台服务器,每秒大概接收几千个k ...

  6. python 生成001开始的序号_你知道嘛:Python内建序列通用操作有6种实现方法(赶快收藏)...

    本文内容主要介绍了Python内建序列通用操作6种实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下!!! 数据结构式通过某种方式(例如对元素进 ...

  7. java中获取文件总行数_关于java:如何以有效的方式获取文件中的行数?

    本问题已经有最佳答案,请猛点这里访问. 我有一个大文件. 它包括大约3.000-20.000行. 如何使用Java获取文件中的行总数? 从你的评论到答案来判断,你要找的词是"有效的" ...

  8. Java从键盘输入若干数_用java编程序:从键盘输入若干个整数,输出这些数中大于其平均值的数。...

    展开全部 引用1楼 christal yhy的答案,考虑到浮点数的存在,特在此基础上优化一下,代码如下: public static void main(String[] args) { Scanne ...

  9. java判断五位数回文数_【视频+图文】Java经典基础练习题(五):键盘输入一个五位数,判断这个数是否为回文数...

    能解决题目的代码并不是一次就可以写好的 我们需要根据我们的思路写出后通过debug模式找到不足再进行更改 多次测试后才可得到能解决题目的代码! 通过学习,练习[Java基础经典练习题],让我们一起来培 ...

最新文章

  1. Clojure入门指南(Getting Started)
  2. 网站建设ASP中UTF-8与GB2312编码转换乱码问题的解决方法
  3. AHP层次分析法解决用户价值评估
  4. Why Opportunity uses US as local instead of ZH - language determination in
  5. 历史数据如何处理_数据库表数据量大读写缓慢如何优化(1)【冷热分离】
  6. Domino下实现仿Google搜索提示效果
  7. java zip 文件夹_Java Zip文件文件夹示例
  8. mybatis如何处理参数
  9. 倒立摆源代码仿真matlab/simulink神经网络PID(模糊)控制校正LQR 神经网络 倒立摆控制 倒立摆LQR控制仿真 单级倒立摆的模糊控制 旋转倒立摆
  10. 木马的检测、清除与防范
  11. 交换机VLAN 模式trunk和access 区别
  12. AD快捷键设置(自定义)
  13. windows利用diskpart格式化磁盘
  14. in作为介词的用法_介词in,on,at的具体用法与区分
  15. 如何创建苹果开发者个人号账号P8证书
  16. linux fastQC 操作命令,Linux shell合并fastq测序数据/批量fastqc小脚本|merge|multiqc
  17. 【宇麦科技】某新能源企业的群晖nas存储方案:让“海量数据”跑出“加速度”
  18. MFRC522读卡封装(附源代码)
  19. csgo社区服务器(csgo社区服务器点了没反应)
  20. 什么是非功能性测试?

热门文章

  1. 系统架构师第一部分——架构设计基础
  2. windows 系统开机后-按键盘上的字母会出现数字-如何解决
  3. PPTP服务器的端口
  4. TinyXML2使用方法及示例
  5. java 文件下载浏览器没有弹出下载框
  6. css伪元素before和after用法详解
  7. sqldbx连不上oracle,SqlDbx连接oracle(无需安装Oracle客户端)
  8. 分布式柔性事务详解--基于事务型MQ
  9. Promise原理详解及实现方式
  10. Python笔记6——判断语句