我正在为scikit-learn的随机森林分类器生成特征向量.特征向量代表9个蛋白质氨基酸残基的名称.有20个可能的残留名称.所以,我使用20个虚拟变量来表示一个残基名称,对于9个残基,我有180个虚拟变量.

例如,如果滑动窗口中的9个残基是:ARNDCQEGH(每个字母代表蛋白质残基的名称),我的特征向量将是:

"True\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tFalse\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\t

False\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tTrue\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\tFalse\n"

另外,我尝试使用(1,0)替换(True,False)

在训练和测试了Scikit的随机森林分类器模型之后,我发现它完全不起作用.但是Scikit的随机森林可以与我的其他数据一起使用.

Scikit的随机森林可以处理分类变量还是虚拟变量?如果是这样,你能举例说明它的工作原理吗?

以下是我设置随机森林的方法:

clf=RandomForestClassifier (n_estimators=800, criterion='gini', n_jobs=12, max_depth=None, compute_importances=True, max_features='auto', min_samples_split=1, random_state=None)

非常感谢提前!

python随机森林筛选变量_如何使用虚拟变量来表示python scikit-learn随机森林中的分类数据...相关推荐

  1. python支付宝自动收能量_守护支付宝的财产,使用Python实现定时自动化收取蚂蚁森林能量...

    Python 兄弟姐妹们谁年轻是没有玩过农场,牧场游戏,现在有了蚂蚁森林,你是否有因忘记收取能量而被好友收取的经历呢? 如果你不是蚂蚁森林重度用户,被别人收取了能量可能对你来说没什么. 但如果你是蚂蚁 ...

  2. python 分类变量转为哑变量_机器学习笔记——哑变量处理

    在机器学习的特征处理环节,免不了需要用到类别型特征,这类特征进入模型的方式与一般数值型变量有所不同. 通常根据模型的需要,类别型特征需要进行哑变量处理,即按照特征类别进行编码,一般一个类别为k的特征需 ...

  3. python贝叶斯优化算法_【干货】手把手教你Python实现自动贝叶斯调整超参数

    [导读]机器学习中,调参是一项繁琐但至关重要的任务,因为它很大程度上影响了算法的性能.手动调参十分耗时,网格和随机搜索不需要人力,但需要很长的运行时间.因此,诞生了许多自动调整超参数的方法.贝叶斯优化 ...

  4. python 数组合并排重_并排深度学习:Julia vs Python

    python 数组合并排重 Julia could possibly be the biggest threat to Python. For a variety of applications, J ...

  5. python模块cv2人脸识别_手把手教你使用OpenCV,Python和深度学习进行人脸识别

    使用OpenCV,Python和深度学习进行人脸识别 在本教程中,你将学习如何使用OpenCV,Python和深度学习进行面部识别.首先,我们将简要讨论基于深度学习的面部识别,包括"深度度量 ...

  6. python构造方法与java区别_一张图秒懂Java和Python的区别,你知道吗?

    对于程序员的语言千千万JAVA\C\C++\PHP\Python不同的程序员使用着不同的语言,做着功能相似需求却不同的产品. 但是最近Python在人工智能的推动下突然出现在人们的面前,其实和Java ...

  7. python程序员年薪百万_想要成为年薪百万的Python程序员,这套面试题别错过

    近几年来,Python的运用范围越来越广,发展势头十分强劲.小到网页建设.网站搭建,大到人工智能AI.云计算.人脸识别.大数据分析等等尖端技术,都基于Python编程语言来实现. 在小伙伴们通过参加培 ...

  8. MySQL数据库变量_数据库参数_MySQL变量_系统变量_用户变量

    文章目录 MySQL 变量分类 系统变量 查看系统变量 设置系统变量 如何通过配置文件来设置变量值 通过命令行选项来设置变量值 动态设置全局级的系统变量 设置静态的系统变量 设置会话级的系统变量 引用 ...

  9. 编程入门python java和c语言_学习编程适不适合从Python入门?哪种语言更适合入门?...

    本文对比了C语言和Python语言,分析它们作为编程入门语言各自的利弊,并给出了我推荐的编程学习道路. 我本身已经入门了Python脚本语言,在进阶C语言和JAVA语言后,Python重学就轻松很多, ...

最新文章

  1. 使用mkfs.ext4格式化大容量磁盘
  2. 设计模式(一) 单例模式
  3. gulp+自动化编译html,gulp自动化构建html静态资源路径版本号添加和替换
  4. 【Python-ML】电影评论数据集文本挖掘
  5. (转载)cmd-命令大全及详解
  6. WPF Tile=” 变量 UI 双向绑定”x:Class=Problem/
  7. CodeForces - 555A Case of Matryoshkas(思维)
  8. Excel中这四个常出错的地方,你一定中过!
  9. 【转】从TXT导入到dataGridView
  10. DeepFashion服装数据集
  11. iMovie for Mac如何创建分屏效果?
  12. ztree的select设置,完笔
  13. 【无线通信协议笔记】蓝牙篇:传输速率
  14. 爬取豆瓣电影top250
  15. 福昕高级PDF编辑器Mac版PDF编辑器注册机激活下载版
  16. 上海淘融网络致广大客户的致歉信
  17. 用python画皮卡丘的代码-利用Python绘制萌萌哒的皮卡丘
  18. 阿里一二三面、HR面面经-后台
  19. 【ES知识】ES基础查询语法一览
  20. linux 双网卡bond命令,Linux下bond双网卡绑定(示例代码)

热门文章

  1. 大数据如何推动医疗行业的发展
  2. 最流行的轻量级php框架,GitHub - meolu/zan: zan 轻量级PHP微框架
  3. cad字体hztxt用什么代替_为什么CAD的字体库相同但打开图纸的效果却不同?
  4. Linux登录日志配置,Unix系统用户登录及操作命令日志配置的方法
  5. 2019交大计算机考研分数线,上海交大2019考研计算机软件与理论的复式分数..._考研_帮考网...
  6. android 自定义 build.gradle,Gradle for Android 第二篇( Build.gradle入门 )
  7. Spark之functions
  8. JdbcTemplate 的使用
  9. loadrunner中变量转换成一个参数
  10. 开源 java CMS - FreeCMS2.7 移动端栏目页静态化