单细胞测序流程(二)数据整理
**
数据整理
**
准备数据:之前所下载的样本数据
将之前所下载的样本数据进行解压,使用excel将文件打开
发现所下载样本有两种情况,一,有基因名,二,无基因名,只有基因id
一,有基因名
1.使用excel将文件打开所下载的样本发现第一行为样品名,第一列为基因名,需要滑到最后将注释信息删掉。
2.将excel滑到顶端,发现样品名和基因名重叠了,需要将样品名全部向后移动一位,并将第一行第一列的位置命名为id
移动前
移动后
3.从数据末端开始往上移动复制全部内容(不要直接ctrl+a,会将没用的空格也复制的),然后心创一个文件,文件名为geneMatrix,将刚刚所复制的内容进行粘贴。
如果样品名并不规范,那么就需要自己手动更改。
二,无基因名,只有基因id
1.使用excel打开文件需要滑到最后将注释信息删掉。
2.复制所有数据,新建一个文件命名为matrix.txt,将刚刚所复制的数据粘贴到新建的文本文件。
除了刚刚所建立的文本文件之外还需要human.gtf以及一个perl脚本(两个文件过大,无法上传,我将文件的百度网盘链接放到了微信公众号里了,可以自行去下载).
3.打开电脑的cmd输入perl -v检查你电脑是否有perl,如果没有百度搜索perl根据自己电脑系统进行下载,然后cd+空格+你的路径然后输入perl 脚本名称
等待光标回到大于号时代表脚本执行完毕,会发现文件夹下会出现一个geneMatrix文本文件,这就是整理好的数据。
单细胞测序流程(二)数据整理到这里就结束了
下一章会讲解单细胞的数据过滤和数据的标准
我所做的所有分析与教程的代码都会在我的个人公众号中,请打开微信搜索“生信学徒”进行关注,欢迎生信的研究人员和同学前来讨论分析。
ps:公众号刚刚建立比较简陋,但是该有的内容都不会少。
单细胞测序流程(二)数据整理相关推荐
- 单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图
质控和数据过滤 准备工具:R. 准备数据:上期经过整理的数据geneMatrix. 注意事项:R的安装目录和文件所在位置都不可有英文. R 语言所需安装的包: #if (!requireNamespa ...
- 单细胞测序流程(九)单细胞的GO圈图
系列文章目录 文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分 ...
- 单细胞测序流程(八)单细胞的marker基因转化和GO富集分析
系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...
- 单细胞测序流程(五)t-sne聚类分析和寻找marker基因
系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...
- 单细胞测序流程(六)单细胞的细胞类型的注释
系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...
- 单细胞测序流程(七)单细胞的细胞类型轨迹分析
系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...
- 单细胞测序流程(四)主成分分析——PCA
PCA PCA:线性降维,主要用于数据少的时候使用.看结果的时候,看打分的绝对值大小,而不是单独的看数据的大小,PCA 是最常用的降维方法,通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望 ...
- 单细胞测序流程(一)简介与数据下载
** 简介 ** 单细胞测序:单细胞测序从宏观来讲是指在单个细胞水平上进行测序. 单细胞转录组测序是指对于单个细胞水平上将mRNA反转录扩增后进行高通量测序的技术.单细胞测序通过在单个细胞水平上进行测 ...
- (待补充)单细胞测序的基础知识
什么是单细胞测序 单细胞RNA-Seq提供成千上万个单个细胞的 transcriptional profiling.这种水平的通量分析使研究人员能够在单细胞水平上了解哪些基因表达,多少数量以及异质样品 ...
- 单细胞测序之基本的数据处理基本流程
参考文献: Armand EJ, Li J, Xie F, Luo C, Mukamel EA. Single-Cell Sequencing of Brain Cell Transcriptomes ...
最新文章
- 中用BBP公式计算_【真课堂】7年级信息技术:数据计算
- 零基础学Python:自定义序列类的详细教程
- 【VBA研究】怎样将单元格数据赋给数组
- mpvue template compiler 中文版教程
- silverlight之datagrid的一个问题
- php试题库,PHP试题库一
- 【bzoj 3131】[Sdoi2013]淘金
- 群晖NAS教程(一) 、利用Docker安装MySQL8并远程访问
- python宿舍管理系统_python实现宿舍管理系统
- TextView 倾斜属性
- 国内IoT云平台横向对比
- html怎么偏左居中,word文档偏左怎么调到中间
- 计算机桌面底边出现库如何去掉,Win7电脑桌面图标有蓝底如何去掉?
- 微软确认:从4月13日起,Win10系统将强制卸载旧版Edge浏览器
- 计算机基本概念反思,计算机基础教学反思
- 安卓蓝牙实现即时通讯功能
- C语言文件操作实例代码
- goldengate——简介
- 用java编写博弈树_并行博弈树搜索算法-第8篇 写在最后的话:有趣的的博弈算法...
- PS笔刷:真实手写毛笔字母