全文共2270字,预计学习时长5分钟

图片来源:Unsplash/HackCapital摄

版本控制经验已逐渐成为所有数据科学家的必要能力。版本控制可以帮助数据科学家更好地做团队工作、促进项目协作、共享工作并帮助其他数据科学家重复相同或类似的过程。

即使是独立工作的数据科学家,在并入当前项目之前,能够先回滚更改或先对某个分支进行更改,并测试此更改不会终止任何项目内容也是非常有用的。

本文将介绍以下内容:

1. 什么是Github?

2. 为什么数据科学家需要使用Github?

3. 创建知识库

4. 分支

5. 合并申请功能

1. 什么是Github?

Github是最著名和最广泛使用的版本控制平台之一。GitHub使用一个名为Git的应用程序将版本控制应用于代码。项目文件被远程存储在一个被称为知识库(repository)的中心位置。每次在本地机器上进行更改并推送到Github时,远程版本都会被更新,并记录该提交的存储。如果要在提交之前回滚到项目的早期版本,则此次记录就可以让使用者执行此操作。

此外,由于项目文件是远程存储的,任何其他有访问权限的人都可以下载此文件并对项目进行更改。分支的概念,本质上意味着你对完全独立的项目做了一个临时的复制,它意味着你可以先在分支里进行更改,而不必担心终止任何东西。如果你正在做一个项目,而项目工作中的某个特性依赖于代码工作,那么这一点就尤其重要了。

2. 为什么数据科学家需要使用Github?

数据科学家需要使用GitHub的原因与软件工程师的原因基本相同——为了协作、“安全”地对项目进行更改,以及随后的追踪和回滚更改。

传统上,数据科学家不必非要使用GitHub,因为在通常情况下,将模型投入项目的过程(在此过程中版本控制变得至关重要)会被移交给软件或数据工程团队。然而,系统中有一个日益增长的趋势,即让数据科学家更容易写出代码并将其运用到产品中——参见H20.ai和谷歌云人工智能平台(Google Cloud AI Platform)之类的工具。因此,数据科学家能熟练使用版本控制变得越来越重要。

3. 创建知识库

图片来源:pexels.com/@divinetechygirl

现在简要介绍如何使用Github和Git从命令行中执行最常见的操作。如果还没有账户,需要先注册一个(完全免费)。

传送门:https://github.com/

若要从头创建存储库,请访问以上链接并单击“New”按钮。

接下来需要为项目输入名称,并选择是将此项目设为公共项目还是私有项目。

接下来,选中“Initializethis repository with a README”,然后单击“Create repository”。

现在可以添加和更改知识库中的文件了。要从命令行中执行此操作,首先需要按照说明下载并安装Git。

说明传送门:https://git-scm.com/downloads

要在本地处理项目,首先还需要克隆知识库。如果想克隆别人的项目来进行操作,也要遵循这个步骤。

cd my-directorygit clonehttps://github.com/rebeccavickery/my-repository.git

可以通过单击“Cloneor download”按键找到仓储的链接。

新目录现在将出现在当前项目目录中,其名称与知识库相同。这是项目的本地版本。

4. 分支

分支可以让使用者复制知识库、在复制的知识库里进行更改并在合并到主项目之前测试它们是否正常工作。最好的做法是始终在分支上进行更改,而不是在主项目上工作。在创建分支之前,最好检查本地项目是否是和远程知识库库一样的最新版本。可以通过输入以下内容来检查状态:

git status

如果你的并不是最新版本,可以简单地输入“gitpull”。

要建立并检查一个分支,输入以下内容。

git branch my-branchgit checkout my-branch

现在就可以进行更改,在合并分支和主项目之前,它们不会影响远程仓储。现在可以更改README.md文件,并完成提交和合并此次更改的过程。

在你喜欢的文本编辑器中打开README.md文件并进行任何更改。这里使用Sublime Text(https://www.sublimetext.com/)并只在文件中添加一行。

5. 合并申请功能

在协作项目中工作的最佳做法是使用合并申请功能(pullrequests)。合并申请功能是允许使用者或其他人在将更改合并到主版本之前查看所做出的更改的过程。在打开合并申请功能之前,需要添加并提交更改。

git add .git commit -m "change to README.md"git push —set-upstream origin my-branch

只需要在第一次创造新分支时添加分支:“set-upstreamorigin my-branch”。然后就能在远程知识库中看见此消息。

单击“compare and pullrequest” ,然后再单击“create pull request”。

此时,如果在项目中与其他人或团队协作,可能会要求其他人去检查更改。他们可以添加评论,当所有人对更改满意时,就可以合并申请功能了。

这时,此改变将被并入主项目中。

如果完成了在此分支上的工作,最好点击“delete branch”按钮删除它。

Github指南传送门:https://guides.github.com/

留言 点赞 关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

数据更改后推送_合格的数据科学家,这些Github知识必须了解相关推荐

  1. websocket实现GPS数据的实时推送与地图的展示(优化)

    概述 前两天,发布了一片文章websocket实现GPS数据的实时推送与地图的展示,文章发出后引来了不少读者的关注,也有不少读者要求做进步一优化.本文应大家的要求,对上文的内容做一个优化,优化地方包括 ...

  2. linux-windows主动推送文件同步目录数据 linux-windows数据目录同步

    linux->windows主动推送文件同步目录数据 linux-windows数据目录同步 1 .windows下安装openssh for windows工具,下载地址 https://ww ...

  3. 微信生成带参数的二维码,合成海报,扫码后推送小程序?

    微信服务号渠道二维码功能,支持生成带参数二维码,合成海报二维码,微信扫码后推送内容:结合微号帮平台48小时信息推送,推送微信小程序. 带参二维码 海报二维码 微信扫码后回复 48小时信息推送 在微号帮 ...

  4. 【转】设备数据通过Azure Functions 推送到 Power BI 数据大屏进行展示

    设备数据通过Azure Functions 推送到 Power BI 数据大屏进行展示(1.准备工作) 原创 Sean Yu 云计算实战 2019-12-06 本案例适用于开发者入门理解Azure F ...

  5. 解决git rebase操作后推送远端分支不成功的问题

    解决git rebase操作后推送远端分支不成功的问题 参考文章: (1)解决git rebase操作后推送远端分支不成功的问题 (2)https://www.cnblogs.com/xinmengw ...

  6. python怎么做彩票概率_小白学数据小抄放送 Python,R,大数据,机器学习

    原标题:小白学数据小抄放送 Python,R,大数据,机器学习 大数据文摘作品,转载要求见文末 作者 | Elaine,田桂英,Aileen 导读:前段时间小白学数据专栏出了一期Python小抄表,后 ...

  7. 更改极光推送通知栏图标

    //更改极光推送图标 private void initChangeJPushLogo() {BasicPushNotificationBuilder builder = new BasicPushN ...

  8. Django删除数据表后,再重新生成新数据表

    删除数据表后,数据库的Django migrations数据未删除,如果直接命令行调用如下命令,是不会再生成数据表的 Python manager.py makemigrations Python m ...

  9. 堆栈(Strack)是指这样一段内存,它可以理解为一个筒结构,先放进筒中的数据被后放进筒中的数据“压住”,只有后放进筒中的数据都取出后,先放进去的数据才能被取出,称为“后进先出”。堆栈的长度可随意增加

    堆栈(Strack)是指这样一段内存,它可以理解为一个筒结构,先放进筒中的数据被后放进筒中的数据"压住",只有后放进筒中的数据都取出后,先放进去的数据才能被取出,称为"后 ...

最新文章

  1. 【工作感悟】java编程规范pdf下载
  2. 银行招聘网计算机类笔试,中国人民银行计算机类笔试模拟题
  3. Gated Convolution
  4. 团队-爬取豆瓣电影TOP250-简单团队一阶段互评
  5. poj 1276 Cash Machine 背包问题
  6. python如何使用ppip安装xlwt_如何安装python xlwt
  7. SEO已死,真的吗,十年SEO从业者的思考
  8. 使用Seay进行代码安全审计
  9. Oracle分析函数汇总(超全)
  10. 计算机图形学代码之三角形绘制
  11. audio realtek 耳机没声_解决Realtek High Definition Audio 声卡前面板耳机无声音方法
  12. Excel表格将多个单元格内容合并到一个单元格中_工作中使用记录_2021-03-29
  13. 如何将一个div水平垂直居中?6种方法做推荐
  14. IE Internet选项快捷键
  15. 问题 E: LZY去年买了个表
  16. Latex在线简历制作
  17. Python爬取豆瓣各类电影排行榜
  18. 拼多多产品点击低怎么办?
  19. Android二维码多码识别,相册选择二维码,自定义扫码界面
  20. 三种安装httpd的方法

热门文章

  1. PHP代码静态分析工具PHPStan
  2. 归并排序模板(附求逆序对)
  3. JavaScript设计模式系列四之外观模式(附案例源码)
  4. 【下载】RSA1024及RSA2048加密算法漏洞CVE-2017-7526 问题出在GnuPG加密库
  5. LinkedList模拟队列和堆栈
  6. 日常总结:自学操作系统基础的一些领悟
  7. KB929828:在Vista中使用Sysprep /generalize时出错
  8. 接入路由器做NAT,做限速的一些想法
  9. 优先队列如何按照pair 的第二关键字排序(对比vector按照pair第二关键字排序)
  10. vectorPoint points未声明的标识符