文章目录

  • GitHub Archive
    • github存档计划
    • 代码归档策略
    • github 北极代码库
    • 如何确保未来可以使用我们的软件
    • github archive计划 FAQ
  • 参考

GitHub Archive

Archiving a GitHub repository
官网: https://help.github.com/cn/github/creating-cloning-and-archiving-repositories/archiving-a-github-repository

存档仓库:
您可以存档仓库,将其设为对所有用户只读,并且指出不再主动维护它。 您也可以取消存档已经存档的仓库。

关于存档仓库
在存档仓库时,要让人们知道不再主动维护项目。

在仓库存档后,便无法添加或删除协作者或团队。 具有仓库访问权限的贡献者只能对项目复刻或标星。

当仓库存档后,其议题、拉取请求、代码、标签、重要事件、项目、wiki、版本、提交、标记、分支、反应和注解都会变成只读。 要更改存档的仓库,必须先对仓库取消存档。

关于 GitHub 存档计划
GitHub 存档计划 允许第三方合作伙伴使用公共 API 存档公共仓库。 这些合作伙伴以不同频率存档不同类型的数据,并向公众提供数据。 GitHub 存档计划 还通过持续以各种数据格式和位置存储多个副本来保护数据,包括设计为至少持续 1,000 年的超长期存档。( 更多信息请参阅 GitHub 存档计划:https://archiveprogram.github.com/)

您可以选择退出仓库的 GitHub 存档计划。 更多信息请参阅“选择加入或退出公共仓库的 GitHub 存档计划”。

github存档计划

官网https://archiveprogram.github.com/

Preserving open source software for future generations.
为后代保留开源软件

Explore some of the top projects archived in the 2020 Arctic Vault program
探索2020年北极金库计划中的一些顶级项目

这里列了好多github上的知名项目:

dotnet/core
torvalds/linux
python/cpython
bitcoin/bitcoin
rails/rails
docker/machine
openssl/openssl
nodejs/node
Homebrew/brew
php/php-src
twbs/bootstrap
microsoft/TypeScript
apache/hadoop
v8/v8
Alamofire/Alamofire
gatsbyjs/gatsby
fastai/fastai
jimweirich/builder
zeit/next.js
WordPress/WordPress
rust-lang/rust
golang/go
angular/angular
jquery/jquery
ruby/ruby
facebook/react
CocoaPods/CocoaPods
jupyter/notebook
zeromq/libzmq
postgres/postgres
microsoft/MS-DOS
Netflix/chaosmonkey
robbyrussell/oh-my-zsh
xamarin/xunit
grafana/grafana
graphql/graphql-js
github/gh-ost
rspec/rspec
libgit2/libgit2
Many more

The world is powered by open source software.
It is a hidden cornerstone of modern civilization, and the shared heritage of all humanity. The mission of the GitHub Archive Program is to preserve open source software for future generations.

GitHub is partnering with the Long Now Foundation, the Internet Archive, the Software Heritage Foundation, Arctic World Archive, Microsoft Research, the Bodleian Library, and Stanford Libraries to ensure the long-term preservation of the world’s open source software. We will protect this priceless knowledge by storing multiple copies, on an ongoing basis, across various data formats and locations, including a very-long-term archive designed to last at least 1,000 years.

世界是由开源软件驱动的。

它是现代文明隐藏的基石,是全人类共同的遗产。GitHub存档程序的任务是为后代保留开源软件。

GitHub正与Long Now基金会、Internet Archive、软件遗产基金会、Arctic World Archive、Microsoft Research、Bodleian图书馆和斯坦福图书馆合作,以确保世界开源软件的长期保存。我们将通过不断地跨各种数据格式和位置存储多个副本来保护这一无价的知识,包括一个设计为至少可保存1000年的长期存档。

Why we use multiple forms of storage
As today’s vital code becomes yesterday’s historical curiosity, it may be abandoned, forgotten, or lost. Worse, albeit much less likely, in the case of global catastrophe, we could lose everything stored on modern media in a few generations. Archiving software across multiple organizations and forms of storage will help ensure its long-term preservation: online archivists call this “LOCKSS,” for Lots Of Copies Keeps Stuff Safe.

A worrying amount of the world’s knowledge is currently stored on ephemeral media: hard drives, SSDs, CDs good for a few decades, backup tapes whose notional 30-year lifespans assume strictly controlled heat and humidity. Because (some) hardware can be much longer-lived, there exists a range of possible futures in which working modern computers exist, but their software has largely been lost to bit rot. The GitHub Archive Program will include much longer-term media to address the risk of data loss over time.

为什么我们使用多种形式的存储

当今天的重要代码成为昨天的历史好奇心时,它可能会被抛弃、遗忘或丢失。更糟糕的是,在全球大灾难的情况下,我们可能会在几代人内失去存储在现代媒体上的一切。跨多个组织和存储形式的归档软件将有助于确保其长期保存:在线归档人员将此称为“锁”,因为许多副本可以保证数据的安全。

目前,世界上令人担忧的知识储存在短暂的媒体上:硬盘、固态硬盘、几十年的CD、概念上30年寿命的备份磁带,它们的热和湿度都受到严格控制。因为(某些)硬件可以使用更长的时间,所以存在着一系列可以工作的现代计算机的未来,但它们的软件很大程度上已被比特腐烂所丢失。GitHub存档程序将包括许多长期的介质,以解决随时间推移数据丢失的风险。

How the future might use our code
Future historians will be able to learn about us from open source projects and metadata. They might regard our age of open source ubiquity, volunteer communities, and Moore’s Law as historically significant. We are already partnering with Stanford Libraries to help archive curated repositories along with the cultural and other context in which they are set, as key elements of wide-ranging historical and social research and analysis.

未来如何使用我们的代码

未来的历史学家将能够从开源项目和元数据中了解我们。他们可能认为我们这个开源无处不在的时代、志愿者社区和摩尔定律具有历史意义。我们已经在与斯坦福大学图书馆合作,帮助归档馆藏以及它们所处的文化和其他背景,作为广泛的历史和社会研究和分析的关键要素。

It is easy to envision a future in which today’s software is seen as a quaint and long-forgotten irrelevancy, until an unexpected need for it arises. Like any backup, the GitHub Archive Program is also intended for currently unforeseeable futures as well.

人们很容易想象一个未来,在这个未来中,今天的软件被看作是一个古雅而被遗忘已久的无关紧要的东西,直到出现对它的意外需求。与任何备份一样,GitHub存档程序也适用于当前不可预见的未来。

代码归档策略

https://archiveprogram.github.com/

一种灵活、持久的代码归档策略

我们采用了一种“pace layers”策略来归档代码,其灵感来源于长期以来的创始人Steward Brand。此方法旨在通过提供一系列存储解决方案(从实时存储到长期存储)最大限度地提高灵活性和耐用性。存档程序分为三层:hot, warm, and cold.

Hot:近实时
warm:每月更新至每年
cold:每5年更新一次

github
每次推到GitHub,我们都会将您的Git数据复制到世界各地的多个数据中心。此外,我们将Git数据、问题、拉取请求和所有数据的备份存储在GitHub的多个位置。所有这些数据都可以通过GitHub API实时获得。

GH TORRENT
GHTorrent监视GitHub公共事件时间线,归档这些事件,并使用BigQuery使它们可查询。您还可以按小时、天或月下载快照。

GH ARCHIV
GHArchive监视GitHub公共事件时间线,归档这些事件,并递归地爬网和归档其内容和依赖项。这些档案将每天或每月提供下载。

INTERNET ARCHIVE
互联网档案馆著名的Wayback机器将抓取GitHub的公共存储库,包括新的存储库、问题、拉取请求、Wiki等,并将副本存储在旧金山和其他地方的硬盘上。这些档案将通过git和https公开。

SOFTWARE HERITAGE FOUNDATION(软件遗产基金会)
软件遗产基金会将定期对GitHub进行爬网,并将其公共repo添加到其档案中,为其提供公共API访问。

BODLEIAN LIBRARY(博德莱恩图书馆)
牛津大学博德莱恩图书馆将保留GitHub的10000个最受关注和最依赖的存储库作为复制Piql电影卷,为北极代码库提供冗余。

ARCTIC WORLD ARCHIVE (北极世界档案馆)
2020年2月2日,GitHub捕获了每个活动公共存储库的快照,保存在GitHub北极代码库中。这些数据将存储在3500英尺的胶卷上,由专门从事长期数据存储的挪威公司Piql提供和编码。薄膜技术依赖于聚酯上的卤化银。根据国际标准化组织(ISO)的测量,这种介质的使用寿命为500年;模拟老化试验表明,Piql薄膜的使用寿命是原来的两倍。

PROJECT SILICA FROM MICROSOFT RESEARCH(微软研究公司的二氧化硅项目)
GitHub存档程序正与微软的Silica项目合作,通过使用飞秒激光将所有活跃的公共存储库写入石英玻璃盘中,最终将它们存档超过10000年。

github 北极代码库

The GitHub Arctic Code Vault is a data repository preserved in the Arctic World Archive (AWA), a very-long-term archival facility 250 meters deep in the permafrost of an Arctic mountain. The archive is located in a decommissioned coal mine in the Svalbard archipelago, closer to the North Pole than the Arctic Circle. GitHub will capture a snapshot of every active public repository on 02/02/2020 and preserve that data in the Arctic Code Vault.

code
How the cold storage will last 1,000 years
Svalbard is regulated by the international Svalbard Treaty as a demilitarized zone. Home to the world’s northernmost town, it is one of the most remote and geopolitically stable human habitations on Earth.

The AWA is a joint initiative between Norwegian state-owned mining company Store Norske Spitsbergen Kulkompani (SNSK) and very-long-term digital preservation provider Piql AS. AWA is devoted to archival storage in perpetuity. The film reels will be stored in a steel-walled container inside a sealed chamber within a decommissioned coal mine on the remote archipelago of Svalbard. The AWA already preserves historical and cultural data from Italy, Brazil, Norway, the Vatican, and many others.

While Svalbard is affected by climate change, it’s likely to affect only the outermost few meters of permafrost in the foreseeable future. Warming is not expected to threaten the stability of the mine. The mine’s proximity to the famous Global Seed Vault, only a mile away, reinforces Svalbard’s status as a stable, very-long-term archive site for humanity’s collective knowledge.

What’s in the 02/02/2020 snapshot
The 02/02/2020 snapshot archived in the GitHub Arctic Code Vault will sweep up every active public GitHub repository, in addition to significant dormant repos. The snapshot will include every repo with any commits between the announcement at GitHub Universe on November 13th and 02/02/2020, every repo with at least 1 star and any commits from the year before the snapshot (02/03/2019 - 02/02/2020), and every repo with at least 250 stars. The snapshot will consist of the HEAD of the default branch of each repository, minus any binaries larger than 100KB in size—depending on available space, repos with more stars may retain binaries. Each repository will be packaged as a single TAR file. For greater data density and integrity, most of the data will be stored QR-encoded, and compressed. A human-readable index and guide will itemize the location of each repository and explain how to recover the data.

GitHub北极密码库是保存在北极世界档案馆(AWA)中的一个数据存储库,这是一个非常长期的档案设施,位于北极山区250米深的永久冻土中。档案馆位于斯瓦尔巴特群岛一座退役煤矿内,比北极圈更靠近北极。GitHub将在2020年2月2日捕获每个活动公共存储库的快照,并将这些数据保存在Arctic代码库中。

代码

cold storage将如何维持1000年

斯瓦尔巴群岛受《斯瓦尔巴群岛国际条约》管制,成为非军事区。它是世界上最北部城镇的所在地,是地球上最偏远、地缘政治最稳定的人类居住区之一。

AWA是挪威国有矿业公司Store Norske Spitsbergen Kulkompani(SNSK)和非常长期的数字保护提供商Piql AS共同发起的。AWA致力于永久性的档案存储。这些胶卷将存放在斯瓦尔巴特群岛一个废弃煤矿的密封室内的钢制容器中。AWA已经保存了意大利、巴西、挪威、梵蒂冈和其他许多国家的历史和文化数据。

虽然斯瓦尔巴受到气候变化的影响,但在可预见的未来,它很可能只影响最外层几米的永久冻土。预计升温不会威胁矿井的稳定。该矿距离著名的全球种子库只有一英里之遥,加强了斯瓦尔巴特作为一个稳定的,非常长期的人类集体知识档案网站的地位。

哪些仓库会存储呢?
On February 2, 2020 we took a snapshot of all of GitHub’s public repositories that have been active within recent months.
2020年2月2日,我们对最近几个月内活跃的GitHub所有公共存储库进行了快照。

The archive will include every repo with any commits between the announcement at GitHub Universe on November 13, 2019 and February 2, 2020,
该归档将包括2019年11月13日至2020年2月2日在GitHub Universe发布公告期间的每一个有commits的仓库。

every repo with at least 1 star and any commits from the year before the snapshot (02/02/2019 - 02/02/2020),
每一个至少1星和任何提交的仓库,在快照前一年(2019年2月2日-2020年2月2日)

and every repo with at least 250 stars.
和每个至少有250个stars的仓库。

Plus, gh-pages for any repository that meets the aforementioned criteria.
另外,满足上述标准的任何存储库的gh页面。

如何确保未来可以使用我们的软件

我们将召集一个GitHub档案项目咨询小组,包括人类学、考古学、历史学、语言学、档案学、未来主义等方面的专家,就档案中应包括哪些内容以及如何与继承人进行最佳沟通向我们提供建议。

一千年是很长的一段时间。像吴哥窟、大津巴布韦和马丘比丘这样的古代遗迹,一千年前还没有建成。尽管如此,我们可以考虑并计划在今后1000年中有广泛的可能性。这个计划建立在我们今天的最佳想法之上。

档案的介绍将包括QR解码、文件格式、字符编码和其他关键元数据的技术指南,以便将原始数据转换回源代码供将来的其他人使用。档案馆还将包括一棵技术树——一个路线图和罗塞塔石,供未来好奇的人们继承档案馆的数据。

技术树概述了存档和如何使用它,它将作为软件开发和计算的快速入门手册,与存档的用户指南捆绑在一起。它将描述如何从原始数据向后工作到源代码,并提取项目、目录、文件和数据格式。

受长期以来的《文明手册》的启发(包括其中的一些内容),该档案馆还将包括应用开源的信息和指导,以及我们今天如何使用开源的背景,以防未来的读者需要从头开始重建技术。就像《旅行者1号》和《旅行者2号》的黄金纪录一样,它将有助于向未来传达我们这个世界的故事。

在人类可以使用现代计算机,但没有软件可以运行的未来,档案馆及其技术树可能是非常有价值的。然而,它的价值更可能是历史性的,也许可以确保今天的技术不会被一个不经意地认为无关紧要的明天所丢失,直到我们的软件被发现意外使用。

github archive计划 FAQ

官网:https://archiveprogram.github.com/faq/

参考

GitHub Archive分析 - 2015最受瞩目的项目们
参考URL: https://segmentfault.com/a/1190000004401498
官方视频:https://www.bilibili.com/video/av76528095/

GitHub Archive-为了人类文明永存!相关推荐

  1. 你的代码会被GitHub埋在北极,保存1000年,用二维码胶片备份人类文明

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 你写的代码将被会被GitH ...

  2. GitHub 启动代码永久保存计划,为人类文明留“火种”?

    一句话新闻 GitHub 宣布,为了把开源软件留给子孙后代,将在 2020 年 2 月 2 日为所有公共存储库生成快照,保存在北极一个地下 250 米的废弃煤矿,快照储存在胶片上,寿命高达 1000 ...

  3. 科学界5个终极难题,如果有一个被解决,人类文明将升级

    来源:科学杂志  纵观人类发展历史,似乎每到了一定的阶段学术界就会有重大难题出现,例如人类的起源问题.为此有科学家总结出了人类历史上五大终极难题,如果有一个问题被解决的话,那么人类文明会实现质的飞跃. ...

  4. 信息技术守护人类文明DNA

    来源:中国青年报   作者:胡春艳 21世纪最时髦的技术,改变的不仅是未来,在被称为"最古老的研究"的文物与博物馆界,感受到的变化可能更加显著. 天津大学文化遗产保护与传承信息技术 ...

  5. 马斯克再发声,称人工智能是人类文明面临的最大风险

    在马斯克眼中,AI是一个需要提前预设监管的东西. 因为给人们生活和工作带来了极大的便利性,人工智能热潮可以说是愈演愈烈.不过,在受到众人追捧的同时,人工智能也被许多人所警惕,比如特斯拉汽车兼私营航天企 ...

  6. 计算机与数学文化论文参考文献,数学文化与人类文明论文.doc

    . . 毕业论文 论文题目:数学文化与人类文明 引 言 在当今社会,科学技术正以迅猛的势头强烈地影响.渗透并冲击着人类社会几乎所有的领域,数学与数学技术是其中最强劲的浪潮之一.在新技术革命和信息革命中 ...

  7. 遇见未来 | 软件定义数据中心:人类文明运行在软件之上

    互联网及其延伸,正在导向我们走向一个新的时代,软件技术在新一轮革命技术中毫无疑问是核心竞争力之一.C++语言发明人Biarne Stroustrup说,人类文明运行在软件之上,也突出了软件技术的重要地 ...

  8. 恐龙为何不发明计算机,为什么恐龙没有产生智慧文明,而人类文明反而如此发达?...

    原标题:为什么恐龙没有产生智慧文明,而人类文明反而如此发达? 地球已经45亿岁,也经历了五次物种灭绝.在这个漫长的历史长河中,地球上曾经出现过许许多多物种,然而绝大部分物种随着时间推移渐渐地消失得无影 ...

  9. 虚拟化与元宇宙:人类文明演化的奇点与治理

    摘 要:当前人类文明显然正在面临着来自网络虚拟化的重大挑战与转型,元宇宙作为网络虚拟化进程的最终形态,成为人类文明演化进程的重要历史性节点.元宇宙的形成与发展,势必会引致对传统社会的进一步数字化替代, ...

最新文章

  1. 小米副总裁崔宝秋:智能手机是今天AI技术最大的平台,AIoT又让AI无处不在 | MEET 2021...
  2. Redis 哨兵架构基础
  3. 解决 pandas 读取数据时内存过大的问题
  4. ThinkPHP 3.2.3 视图模型的使用
  5. Method for Discovering Network Topology中文翻译【Z-Stack Home 1.2.0开发文档】
  6. linux端口混杂模式,linux端口混杂模式简介~
  7. python资料-Python资料汇总(建议收藏)
  8. Halcon教程十:把Halcon程序放入WPF程序里
  9. 电容 电阻0201/0402/0603/等封装长宽高定义
  10. mysql 重建索引,mysql优化之索引重建
  11. 【应急响应】Linux下变种DDG挖矿应急处理总结
  12. Foobar2000 是一个 Windows 平台下的一个革命性的高级音频播放器
  13. linux系统文件制作编译器,制作mipsel-linux交叉编译工具
  14. 高颜值好音质的耳机有哪些?好看时尚的真无线蓝牙耳机推荐
  15. 2022年2月计划(osgearth源码调试+ue4视频+ogreMain源码抄写)
  16. 我给同事制定的英语学习计划
  17. 2021年起重机司机(限桥式起重机)多少分及格及起重机司机(限桥式起重机)考试内容
  18. 对于 codec(编解码器) 和 container(容器) 的理解
  19. elasticsearch-修改refresh_interval刷新间隔设置
  20. 【部署加速】模型Int8量化

热门文章

  1. 学区房入学条件-查查吧深圳学区房地图
  2. 什么是ASP?教你如何学ASP编程
  3. 临时改变主意,准备回家过年了
  4. 安装硬盘SATA驱动
  5. 网络工程师课程---5、传输层(传输层常用协议有哪些)
  6. 站长号词库:今日热门长尾关键词挖掘 20221129
  7. 申请高新技术企业有什么好处?
  8. 软件工程师的职业之路
  9. 1. 什么是WIN-PE?
  10. 【CubeIDE】STM32 HAL库史上最详细教程(一):UART串口收发