amazon数据集

Amazon announced the released of a new web service today that aims to facilitate easier access to open, public data sets. Public Data Sets on Amazon’s Web Services will attempt to make a wide range of public data available for free use by anyone. Users can interact with data sets via an Amazon EC2 machine image and only pay for their compute time — they won’t have to worry about storing, downloading, or cleaning the actual data.

亚马逊今天宣布发布一项新的网络服务,旨在促进更轻​​松地访问开放的公共数据集。 亚马逊网络服务上的公共数据集将尝试使各种公共数据可供任何人免费使用。 用户可以通过Amazon EC2机器映像与数据集进行交互,而只需要为他们的计算时间付费-他们不必担心存储,下载或清理实际数据。

According to Amazon business development manager Deepak Singh, the new program “significantly lowers the barrier for researchers and data analysts to access and use some of the most commonly used data sets in their communities.”

亚马逊业务发展经理Deepak Singh表示,新计划“显着降低了研究人员和数据分析师访问和使用其社区中一些最常用数据集的障碍。”

Previously, utilizing the type of large data sets that Amazon plans to host for research purposes was a tedious, multi-step affair. Researchers needed to locate the data, download it, and then often times convert, clean, or customize it into a usable format for their needs. Sometimes just downloading the data is a huge barrier for researchers. One of the data sets on Amazon, for example, is a MySQL database from life sciences project Ensembl that maintains an “automated annotation on a number of eukaryotic genomes.” Their data set weighs in at a mammoth 650 gigabytes and contains 31,000 files. The technical logistics of wrangling a database that large would be an insurmountable hurdle for many researchers with limited resources.

以前,利用Amazon计划托管用于研究目的的大数据集类型是一件繁琐的,多步骤的事情。 研究人员需要定位数据,下载数据,然后经常将其转换,清理或自定义为可满足他们需求的可用格式。 有时,仅下载数据是研究人员的巨大障碍。 例如,亚马逊上的数据集之一就是来自生命科学项目EnsemblMySQL数据库,该数据库维护“对许多真核生物基因组的自动注释”。 他们的数据集重达650 GB,包含31,000个文件。 对于许多资源有限的研究人员来说,整理数据库如此之大的技术后勤工作将是无法克服的障碍。

Now, the data will be available for use across the entire ecosystem of Amazon web services with almost no work on the part of researchers to get up and running. Amazon hopes that developers will create public tools to analyze the data and mash it up with other sources, and that by making data more easily available to a wider range of people, the project will help to foster innovation.

现在,这些数据将可在整个Amazon Web服务生态系统中使用,而研究人员几乎无需任何工作即可启动和运行。 亚马逊希望开发人员能够创建公共工具来分析数据并将其与其他来源融合在一起,并希望通过使数据更容易为更多人使用,该项目将有助于促进创新。

Amazon has a wide range of public data sets available now and plans to add more in the future.

亚马逊现在有各种各样的公共数据集,并计划在将来增加更多。

At launch, or shortly after, Amazon’s service offers human genome and DNA sequencing data from Ensembl, and the National Center for Biotechnology Information; chemistry data from Indiana University; and economic data from the US Census Bureau, the Bureau of Labor Statistics, the Bureau of Transportation Services, and the Bureau of Economic Analysis.

在发布之时或之后不久,亚马逊的服务将提供来自Ensembl和国家生物技术信息中心的人类基因组和DNA测序数据; 来自印第安纳大学的化学数据; 和美国人口普查局,劳工统计局,运输服务局和经济分析局的经济数据。

How will you use the data Amazon is making available? What types of mashups would you likes to see created? And what sort of data would you like to see added? Let us know in the comments.

您将如何使用Amazon提供的数据? 您希望创建哪种类型的混搭? 您想添加什么样的数据? 让我们在评论中知道。

翻译自: https://www.sitepoint.com/amazon-adds-new-service-public-data-sets/

amazon数据集

amazon数据集_亚马逊增加了新服务:公共数据集相关推荐

  1. 亚马逊云怎么增加硬盘_亚马逊云硬盘

    亚马逊云怎么增加硬盘 There are plenty of cloud storage options available, and many now offer 5 Gb of free spac ...

  2. 亚马逊出的平板电脑_亚马逊推出新款平板电脑,售价90美元

    亚马逊刚刚发布了两款新的8英寸Fire tablet平板电脑,起价为89.99美元. 入门级型号Fire HD 8具有比以前更快的处理器和32 GB的存储空间.升级后的型号Fire HD 8 Plus ...

  3. paperwhite3翻页_亚马逊Kindle Paperwhite第二代评论-以及新的Kindle软件更新

    paperwhite3翻页 I'm a longtime Kindle fan. Love it. It's not a tablet, not a computer, my Paperwhite K ...

  4. 叉叉助手停运有什么替代的_亚马逊全球开店助手将停止服务!卖家:终究是错付了...

    最近,亚马逊可谓是新规频出.上个礼拜,亚马逊发布"自2020年9月1日开始,商家名称和地址将显示在卖家资料页面"上的通知.随后,后台的"销售业绩"版块也悄悄换至 ...

  5. 服务器怎么修改密码_亚马逊账号登陆不上,修改密码后遭冻结怎么办?有没有什么申诉的办法?...

    有微信上的小伙伴chen非常焦急的向我求助因为账号被封,全部家当基本都在账号里边,并且向我说明了基本情况. 情况是这样的,账号被冻结前两天她公司停电,所以她用VPS远程登录了账号,然后亚马逊就锁定了她 ...

  6. 亚马逊aws服务取消_亚马逊网络服务(AWS)

    亚马逊aws服务取消 Amazon Web Services (AWS) has been much a talk since more than a decade. The credit goes ...

  7. 使用亚马逊云科技安全服务防御、检测和响应 Log4j 漏洞

    概述 在本文中,我们将为针对最近披露的 Log4j 漏洞所影响的客户提供一些指导意见.内容包括如何限制漏洞的风险,如何尝试识别是否易受此问题影响,以及如何使用适当的补丁更新基础架构. Log4j 漏洞 ...

  8. amazon应用程序开发_亚马逊音乐是流媒体应用程序的黑马

    amazon应用程序开发 重点 (Top highlight) In their 1993 classic, The 22 Immutable Laws of Marketing, Al Ries a ...

  9. 亚马逊最好用的选品工具_亚马逊为何要投资2020年最糟糕的IPO

    亚马逊最好用的选品工具 Rackspace, the cloud services firm that first listed in 2008, and was then taken private ...

最新文章

  1. 动手自己写一个 xcode 插件(Xcode Source Editor Extensions)附源码
  2. redis同步效率秒_redis过期策略、内存淘汰策略、持久化方式、主从复制
  3. 图片流写出 并带数据_第九章 IO流
  4. [转]优秀Python学习资源收集汇总
  5. CSS系列:CSS中盒子模型
  6. .NET微服务体系结构中为什么使用Ocelot实现API网关
  7. 微擎pc 导入前缀_段覆盖前缀| 8086微处理器
  8. [转] 外企面试官最爱提的问题 TOP10
  9. linux 判断文件上传轨迹,linux各种常用命令
  10. Oracle 备份与还原
  11. 通过sudo提权方式控制公司人员权限
  12. 数据库的点数据根据行政区shp来进行行政区处理,python定时器实现
  13. 争分夺秒的一晚和赛尔的烂网络
  14. 中国区边界shp文件以及STRM 90m DEM分享(百度云免费下载链接)
  15. word 方框内打勾√或打叉×
  16. UVa12235 Help Bubu
  17. 520送什么礼物好呢、适合送女友的礼物推荐
  18. 瀑布流插件masonry
  19. Excel中文转拼音
  20. java计算机毕业设计钢材出入库管理系统(附源码、数据库)

热门文章

  1. 肺癌/肺炎相关最新进展(2022年3月)
  2. 48430 Assessment Task 2: Assignment 员工管理系统
  3. 运行 ArchR 报错“createArrowFiles has encountered an error, checking if any ArrowFiles completed..”
  4. 黑客用python还是ruby-python和ruby,我选谁?
  5. Unity NatCorder录屏
  6. 统计库存物料呆置时长的简单方法(SAP ABAP)
  7. 计数器接近开关脉冲计数信号转换远程io采集模块RS-485/232
  8. 美团小程序怎么弄 饿了么cps推广 外卖cps小程序源码 饿了么cps平台 外卖领券小程序源码 美团cps分销源码免费领取 外卖红包小程序cps 饿了么cps分销免费源码 饿了么外卖分佣小程序 ——
  9. 迷信一把:一螺巧,二螺富……
  10. JavaScript实现水印