netflix

Netflix open source Polynote is a new notebook environment and was born out of the necessity to accelerate data science experimentation at Netflix.

Netflix开源Polynote是一种新的笔记本环境,其诞生是出于加速Netflix数据科学实验的需要。

Over the last few years, Netflix has transformed its use of data science notebooks from an experimentation artifact to a key component of the lifecycle of machine learning solutions. Initially, Netflix adopted Jupyter Notebooks like a data exploration and analysis tools.

在过去的几年中,Netflix已将其对数据科学笔记本的使用从实验工件转变为机器学习解决方案生命周期的关键组成部分。 最初,Netflix将Jupyter Notebooks用作数据探索和分析工具。

Polynote (Polynote)

Polynote is a multi-language notebook experimentation environment. In addition to Python, the current release supports languages such as SQL, Vega(visualizations) and, of course, Scala. The platform is also integrated with data science infrastructures such as Apache Spark. At its core, Polynote includes the following capabilities:

Polynote是一种多语言笔记本实验环境。 除Python外 ,当前版本还支持SQLVega (可视化),当然还有Scala等语言 。 该平台还与数据科学基础架构(例如Apache Spark)集成在一起。 Polynote的核心包括以下功能

a) Improved Editing Experience: Polynote tries to enable an editing experience closer to modern IDEs. b) Multi-Language Support: Polynote introduces first-class support for Scala and other languages used in data science environmenhts. c) Data Visualization Improvements: Polynote integrates native data visualizations into notebooks’ dataset without the need of adding a lot of code. d) Configuration and Dependency Management: Languages like Scala require complex package dependencies in its programs. Polynote saves the package dependency configuration within the notebook itself addressing some of the common challenges in this area experienced by JVM developers. e) Reproducibility: The combination of code, data and execution results into a single document makes notebooks powerful, but also difficult to reproduce. Polynote includes reproducibility as a first-class capability of the framework.

a) 改进的编辑体验: Polynote试图使编辑体验更接近现代IDE。 b) 多语言支持: Polynote引入了对Scala和数据科学环境中使用的其他语言的一流支持。 c) 数据可视化方面的改进: Polynote将原生数据可视化集成到笔记本的数据集中,而无需添加大量代码。 d) 配置和依赖性管理:诸如Scala之类的语言在其程序中需要复杂的软件包依赖性。 Polynote将包依赖项配置保存在笔记本自身中,以解决JVM开发人员在该领域遇到的一些常见挑战。 e)可复制性:将代码,数据和执行结果组合到一个文档中,使笔记本功能强大,但也难以复制。 Polynote将可再现性作为框架的一流功能。

改进的编辑体验 (Improved Editing Experience)

Polynote includes common features in IDEs such as code auto-completion or syntax error highlighting which improves the experience for data scientists and researchers building Notebooks. More of the editing capabilities are powered by the Monaco editor which powers the experience of Visual Studio Code.

Polynote包含IDE中的常见功能,例如代码自动完成或语法错误突出显示,从而改善了构建笔记本电脑的数据科学家和研究人员的体验。 摩纳哥编辑器提供了更多的编辑功能,该编辑器为Visual Studio Code的体验提供了支持。

多国语言支持 (Multi-Language Support)

Polynote does not only provide support for multiple languages but it also allows those languages to be combined in a single program. In Polynote, every cell can be based on a different language. When a cell is run, the kernel provides the available typed input values to the cell’s language interpreter. In turn, the interpreter provides the resulting typed output values back to the kernel. This allows cells in Polynote notebooks to operate within the same context. The example below shows a Python library, to compute an isotonic regression of a dataset generated with Scala.

Polynote不仅提供对多种语言的支持,而且还允许将这些语言组合在一个程序中。 在Polynote中,每个单元格可以基于不同的语言。 当单元运行时,内核将可用的类型化输入值提供给单元的语言解释器。 反过来,解释器将结果输入的输出值提供回内核。 这使Polynote笔记本中的单元格可以在相同的上下文中运行。 下面的示例显示了一个Python库,用于计算使用Scala生成的数据集的等渗回归。

Source: https://polynote.org/
资料来源: https : //polynote.org/

数据可视化 (Data Visualization)

Data visualizations are a common component of most notebook environment. However, Polynote takes the visualization value proposition to another level by including it as a native component of the platform which does not require developers to write any code in order to visually explore a dataset.

数据可视化是大多数笔记本环境的常见组件。 但是,Polynote通过将可视化价值主张作为平台的本机组件,将可视化价值主张提升到了另一个层次,不需要开发人员编写任何代码即可直观地浏览数据集。

组态 (Configuration)

Most of the time, data scientists working on notebooks can enjoy the efficiency of Python’s package management model to handle the dependencies of a program. However, in JVM-languages like Scala dependency management can become a total night mare. Polynote addresses that challenge by storing the configuration and dependency information directly in the notebook itself, rather than relying on external files. Additionally, Polynote provides a user-friendly Configuration section where users can set dependencies for each notebook.

大多数时候,从事笔记本工作的数据科学家可以享受Python的包管理模型处理程序依赖关系的效率。 但是,在诸如Scala依赖关系管理之类的JVM语言中,它们可能会变成一头噩梦。 Polynote通过将配置和相关性信息直接存储在笔记本本身中而不是依赖于外部文件来解决这一挑战。 此外,Polynote还提供了一个用户友好的“配置”部分,用户可以在其中为每个笔记本设置依赖性。

Source: https://polynote.org/
资料来源: https : //polynote.org/

重现性 (Reproducibility)

With Polynote, Netflix a new code interpretation block instead of relying on a REPL model like a traditional notebook. One of the key capabilities of the new interpretation model is that it removes hidden states which allows data scientists to copy cells within a notebook without introducing any state from the previous position.

借助Polynote,Netflix有了新的代码解释模块,而不再像传统笔记本那样依赖REPL模型。 新解释模型的关键功能之一是,它消除了隐藏状态,这使数据科学家可以在笔记本中复制单元而无需从先前位置引入任何状态。

Polynote is a new release in the ambitious competitive of data science notebooks but one that stands in its own merits. The support for JVM-based languages could make Polynote a favorite of developers working on Spark infrastructures. Also the editing and reproducatility capabilities are definitely welcomed enhancements to traditional notebook environments. Polynote is available in Github and you can also follow the project’s website.

Polynote是在雄心勃勃的数据科学笔记本电脑竞争中推出的新版本,但它有自己的优点。 对基于JVM的语言的支持可能使Polynote成为使用Spark基础结构的开发人员的最爱。 同样,编辑和再现性功能无疑是对传统笔记本环境的增强。 Polynote 在Github中可用,您也可以访问该项目的网站 。

Source: https://polynote.org/
资料来源: https : //polynote.org/

推荐文章 (Recommended Articles)

  1. Learn Python & ML with Kaggle

    使用Kaggle学习Python和ML

  2. GitHub Launches Codespaces

    GitHub启动代码空间

  3. Netflix’s Polynote

    Netflix的Polynote

  4. The List of Top 10 lists

    前十名名单

  5. Most popular Python libraries

    最受欢迎的Python库

  6. Top Data Science Courses & Certification for 2020

    2020年热门数据科学课程和认证

  7. Influencers in AI to follow

    人工智能中的影响者要关注

  8. Data Science Programming Languages

    数据科学编程语言

  9. Examples of Artificial Intelligence

    人工智能的例子

  10. What the BigTech Knows… about You

    BigTech对您的了解...

  11. Lemonade and the power of Artificial Intelligence

    柠檬水和人工智能的力量

Source and original: https://www.kdnuggets.com by Jesus Rodriguez

出处和原文: https : //www.kdnuggets.com ,作者:耶稣·罗德里格斯(Jesus Rodriguez)

翻译自: https://medium.com/swlh/netflixs-polynote-34b5adcb064a

netflix


http://www.taodudu.cc/news/show-997589.html

相关文章:

  • 气流与路易吉,阿戈,MLFlow,KubeFlow
  • 顶级数据恢复_顶级R数据科学图书馆
  • 大数据 notebook_Dockerless Notebook:数据科学期待已久的未来
  • 微软大数据_我对Microsoft的数据科学采访
  • 如何击败腾讯_击败股市
  • 如何将Jupyter Notebook连接到远程Spark集群并每天运行Spark作业?
  • twitter 数据集处理_Twitter数据清理和数据科学预处理
  • 使用管道符组合使用命令_如何使用管道的魔力
  • 2020年十大币预测_2020年十大商业智能工具
  • 为什么我们需要使用Pandas新字符串Dtype代替文本数据对象
  • nlp构建_使用NLP构建自杀性推文分类器
  • 时间序列分析 lstm_LSTM —时间序列分析
  • 泰晤士报下载_《泰晤士报》和《星期日泰晤士报》新闻编辑室中具有指标的冒险活动-第1部分:问题
  • 异常检测机器学习_使用机器学习检测异常
  • 特征工程tf-idf_特征工程-保留和删除的内容
  • 自我价值感缺失的表现_不同类型的缺失价值观和应对方法
  • 学习sql注入:猜测数据库_面向数据科学家SQL:学习简单方法
  • python自动化数据报告_如何:使用Python将实时数据自动化到您的网站
  • 学习深度学习需要哪些知识_您想了解的有关深度学习的所有知识
  • 置信区间估计 预测区间估计_估计,预测和预测
  • 地图 c-suite_C-Suite的模型
  • sap中泰国有预扣税设置吗_泰国餐厅密度细分:带有K-means聚类的python
  • 傅里叶变换 直观_A / B测试的直观模拟
  • 鸽子 迷信_人工智能如何帮助我战胜鸽子
  • scikit keras_Scikit学习,TensorFlow,PyTorch,Keras…但是天秤座呢?
  • 数据结构两个月学完_这是我作为数据科学家两年来所学到的
  • 迈向数据科学的第一步:在Python中支持向量回归
  • 使用Python和MetaTrader在5分钟内开始构建您的交易策略
  • ipywidgets_未来价值和Ipywidgets
  • 用folium模块画地理图_使用Folium表示您的地理空间数据

netflix_Netflix的Polynote相关推荐

  1. kaggle比赛数据_表格数据二进制分类:来自5个Kaggle比赛的所有技巧和窍门

    kaggle比赛数据 This article was originally written by Shahul ES and posted on the Neptune blog. 本文最初由 Sh ...

  2. 海量数据寻找最频繁的数据_寻找数据科学家的“原因”

    海量数据寻找最频繁的数据 Start with "Why" - Why do we do the work we do? 从"为什么"开始-我们为什么要做我们所 ...

  3. mysql 时间推移_随着时间的推移可视化COVID-19新案例

    mysql 时间推移 This heat map shows the progression of the COVID-19 pandemic in the United States over ti ...

  4. 机器学习实际应用_机器学习的实际好处是什么?

    机器学习实际应用 Some of my previous introductory posts to machine learning and data science were a bit tech ...

  5. python 装饰器装饰类_5分钟的Python装饰器指南

    python 装饰器装饰类 重点 (Top highlight) There's no doubt that Python decorators are one of the more advance ...

  6. 大数据对社交媒体的影响_数据如何影响媒体,广告和娱乐职业

    大数据对社交媒体的影响 In advance of our upcoming event - Data Science Salon: Applying AI and ML to Media, Adve ...

  7. grafana 创建仪表盘_创建仪表盘前要问的三个问题

    grafana 创建仪表盘 可视化 (VISUALIZATIONS) It's easier than ever to dive into dashboarding, but are you doin ...

  8. 使用Python进行地理编码和反向地理编码

    Geocoding is the process of taking input text, such as an address or the name of a place, and return ...

  9. SMSSMS垃圾邮件检测器的专业攻击

    Note: The methodology behind the approach discussed in this post stems from a collaborative publicat ...

最新文章

  1. 第四节 RabbitMQ在C#端的应用-客户端连接
  2. UEditor添加自定义弹窗 插入音频地址
  3. SpringMVC(2)—SpringMVC整合Spring的HelloWorld
  4. 基于JAVA+SpringMVC+Mybatis+MYSQL的培训中心管理系统
  5. mysql 备份还原
  6. android多图片拖动,Android实现图片拖动效果
  7. Web jquery表格组件 JQGrid 的使用 - 从入门到精通 开篇及索引
  8. 6.数据结构 --- 树和二叉树
  9. PL/SQL Developer使用技巧、快捷键(转发)
  10. 语言学句法分析树形图怎么画_哇,好大一棵树! 如何优雅地画句法树形图 丨语言学午餐...
  11. mysql的填充因子_SQL SERVER中,什么是填充因子?
  12. vue+IOS9页面白屏
  13. linux搭建dlna媒体服务器,Serviio:一款功能强大的DLNA媒体服务器软件
  14. adc0809工作过程C语言,ADC0809引脚图、时序图、工作流程图详解
  15. 西南交大计算机应用基础 第2次作业 主观题目,西南交大网络教育2011-2012学年计算机应用基础第四次作业(主观题)...
  16. Mac系统如何关闭指定端口号
  17. 离别是为了下一次更好的重逢
  18. java编写的公共钥匙盒_公共钥匙盒.java
  19. 认知层次不同的人,是很难沟通的
  20. cutelyst教程_01 _简介

热门文章

  1. Maven Web项目解决跨域问题
  2. 37)智能指针(就是自动delete空间)
  3. 算法专题 普及组【2008】三3 C++版
  4. MySQL(五) —— 子查询
  5. 织梦DedeCMS实现 三级栏目_二级栏目_一级栏目_网站名称 的效果代码
  6. C#基础加强_泛型的基本原理
  7. Android权限不够问题
  8. 详细讲解Quartz.NET
  9. for else语句小tips : RUNOOB python练习题36
  10. Linux实战教学笔记12:linux三剑客之sed命令精讲