https://www.toutiao.com/a6706469836307825163/

SHUBHAM SINGH总结了Github上6月份最火的7个项目。这七个项目涵盖可解释性机器学习、3D深度学习、时间序列挖掘以及可视化工具等。各个项目都非常优秀。值得收藏查看。

InterpretML by Microsoft – Machine Learning Interpretability

解释性在机器学习中是一件巨大的事情。能够理解模型如何产生它所做的输出 - 这是任何机器学习项目的关键方面。

InterpretML是Microsoft的一个开源软件包,用于训练可解释的模型和解释黑盒系统。微软在解释为什么可解释性至关重要时说得最好:

  • 模型调试:为什么我的模型犯了这个错误?
  • 检测偏差:我的模型是否有区分能力?
  • 人与人工智能合作:我如何理解并信任模型的决策?
  • 法规遵从性:我的模型是否满足法律要求?
  • 高风险应用:医疗保健,金融,司法等

随着复杂性的增加,解释机器学习模型的内部工作变得更加困难。你有没有试过拆开并理解多个模型合奏?这需要花费大量的时间和精力。

我们不能简单地使用复杂的模型去应对我们的客户或领导,而不能解释它如何产生良好的分数/准确性。

Microsoft Research的人员开发了可解释的提升机(EBM)算法来帮助解释。这种EBM技术具有高精度和可解释性。

解释ML不仅限于使用EBM。它还支持LIME,线性模型,决策树等算法。它能比较模型并为我们的项目挑选最好的模型!

https://github.com/microsoft/interpret

Tensor2Robot (T2R) by Google Research

Google发布的最新开源名为Tensor2Robot(T2R)的库非常有意思。 T2R是用于大规模深度神经网络的训练,评估和推理的库。 但是它的开发考虑了一个特定的目标,即它适用于与机器人感知和控制相关的神经网络。

此存储库包含分布式机器学习和强化学习基础结构

它在Alphabet内部使用,开源的目的是使Robotics @ Google的研究对于更广泛的机器人和计算机视觉社区提供可重复性的工作。T2R是基于Tensorflow的框架。

机器人研究中的常见任务涉及向神经网络图添加新的传感器模态或新的标签张量。 这涉及1)更改保存的数据,2)在训练时更改数据管道代码以读取新模态3)添加新的tf.placeholder以在测试时处理新的输入模态。 Tensor2Robot的主要功能是为步骤2和3自动生成TensorFlow代码。Tensor2Robot可以自动生成模型的占位符以匹配其输入,或者导出可以与TFExportedSavedModelPolicy一起使用的SavedModel,以便原始图形不是必须重建。

https://github.com/google-research/tensor2robot

Generative Models in TensorFlow 2

这是一个在Tensorflow 2中实现大量生成模型的小项目。图层和优化器使用Keras。 这些模型是针对两个数据集实现的:MNIST和NSYNTH。 编写这个框架的目的是尽可能简单和一致,同时仍然可读。 因为每个网络都是自包含在notebook中的,所以它们应该可以在colab会话中轻松运行。

这个库已经实现的模型包含:

  • Autoencoder(AE)
  • Variational Autoencoder(VAE)
  • Generative Adversarial Network(GAN)
  • Wasserstein GAN with Gradient Penalty (WGAN-GP)
  • VAE-GAN
  • Generative adversarial interpolative autoencoder (GAIA)

https://github.com/timsainb/tensorflow2-generative-models

STUMPY – Time Series Data Mining

STUMPY是一个功能强大且可扩展的库,可帮助我们执行时间序列数据挖掘任务。 STUMPY旨在计算矩阵轮廓(matrix profile)。矩阵轮廓是一个向量,它存储了时间序列中任何子序列与其最近邻居之间的z标准化欧几里德距离。

详情可参考:https://stumpy.readthedocs.io/en/latest/Tutorial_0.html

它可以用来处理很多时序数据的挖掘任务:

  1. 模式/主题(在较长时间序列内近似重复的子序列)发现
  2. 异常点发现
  3. shapelet 发现
  4. 语义分割
  5. 密度估计
  6. 时间序列链(时序有序的子序列模式)
  7. 等等其他的

https://github.com/TDAmeritrade/stumpy

MeshCNN in PyTorch

MeshCNN是用于3D三角网格的通用深度神经网络。 这些网格可用于3D形状分类或分割等任务。 计算机视觉的精湛应用。

MeshCNN框架包括直接应用于网格边缘的卷积,池化和解除层:

3D深度学习吸引了业界的兴趣,包括机器人和自动驾驶等领域。 3D形状的问题在于它们本质上是不规则的。 这使得像卷积这样的操作变得很困难。

https://github.com/ranahanocka/MeshCNN

Awesome Decision Tree Research Papers

决策树算法是我们在机器学习中学到的第一批高级技术。这种方法可以在更大的数据集上使用。

这个存储库是数据科学家的宝库。 存储库包含基于树的算法的论文集合,包括决策,回归和分类树。 存储库还包含每篇论文的实现。

https://github.com/benedekrozemberczki/awesome-decision-tree-papers

TensorWatch by Microsoft Research

TensorWatch是一个调试和可视化工具,专为数据科学,深度学习和强化学习而设计。 它适用于Jupyter Notebook,可显示机器学习训练的实时可视化,并为您的模型和数据执行其他几项关键分析任务。

TensorWatch旨在灵活且可扩展,因此您还可以构建自己的自定义可视化,UI和仪表板。 除了传统的“所见即所见”方法外,它还具有针对您的实时ML训练流程执行任意查询的独特功能,作为查询结果返回流并使用。

https://github.com/microsoft/tensorwatch

「可解释ML/3D深度学习等」Github六月最受欢迎的机器学习库来啦相关推荐

  1. 3D深度学习总结(聚焦3D深度学习的现在于未来)

    3D深度学习总结(聚焦3D深度学习的现在于未来) 本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载 选自The gradient[点击此处],作者:Mihir Gar ...

  2. 基于可解释人工智能和深度学习的组织病理学图像中的副结核病诊断;用于恶意软件检测的安全稳健的认知系统设计;带有涂鸦注释的弱监督伪装对象检测;Time Majority Voting:一种面向非专家用户的

    可解释的机器学习 中文标题:基于可解释人工智能和深度学习的组织病理学图像中的副结核病诊断 英文标题:Diagnosis of Paratuberculosis in Histopathological ...

  3. AI:人工智能概念之机器学习ML、深度学习DL、数据挖掘、知识发现、模式识别等重要领域之间比较关系结构图之详细攻略

    AI:人工智能概念之机器学习ML.深度学习DL.数据挖掘.知识发现.模式识别等重要领域之间比较关系结构图之详细攻略 目录 AI与ML.DL的概念 AI与ML.DL的结构关系图 参考文章:<201 ...

  4. 未能加载程序集或它的一个依赖项_英伟达发布kaolin:一个用于加速3D深度学习研究的PyTorch库...

    由于大多数现实环境是三维的,因此理想情况下,应针对3D数据训练旨在分析视频或现实环境中的完整任务的深度学习模型.诸如机器人,自动驾驶汽车,智能手机和其他设备之类的技术工具目前正在产生越来越多的3-D数 ...

  5. 基本概念—机器学习ML与深度学习DL

    一.概念比较 机器学习(Machine Learning,ML):机器学习的概念很大,算法包括聚类算法.回归算法.监督学习.神经网络等 深度学习(DeepLearning,DL):只包含机器学习大类中 ...

  6. 前沿 | NVIDIA PyTorch库让3D深度学习研究更简单!

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :英伟达NVIDIA [人工 ...

  7. Facebook 开源 3D 深度学习函数库 PyTorch3D,也可用于二维场景

    渲染是计算机图形学中的核心内容,它可将 3D 模型转换为 2D 图像.这也是在 3D 场景属性(scene properties)和 2D 图像像素之间建立桥接的常规手段.不过传统渲染引擎无法进行微分 ...

  8. ​关于深度学习、NLP和计算机视觉的30个顶级Python库

    正文字数:2214  阅读时长:3分钟 再次感谢艾哈迈德·阿尼斯(Ahmed Anis)为收集这些数据做出的贡献,并感谢KDnuggets的其他工作人员的意见,见解和建议. 作者 / Matthew ...

  9. python之torchlight使用_关于深度学习、NLP和计算机视觉的30个顶级Python库

    再次感谢艾哈迈德·阿尼斯(Ahmed Anis)为收集这些数据做出的贡献,并感谢KDnuggets的其他工作人员的意见,见解和建议. 作者 / Matthew Mayo 请注意,下面是由Gregory ...

最新文章

  1. 鸿蒙系统全面解析,诞生背景、技术细节生态圈一文看懂
  2. UpdateProgress使用
  3. T-SQL 游标名称的作用域
  4. 数据结构--链表--判断一个字符串是否为回文串(单向链表,双向链表)
  5. mysql加锁后怎么解除_Mysql查看死锁与解除死锁的深入讲解
  6. Oracle实现网吧计费系统,网吧计费管理系统 - 源码下载|Windows编程|其他小程序|源代码 - 源码中国...
  7. java cache system_JCS(Java Cache System)基本结构分析和使用
  8. Android应用程序组件Content Provider在应用程序之间共享数据的原理分析(1)
  9. solr中facet及facet.pivot理解
  10. eclipse创建maven项目的创建
  11. matlab生成网络流量,BP神经网络 预测网络流量
  12. 中南大学数字中南、电信校园网无法弹出验证界面解决方法
  13. 短视频剪辑怎么做?4步教你快速入门
  14. Linux向github上传代码以及遇到的坑们
  15. MySQL 之 The definition of table 'p' prevents operation UPDATE on table 'post'.
  16. 蛇行字符串解题代码C++
  17. matplotlib简要画图
  18. 1020 月饼 (25 分)
  19. 解决“Error: Too many re-renders. React limits the number of renders to prevent an infinite loop.”
  20. 在JavaScript中没有二维数组的概念

热门文章

  1. 20、30、40岁年轻人,2020年的建议 转载
  2. 转 sklearn: TfidfVectorizer 中文处理及一些使用参数
  3. tf.keras.layers.Flatten该网络中的第一层tf.keras.layers.Flatten将图像的格式从2d阵列(28乘28像素)转换为28 * 28 = 784像素的1d阵列。可以
  4. tensorflow调试打印
  5. jdbc 变量 mysql_JDBC读写mysql总结
  6. AI 如何推进全球可持续发展?
  7. 自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 | AI日报
  8. 智源学者文再文获北京市杰出青年中关村奖
  9. 开启报名丨AutoML-Zero:从零开始搜索机器学习算法
  10. phpstudy安装imagick扩展库怎么装