领英宣布开源数据挖掘软件WhereHows
领英称即将开源他们内部的应用软件WhereHows,一个企业级的数据挖掘软件。
准确的说,领英称它为“数据发现软件”。从商业角度讲,WhereHows的目标是从分布式的多种元数据中进行挖掘。
据领英发布的资料显示,WhereHows已经挖掘了50,000条数据集,14,000条评论和35,000,000个工作机会,多达15PB的数据。
在一篇博客中,领英解释了创造WhereHows的原因:建造一个数据生态,适配各种程序,专注一项工作。因为领英有各种各样形式的数据,从Informatic到Spark,到Oracle,再到Hadoop、Teradate等。领英称:
领英积累了大量的数据,形式多种多样。对于不同的业务我们有不同的方案,而对于不同的方案我们有不同的驱动。这种专业化的解决方案很棒,因为它能让我们在各方面都用上最好的工具,但是,这也带来了问题。从这些不同的平台、框架、系统中总览所有数据非常困难。这将造成生产力方面的损失,我们的员工需要花多余的时间来寻找合适的数据集,同时也失去了对数据总体的理解。
企业需要将数据联系起来。领英也有专业的数据仓库团队,但问题是,随着系统的家里,数据的空间激增。
很多企业有相同的问题,领英有Hadoop,多种数据库,Teradata和各种应用程序。有了WhereHows,这些数据都可以移动到同一个地方。这个项目完成之后,将是很大一笔财产。
领英的想法是,希望开源社区能够做些贡献,比如解决bug,增加特性之类的。
领英宣布开源数据挖掘软件WhereHows相关推荐
- “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人...
来源:大数据文摘 本文约5750字,建议阅读6分钟. 本文为清华大学大数据研究中心联合大数据文摘发起的年度白皮书<顶级数据团队建设全景报告>系列专访的第二篇内容.<报告>囊括专 ...
- “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人
大数据文摘出品 作者:魏子敏.夏雅薇.牛婉杨 定下"顶级数据科学团队"这个研究话题时,我们第一时间想到了领英(LinkedIn). 2008年,正是在这家公司,DJ Patil建立 ...
- 流行的开源数据挖掘tool
IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看.为了评测这些软件,我 ...
- 7款优秀的开源数据挖掘工具
7款优秀的开源数据挖掘工具 IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directo ...
- 几款优秀的开源数据挖掘工具
几款优秀的开源数据挖掘工具 By kevinwu on December 28, 2008 2:39 AM | No Comments | No TrackBacks 本文只对几种流行的开源数据挖掘平 ...
- 业界常见的数据挖掘软件介绍
业界常见的数据挖掘软件介绍 一.主要介绍12种 1.传统的数据挖掘套件(Classic suites): SAS Enterprise Miner 5.3 SPSS Clementine 12 2.开 ...
- [Data]数据挖掘软件的分类
目前市场上发布的数据挖掘软件大致分为三类:通用工具类:综合工具类:面向特定应用工具类.其中: 1. 通用工具类占有较大和成熟的一块市场.从定义上说.它们是非面向特定应用的.从本质上说,它们的范围是水平 ...
- IEEE分享 | 机器学习在领英的规模化应用
人工智能和机器学习仍然是全球持续增长的领域之一,近年来涌现出越来越多本科生或者非人工智能专业出身的工程师,他们努力学习和使用技术来改进产品,几乎每天都有新的机器学习技术和框架发布.这篇文章将讨论领英如 ...
- 微信Mac版更新:在电脑上刷朋友圈;领英暂停中国境内新用户注册;Git 恶意仓库可以在克隆时执行远程代码 | 极客头条...
「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 张红月 出品 | CSDN(ID:CSDNnews ...
- 极客日报第84期:微信Mac版更新:在电脑上刷朋友圈;领英暂停中国境内新用户注册;Git 恶意仓库可以在克隆时执行远程代码
一分钟速览新闻点! 微信Mac版更新:在电脑上刷朋友圈了 领英暂停中国境内新用户注册 或因内容和服务不合规 复旦自主研发显示织物:衣服也可充当显示器 IDC:预计2021年PC出货量将超3亿台 王兴: ...
最新文章
- 云计算赋能人工智能,未来的红利在哪?
- hdu 1263 水果
- facade 模式和gateway模式的区别
- java配置pom安装依赖包,Maven pom.xml 添加本地jar包依赖以及打包方法
- 2.Spring Cloud Alibaba教程:Linux安装Nacos1.3.1以及配置MySQL持久化
- 谷歌正式推出 Fuchsia OS比拼HarmonyOS!
- 【数据结构笔记44】线性探测的散列表的逆问题(拓扑排序的方法)
- [转载] Python List index()方法
- Javascript特效:不断在页面跑的星星
- 2021-08-23
- [含论文+答辩PPT+任务书+中期检查表+源码等]S2SH健身俱乐部会员系统
- 深入理解短时傅里叶变换 STFT + Python 代码详解
- 防火墙和端口,防火墙的功能和作用
- html采集插件如何用,火车采集器插件功能详解
- 【SHOI2008】【BZOJ1023】cactus仙人掌图
- 消除红眼效应及matlab实现
- 101shell脚本
- 大物笔记(顺便记记)
- sersync实时同步 解决单点NFS单点故障问题
- R plot图片背景设置为透明_R语言数据可视化基因名称转换及KEGG/GO富集分析