建模数据科学家的福音:MIT系特征自动构造工具今日发布
Root 编译整理自TechCrunch & Feature Labs
量子位 报道 | 公众号 QbitAI
建模数据科学家的活难度很大。
得洞察big data背后的本质,从海量复杂的原始数据中创建出有价值的特征,才能搭建出高质有效的机器学习算法。
而特征的创建要求建模数据科学家有对数据有深入的了解、极端敏感的直觉、以及扎实的行业相关知识。
即便是老司机,现阶段的人肉创建特征,还是很耗时烧脑,也不可避免会出错。
Feature Labs(特征实验室),这家打娘胎就在MIT的研究机构,致力于帮助数据科学家更快地构建机器学习算法,于今天正式成立。
Max Kanter,Feature Labs的CEO兼联合创始人,在接受TechCrunch采访时表示,该公司已经开发出一种特征自动构造的方法,帮助企业客户搭建、跑通、以及最最最重要的部署给力的机器学习产品模型。
△ Max Kanter,Feature Labs的CEO兼联合创始人
这套特征自动构造工具,Kanter认为,是Feature Labs的王牌。
其中的“深度特征合成”(Deep Feature Synthesis)数据处理流程,可以直接从原始的关系数据集和交易数据集中(例如网站访问的用户或光放购物车不买的人),自动创建出特征,并自动转化为具有预测意义的信息。
DFS的原理→https://www.featurelabs.com/blog/deep-feature-synthesis/
这意味着,建模数据家花更少的时间,就能拿到以往掉头发熬通宵才能磨出来的特征。节省出的时间和脑子,可以用来搞明白他们需要预测什么信息,进一步改善产品模型。
特征自动构造咋用?
想小试一下效果?
可以用Feature Labs给开发者提供的开源框架,Featuretools。针对新的机器学习问题,构建小型项目的算法。
Featuretools使用指南→https://docs.featuretools.com/#minute-quick-start
不过,如果想要扩大项目规模,就要购买Feature Labs提供的商用产品,有提供云服务方案,也有提供本地解决方案提,具体看客户的需求。
Feature Labs已经服务过的客户有西班牙对外银行(BBVA Bank),柯尔百货(Kohl’s),NASA和美国国防部下属的国防高级研究计划局(DARPA)。
Feature Labs的前世 & 融资情况
2015年的时候,CEO Kanter在MIT计算机科学和人工智能实验室(CSAIL)工作。
之前提到的“深度特征合成”算法,就是他与老同学Kalyan Veeramachaneni、Ben Schreck在这段工作时间共同开发的。这算法强大到,在全球三项数据科学竞赛中pk掉了615个对手(总共有906个团队)。
这成绩吸引了200多家媒体的关注和报道。从中,他们看出了算法建模的市场需求。在和100多家企业沟通后,他们发现现有的问题不是ML不起作用,而是企业不知道怎么用ML。
根据这个现象,Kanter才有了打算,成立Feature Labs,并给企业几点建议:
1)这套工具适合解决以前从未解决的业务问题;
2)用的数据集从来没经过ML处理;
3)最重要的是,基于ML开发和部署的产品团队得对机器学习完全陌生。
Feature Labs希望合作项目能在8周内,测试好实用性和可行性,并把解决方案部署到一线的生产环境中。
正是和大量应用端的接触,和早期企业客户的大量合作,Feature Labs才有了一定的积累,推出这套特征自动构造的产品。
另外,Feature Labs还宣布,在去年3月份就拿到了150万美元的种子融资,由Flybridge Capital Partners领投,First Star Ventures和122 West Ventures跟投。
最后,附编译来源,
https://techcrunch.com/2018/02/22/feature-labs-launches-out-of-mit-to-speed-up-building-machine-learning-algorithms/
https://www.featurelabs.com/blog/launching-featurelabs/
— 完 —
加入社群
量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
建模数据科学家的福音:MIT系特征自动构造工具今日发布相关推荐
- 像数据科学家一样思考:12步指南(上)
介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...
- 像数据科学家一样思考:12步指南(上) 1
介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...
- 《数据科学家修炼之道》笔记
[美] Zacharias Voulgaris 吴文磊 田原 译 有价值的资源: 1.有用的网页链接 http://www.Kaggle.com 标签:人际网络.大数据分析竞赛.找工作 http:// ...
- 数据探查_数据科学家,开始使用探查器
数据探查 Data scientists often need to write a lot of complex, slow, CPU- and I/O-heavy code - whether y ...
- 二十一世纪最性感的职业:数据科学家
性感事物方面的权威<哈佛商业评论>宣布,"数据科学家"是二十一世纪最性感的职业.所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么. 不管老板懂不懂数据 ...
- 数据科学家们,三年后你还能做什么?
来源:AI前线小组 本文共3700字,建议阅读12分钟. 本文收集了数据科学领域中不同人士关于数据科学家的职业建议,千万别错过! [ 导读 ]在 Reddit 上,一位熟悉统计.编程.分析.工程等多项 ...
- 数据科学家:21世纪最脏的工作
全文共2311字,预计学习时长7分钟 来源:cfzyjsxy 在大数据世界里,数据科学家受到人们的尊敬,他们采用人工智能或深度学习的方法,提出宝贵的商业见解,造福社会. <哈佛商业评论>曾 ...
- 数据科学家是不是特有前途的职业?
人工智能和大数据热起来.无数培训班开始靠讲Python.机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程.在企业里收到的简历也是越来越多地号称耍过神经网络.深度学习,经历过 ...
- 数据科学家:21世纪最性感的职业
他们是数据骇客,分析师,沟通高手,值得信任的咨询师,这些东西组合到一起极具威力,也极其少见. 数据科学家:21世纪最性感的职业 8350阅读 译者:谈和译 数据科学家:21世纪最性感的职业 Thoma ...
最新文章
- 带AM或者PM的时间字符串转data类型
- 【转】关于MySQL权限
- python编程软件在哪里下载-Thonny(Python编程工具)
- C++语言之父 Bjarne Stroustrup 简介
- Linux环境配置1
- [BUUCTF-pwn]——qctf2018_stack2
- Catalyst 6509交换机配置方案
- 数据结构——二叉树的层次遍历进阶
- python 文字识别 之 pytesseract
- U-Boot提供的命令【整理】
- Windows美化之鼠标光标
- CyanogenMod ROM 首次官方兼容小米
- 小米路由器连电信路由器,dhcp服务无响应
- ebs查看服务状态_监控您的卷状态 - Amazon Elastic Compute Cloud
- 请捎去我的祈祷和祝福
- TCP/IP原理、基础以及在Linux上的实现
- Mac 终端配置 oh-my-zsh 和自动补全
- JAVA内存文件映射
- 快手国际版Kwai测试海外电商直播,社交App的尽头是直播电商?
- VS Code配置使用 LaTeX
热门文章
- 全球开发者调查:JavaScript 成最爱,还最喜欢用 React
- Thread-start()-,它是怎么让线程启动的呢,Java面试问项目
- python 混淆矩阵 画图_【Python-机器学习】sciki-learn/pandas与OLS求解
- 怎么用python爬豆瓣_python爬虫16 | 你,快去试试用多进程的方式重新去爬取豆瓣上的电影...
- 华中数控hnc一818b_数控车床精确对刀方法总结
- linux中php集成软件,最新XAMPP Linux版5.6.3 官方版_免费开源php集成环境下载地址电脑版-锐品软件...
- 如何将一个JavaScript数组打乱顺序?
- Node如何自动重启进程
- mysql 索引 insert_mysql优化:定期删数据 + 批量insert + 字符串加索引为什么很傻
- JavaScript中的try...catch...finally