Root 编译整理自TechCrunch & Feature Labs
量子位 报道 | 公众号 QbitAI

建模数据科学家的活难度很大。

得洞察big data背后的本质,从海量复杂的原始数据中创建出有价值的特征,才能搭建出高质有效的机器学习算法。

而特征的创建要求建模数据科学家有对数据有深入的了解、极端敏感的直觉、以及扎实的行业相关知识。

即便是老司机,现阶段的人肉创建特征,还是很耗时烧脑,也不可避免会出错。

Feature Labs(特征实验室),这家打娘胎就在MIT的研究机构,致力于帮助数据科学家更快地构建机器学习算法,于今天正式成立。

Max Kanter,Feature Labs的CEO兼联合创始人,在接受TechCrunch采访时表示,该公司已经开发出一种特征自动构造的方法,帮助企业客户搭建、跑通、以及最最最重要的部署给力的机器学习产品模型。

 Max Kanter,Feature Labs的CEO兼联合创始人

这套特征自动构造工具,Kanter认为,是Feature Labs的王牌。

其中的“深度特征合成”(Deep Feature Synthesis)数据处理流程,可以直接从原始的关系数据集和交易数据集中(例如网站访问的用户或光放购物车不买的人),自动创建出特征,并自动转化为具有预测意义的信息。

DFS的原理→https://www.featurelabs.com/blog/deep-feature-synthesis/

这意味着,建模数据家花更少的时间,就能拿到以往掉头发熬通宵才能磨出来的特征。节省出的时间和脑子,可以用来搞明白他们需要预测什么信息,进一步改善产品模型。

特征自动构造咋用?

想小试一下效果?

可以用Feature Labs给开发者提供的开源框架,Featuretools。针对新的机器学习问题,构建小型项目的算法。

Featuretools使用指南→https://docs.featuretools.com/#minute-quick-start

不过,如果想要扩大项目规模,就要购买Feature Labs提供的商用产品,有提供云服务方案,也有提供本地解决方案提,具体看客户的需求。

Feature Labs已经服务过的客户有西班牙对外银行(BBVA Bank),柯尔百货(Kohl’s),NASA和美国国防部下属的国防高级研究计划局(DARPA)。

Feature Labs的前世 & 融资情况

2015年的时候,CEO Kanter在MIT计算机科学和人工智能实验室(CSAIL)工作。

之前提到的“深度特征合成”算法,就是他与老同学Kalyan Veeramachaneni、Ben Schreck在这段工作时间共同开发的。这算法强大到,在全球三项数据科学竞赛中pk掉了615个对手(总共有906个团队)。

这成绩吸引了200多家媒体的关注和报道。从中,他们看出了算法建模的市场需求。在和100多家企业沟通后,他们发现现有的问题不是ML不起作用,而是企业不知道怎么用ML。

根据这个现象,Kanter才有了打算,成立Feature Labs,并给企业几点建议:

1)这套工具适合解决以前从未解决的业务问题;
2)用的数据集从来没经过ML处理;
3)最重要的是,基于ML开发和部署的产品团队得对机器学习完全陌生。

Feature Labs希望合作项目能在8周内,测试好实用性和可行性,并把解决方案部署到一线的生产环境中。

正是和大量应用端的接触,和早期企业客户的大量合作,Feature Labs才有了一定的积累,推出这套特征自动构造的产品。

另外,Feature Labs还宣布,在去年3月份就拿到了150万美元的种子融资,由Flybridge Capital Partners领投,First Star Ventures和122 West Ventures跟投。

最后,附编译来源,
https://techcrunch.com/2018/02/22/feature-labs-launches-out-of-mit-to-speed-up-building-machine-learning-algorithms/
https://www.featurelabs.com/blog/launching-featurelabs/

加入社群

量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。


量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


建模数据科学家的福音:MIT系特征自动构造工具今日发布相关推荐

  1. 像数据科学家一样思考:12步指南(上)

    介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...

  2. 像数据科学家一样思考:12步指南(上) 1

    介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增.我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决.直到我遇到Brian G ...

  3. 《数据科学家修炼之道》笔记

    [美] Zacharias Voulgaris 吴文磊 田原 译 有价值的资源: 1.有用的网页链接 http://www.Kaggle.com 标签:人际网络.大数据分析竞赛.找工作 http:// ...

  4. 数据探查_数据科学家,开始使用探查器

    数据探查 Data scientists often need to write a lot of complex, slow, CPU- and I/O-heavy code - whether y ...

  5. 二十一世纪最性感的职业:数据科学家

    性感事物方面的权威<哈佛商业评论>宣布,"数据科学家"是二十一世纪最性感的职业.所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么. 不管老板懂不懂数据 ...

  6. 数据科学家们,三年后你还能做什么?

    来源:AI前线小组 本文共3700字,建议阅读12分钟. 本文收集了数据科学领域中不同人士关于数据科学家的职业建议,千万别错过! [ 导读 ]在 Reddit 上,一位熟悉统计.编程.分析.工程等多项 ...

  7. 数据科学家:21世纪最脏的工作

    全文共2311字,预计学习时长7分钟 来源:cfzyjsxy 在大数据世界里,数据科学家受到人们的尊敬,他们采用人工智能或深度学习的方法,提出宝贵的商业见解,造福社会. <哈佛商业评论>曾 ...

  8. 数据科学家是不是特有前途的职业?

    人工智能和大数据热起来.无数培训班开始靠讲Python.机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程.在企业里收到的简历也是越来越多地号称耍过神经网络.深度学习,经历过 ...

  9. 数据科学家:21世纪最性感的职业

    他们是数据骇客,分析师,沟通高手,值得信任的咨询师,这些东西组合到一起极具威力,也极其少见. 数据科学家:21世纪最性感的职业 8350阅读 译者:谈和译 数据科学家:21世纪最性感的职业 Thoma ...

最新文章

  1. 带AM或者PM的时间字符串转data类型
  2. 【转】关于MySQL权限
  3. python编程软件在哪里下载-Thonny(Python编程工具)
  4. C++语言之父 Bjarne Stroustrup 简介
  5. Linux环境配置1
  6. [BUUCTF-pwn]——qctf2018_stack2
  7. Catalyst 6509交换机配置方案
  8. 数据结构——二叉树的层次遍历进阶
  9. python 文字识别 之 pytesseract
  10. U-Boot提供的命令【整理】
  11. Windows美化之鼠标光标
  12. CyanogenMod ROM 首次官方兼容小米
  13. 小米路由器连电信路由器,dhcp服务无响应
  14. ebs查看服务状态_监控您的卷状态 - Amazon Elastic Compute Cloud
  15. 请捎去我的祈祷和祝福
  16. TCP/IP原理、基础以及在Linux上的实现
  17. Mac 终端配置 oh-my-zsh 和自动补全
  18. JAVA内存文件映射
  19. 快手国际版Kwai测试海外电商直播,社交App的尽头是直播电商?
  20. VS Code配置使用 LaTeX

热门文章

  1. 全球开发者调查:JavaScript 成最爱,还最喜欢用 React
  2. Thread-start()-,它是怎么让线程启动的呢,Java面试问项目
  3. python 混淆矩阵 画图_【Python-机器学习】sciki-learn/pandas与OLS求解
  4. 怎么用python爬豆瓣_python爬虫16 | 你,快去试试用多进程的方式重新去爬取豆瓣上的电影...
  5. 华中数控hnc一818b_数控车床精确对刀方法总结
  6. linux中php集成软件,最新XAMPP Linux版5.6.3 官方版_免费开源php集成环境下载地址电脑版-锐品软件...
  7. 如何将一个JavaScript数组打乱顺序?
  8. Node如何自动重启进程
  9. mysql 索引 insert_mysql优化:定期删数据 + 批量insert + 字符串加索引为什么很傻
  10. JavaScript中的try...catch...finally