大牛!百度前科学家做中国版Auto ML,半年估值4亿!
近日,智铀科技宣布完成两轮融资,公司估值高达4亿。智铀科技一直致力于Auto ML,并研发出全自动机器学习平台“EBRAIN”,不但能提升数据科学家的生产力,而且有助于让非专业人员也能够自如的使用机器学习平台,最终实现工作效益的最大化。
创始人为前百度资深科学家,公司创立半年估值4亿.智铀科技的创始人兼CEO夏粉博士曾在百度任资深科学家,主要负责百度超大规模机器学习CTR团队,至今已投身于机器学习领域的研究和应用十五年以上,并在机器学习顶级会议杂志JMLR,ICML, NIPS等发表多篇文章。
智铀科技创始人兼CEO夏粉
在百度期间,夏粉曾推出业界第一个基于万亿规模的深度学习网络的商用在线学习系统以及全自动机器学习平台Pulsar。Pulsar被公司各业务线广泛使用,平台覆盖公司绝大部分业务线,包括凤巢、网盟、金融和糯米等,并受到一致好评。
智铀科技成立于2017年6月,2017年8月曾获天使轮投资,本次获得的pre-A轮融资由洪泰基金领投,投后估值达4亿人民币。
智铀科技的核心成员均为来自百度、阿里巴巴、新浪等知名互联网公司,均在机器学习领域深入研究十年以上,掌握最先进的大规模机器学习技术,并拥有丰富的项目经验。
夏粉说,智铀助力企业在数据分析与预测中实现多(处理的数据多、容纳的参数多),快(自动化快速建模、部署),好(模型精度达到世界领先水平),省(节省人工,更专注于业务本身),通过高效的大规模分布式机器学习训练框架,实现自动调参、自动特征学习,降低人工智能的开发使用门槛。
自主研发Auto ML:组合特征挖掘效率提升上千倍
从理论上来说,自动机器学习(Auto ML)需要在问题、特征和数据抽取、数据、特征预处理、模型算法选择、超参数调优一个完整的循环过程中全部自动化。
问题、特征和数据抽取需要专业知识,也需要人为判断,通常需要业务人员完成。在这方面,谷歌用深度学习网络解决图像问题自动化上迈出了重要一步。
谷歌的Auto ML算法主要基于强化学习算法(reinforcementlearning algorithms)具体如下:
一种控制器神经网络能够提议一个“子”模型架构,然后针对特定任务进行训练与质量评估;而反馈给控制器的信息则会被用来改进下一轮的提议。重复这个过程数千次——从而生成新的架构,然后经过测试和反馈,让控制器进行学习。最终,控制器将学会为好的架构分配高的概率,以便在延续的验证数据集上实现更高的准确性,并且对于架构空间的差异很小。看起来就像下图:
谷歌于去年5月发布了Auto ML,让AI去训练AI。这款系统不但能让没有专业知识的人创建机器学习模型,还将创建机器学习模型中所有艰苦麻烦的工作,包括训练和调试,都承接了过来。
与谷歌相比,智铀科技开发的全自动机器学习平台“EBRAIN”具备第四代机器学习能力,有以下几个主要优势:
数据量:千亿样本、千亿特征
模型:从浅层到深层灵活支持
DNN:万亿链接神经网络结构
调研:自动化特征学习&参数 调节
时效性:模型在线更新
评估:可视化模型&数据分析
在数据处理上,EBRAIN采用重要性采样,选择1%样本就能达到90%随机样本效果;并使用特征删减算法,达到效果无损、特征删减97%;通过样本过滤算法,过滤能够随机噪音 。
在参数学习中,首创参数搜索算法:解决人工无法调参 (近百超参数的调整)的问题,自动机器学习仅需约24小时。
在特征学习中,采用组合特征学习算法:组合特征挖掘效率提升上千倍;利用半监督特征学习:从无标签数据中提取有效特征。
在模型算法中,浅层模型算法,LR收敛速度提升60%;Gbdt算法:比Xgboost既快又好。深层模型中使用首个万亿参数大规模离散DNN。
EBRAIN:支持私有化部署与SaaS服务,实现企业智能变革
今年初,谷歌又推出Cloud Auto ML,这个动作意义重大。它意味着企业直接用AI训练AI,甚至不用机器学习和数据专家,并且能在云上完成,这对谷歌本身与客户来说都非常重要。
一方面,谷歌利用Auto ML能够为企业解决机器学习的的痛点;另一方面,在Cloud上实现这一技能又能够扩展谷歌云,这代表了云计算公司的发展方向。目前,除了谷歌外,Facebook的工程师们也已经开发了称为“自动化机器学习工程师”的工具,它的名字也叫AutoML,能够就最有可能解决问题的算法和参数做出选择。
智铀科技创始人兼CEO夏粉也看到了这个趋势。他说,以“EBRAIN”机器学习建模平台为代表的平台级商用软件,支持私有化部署与SaaS服务,为客户实现智能变革建立基础。
以内容推荐应用为例,医药公司会通过微信、邮件等方式为医生推送一些内容(即文章), 推送后医生会对文章有阅读或点赞行为。现在需要根据医生的特征和历史阅读、点赞记录预测其感兴趣的内容,从而进行内容的精准推荐。
常规的做法是:对医生和文本提取大量特征,进行特征选择和变换,选择合适算法和对应的超参数,训练模型。通过在验证集上效果,挑选最优的特征、算法和超参数。所有的选择过程由人工完成,耗费大量人力和计算资源。
对此,智铀在文本结构化处理的基础上,利用云计算提供的大量计算能力,通过Ebrain在很短的时间内自动构建客户兴趣模型,并提供内容推荐核心服务能力。最终,根据医生的兴趣进行信息推荐,按照行业标准预估客户内容访问量提升50%以上。
目前智铀科技已经与金融、医疗、物联网等多个行业的公司进行合作为其提供服务,目前产品的功能应用涵盖点击率预估、反欺诈侦测、市场精准营销以及个性化推荐等,满足不同场景的不同需求,同时产品的有效性经过实践验证,不但能够为企业带来收入的增长并且节省成本。
class="video_iframe" height="370.125" width="658" frameborder="0" data-src="http://v.qq.com/iframe/player.html?vid=j0550w1mm7e&width=658&height=370.125&auto=0" allowfullscreen="" data-ratio="1.7666666666666666" data-vidtype="2" style="display: block; width: 658px !important; height: 370.125px !important;" data-vh="370.125" data-vw="658" src="http://v.qq.com/iframe/player.html?vid=j0550w1mm7e&width=658&height=370.125&auto=0"/> 世界公认最健康的作息时间表,今后就照这个来~ 继浙大之后波士顿又发机器人视频了! 有个微信小程序想人工智能跟你一起修复老照片
大牛!百度前科学家做中国版Auto ML,半年估值4亿!相关推荐
- 专访深蓝航天CEO霍亮:做中国版梅林发动机 深耕火箭回收复用赛道
雷递网 雷建平 7月12日报道 太空探索技术公司SpaceX持续火热之际,国内民营运载火箭领域也在快速发展. 近期,国内可回收复用火箭公司深蓝航天"雷霆-R1"可重复使用液氧煤油发 ...
- 支付宝要做中国版Amazon Go 开无人超市?
蚂蚁金服支付宝班委俞峰在今日的分享会上表示,蚂蚁经过反省和思考,想清楚了自己要做什么--聚焦核心竞争力(支付宝的核心能力是交易),回归商业和金融,用五年时间推动无现金社会和信用城市建设. 另外,他还提 ...
- 【ChatGPT】硬刚ChatGPT!文心一言能否为百度止颓?中国版ChatGPT“狂飙”的机会在哪儿?
目录 中国版ChatGPT"狂飙"的机会在哪儿? 文心一言能否为百度止颓? 百度是否有计划开发新的产品和服务? 你知道"文心一言"吗?( ChatGPT 果然还 ...
- 硬刚ChatGPT!文心一言能否为百度止颓?中国版ChatGPT“狂飙”的机会在哪儿?
文章目录 目录 产品背景 发展历程 科技简介 主要功能 合作伙伴 结语 文心一言 (英文名:ERNIE Bot) *是百度基于文心大模型技术推出的生成式对话产品,被外界誉为"中国版ChatG ...
- 百度振兴计划:中国版ChatGPT“狂飙”的机遇与挑战
自从OpenAI发布了ChatGPT以来,全球范围内的AI领域都产生了极大的关注.作为国内最大的搜索引擎巨头,百度如何应对这个挑战?中国版的ChatGPT是否能够成为百度止颓的良方?本文将从机遇与挑战 ...
- e成科技融资成功,不做中国版Workday而是要重新定义HR SaaS
3月25日,多日不见的巨额融资,在企业级服务市场发生. 人力资本数字化平台e成科技宣布完成8000万美元C轮融资,本轮融资由光速美国基金(LSVP)和阳光保险领投,老股东光速中国基金.凯辉创新基金和S ...
- 最具中产气质的“网易考拉”,离“中国版Costco”还有多远?
螳螂财经|木宇 吴晓波有一次在参加<锵锵三人行>的时候说道,自己见过的大富豪中几乎没有一个是真正快乐的,在窦文涛追问之下,想了想之后又补充道,"哦,是有一个,丁磊." ...
- 做中国女人难,做中国女装更难
本文来自远川商业评论(ID:ycsypl) 作者:于可心/任小酒 中国女人拎出来,是世界第三大经济体. 从人口计算,能生产GDP并带来消费的20-60岁女性,中国有4亿.而这四亿人,每年掌控消费支出达 ...
- 投资收购微盟、博易智软后,要做中国Salesforce+ Palantir的天马股份再发智能商业π型战略
每一个企业级的人 都置顶了 中国软件网 中国软件网 为你带来最新鲜的行业干货 本文作者:牛成 邮箱:nc@soft6.com 微信:niuch_evil 日前,天马股份召开智能商业战略发布会,对外 ...
最新文章
- Django-form表单
- 40幅五彩缤纷的秋天风景摄影作品欣赏(上篇)
- html asterisk 电话,Asterisk 常见问题
- php 简单日志搜索
- 13 MySQL--存储过程
- @property 和@synthesize
- 慕课网 jupyter notebook魔法方法学习小记
- (Windows)Scala学习3--列表、数组
- 2015年1月c语言程序设 第二版,2015年电大1253+C语言程序设计A(2010年1月)小抄参考.doc...
- c#餐饮系统打印机_C# 实现打印机功能
- 【电子元件】稳压(齐纳)管 Zener Diode
- get请求中文乱码问题解决
- Microsoft Office LTSC ProPlus 2021 Volume(含:Project + Visio)离线命令方式安装说明(原创)
- 黑群晖二合一已损毁_手动修复黑群晖已损毁磁盘空间
- 11月 第4周 GitChat 话题排行榜
- 手机图片转换成文字怎么办
- MT6323详细芯片资料分享 MT6323设计原理图须知
- 综合日语第一册第十五课
- 《Head First 系列图书》大集合,附案例分析,免积分下载
- 原来国家的名字可以如此浪漫(the Romantic Name of a Country)