点击上方,选择星标置顶,每天给你送干货

阅读大概需要7分钟

跟随小博主,每天进步一丢丢

来源:公子龙

2015 年开始,在 AI 领域创业的公司如雨后春笋一般林立而起。如果细分的话,可以分为机器学习ML,图像视觉CV,和自然语言处理NLP。当然,理论上来说,CV 和 NLP 也是属于 ML 范围的。

市面上,这几个领域的创业公司都有不少,相对而言,CV 领域的公司数目和规模是较大的。我从事 NLP 行业,在相关的创业公司待过一段时间,所以对该领域的公司较为关注。今天,可以来简单聊聊 CV 和 NLP 领域创业公司的情况,重点是要回答一个问题:同样是 AI 创业,为什么 NLP 领域明显弱于 CV 领域。

我们先来看看 CV 领域的创业公司们。在该领域,头部的创业公司有个响亮的名号,叫做 CV 四小龙,分别为:商汤、旷视、依图、云从,他们的融资金额都非常高。以商汤为例,成立了近六年,融资总额达到 30 亿美元,它的估值超过了 75 亿美元。

日期

交易金额

融资轮次

2018-09-10

10亿美元

D轮

2018-05-31

6.2亿美元

C+轮

2018-04-09

6亿美元

C轮

2017-12-26

未披露

战略融资

2017-11-28

15亿人民币

战略融资

2017-11-15

未披露

战略融资

2017-07-11

2.9亿美元

B+轮

2016-12-14

1.2亿美元

B轮

2016-04-26

千万美元

A轮

2014-11-07

数千万美元

天使轮

这几家公司的特点是,在后面几轮融资,动辄数亿甚至十亿美元的巨额融资,在资金逐渐紧缩的投资市场,的确让很多创业公司眼红。

相比之下,NLP 领域的创业公司的发展速度和融资规模,略显逊色。目前,与 NLP 有关的创业公司,发展势头不错的有:出门问问,追一科技,竹间智能等。列出这些公司的名字,很多读者可能感觉较为生疏,没有听过或者不怎么了解。的确,就名气上而言,也比 CV 四小龙弱了不少。其中,出门问问在2017 年的 D 轮融资中表现优异,获得了 1.8 亿美元融资,但之后再也没有新的融资消息传出。其他的公司数千万美元融资的情况较多,从融资规模上来看,和 CV 界相差甚多。

对了,这里多说一句,科大讯飞是一家很成熟的 NLP 公司,已经不算这几年新兴的 AI 创业公司了。

透过现象看本质,同样是机器学习领域,同样是顶着人工智能的创业光环,为什么现状差了这么多,难道是优秀人才都跑到 CV 领域去了吗?当然不是,接下来,我想从技术方面和市场方面,来分析一下背后的原因。

首先,从技术角度出发,自然语言处理的技术难度很大,尽管应用场景很多,但做好任何一项都不容易。自然语言处理的任务,基本都离开不了语义理解,任何事情,涉及到「理解」二字,就变得艰难很多。

图像处理的任务通常属于感知智能,所看即所得。例如识别出物体是一只猫,还是一辆车。但对语言来说,大部分问题是认知智能,需要考虑更多理解认知的因素。

因为视觉是人一出生就能够获取的,但语言是需要通过不断学习才能得到的,它是成千上万年以来,经过不断总结提炼后的高度抽象化的符号集合,组合起来可以千变万化。一段简单的文字,其含义很容易能超过数张图片所能承载的信息。举些简单的例子,我们现在还很难通过影片展示出《三体》中宏大的宇宙场景;寥寥几句唐诗,所涵盖的意境,可以宏伟至极。

现在很多论文中的研究成果,从实验室走向实际应用,最大的阻碍是鲁棒性。在宽松的实验条件下,得到的亮眼分数,往往在实际应用场景中一触即溃。其中,目前较为成熟的是文本翻译,但想必我们还不敢信任模型直接翻译的结果。

分析完了技术角度,既然是创业,我们再来看看商业中最终要的市场因素,在日常生活中,CV 最直接的应用是人脸识别,它已经融入了很多场景,小到手机的刷脸解锁,大到火车站的视频监控,罪犯查找。这里面是有着很多较为成熟的商机的。CV 四小龙就和很多手机厂商合作,让刷脸解锁、支付更为便捷,同时也可以和很多官方部门进行安防方面的合作。简而言之,有了较为成熟的市场需求。

如果提到 NLP 呢,生活中的应用我们比较容易联想到手机或者音箱上各式各样的智能语音助手。但我相信,大家一定很少去打开它们,因为无一例外,它们都太不智能了,与之对话会非常无聊。

这就引出了一个简单的结论,相对于 CV ,NLP 可单独拎出来的应用场景太窄了。虽说文本理解技术广泛应用于搜索、推荐、翻译等任务中,但这些方面的需求,通常是被大厂紧紧抓在手里,创业公司很难获取这些资源。为什么这么多 NLP 企业选择去做智能客服,还不是因为这个任务可以更好的 toB ( to Business),服务于各种企业,可以快速赚取现金流。

所以,技术上的巨大应用难度,鸡肋的市场需求,让 NLP 创业者很容易陷入窘境。这也就解释了,为什么市面上,鲜有比肩 CV 四小龙的 NLP 创业公司。当然,目前来看,四小龙的日子过得也并不舒适。毕竟,创业是一种九败一胜的搏命尝试。


方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读:

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency  Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


让更多的人知道你“在看”

【业界】在 NLP 领域创业,真的很难相关推荐

  1. 互联网创业真的很难找到“技术合伙人”吗?

    创业的大风越刮越猛,在每个人都想要一展抱负的时候,都开始为了合伙人而发愁,尤其是互联网的稀缺物种--程序猿.不知道多少人因为程序猿而搞得焦头烂额,我时常听到"要是有一个程序员就好了" ...

  2. 学淘宝美工设计真的很难吗?学历不高能做淘宝美工设计吗?

    本文由:"学设计上兔课网"原创,图片素材来自网络,仅供学习分享 学淘宝美工设计真的很难吗?学历不高能做淘宝美工设计吗?学历低.没有基础就学不好淘宝美工吗?低学历又想转行到淘宝美工的 ...

  3. 民营企业的项目,真的很难做

    民营企业的项目,真的很难做 笔者加入现在的项目超过2个月了.随着对于客户的了解越来越深入,尤其是通过合作的乙方咨询公司了解到一些情况,发现客户虽然越做越大越做越强了,但是却永远改变不了其民营企业的德性 ...

  4. 【转载】哈希表的原理,真的很难弄懂么?

    [转载]哈希表的原理,真的很难弄懂么? 刘小爱v 发布时间:05-0909:06科技达人 转载路径: https://baijiahao.baidu.com/s?id=1666172942887109 ...

  5. 二本学校考211计算机,普通二本学校的学生考211/985的研究生真的很难吗?

    原标题:普通二本学校的学生考211/985的研究生真的很难吗? 网友一: 我本科就是二本,念了一个交叉学科,交叉到什么地步呢,就是有些学校是把它放在教育学院,有些是设在物理学院,还有些是设在计算机学院 ...

  6. 转:Eric Lippert:阅读代码真的很难

    转自:http://blog.jobbole.com/438/ 相关文章 微软资深软件工程师:阅读代码真的很难(第2篇) 阅读优秀代码是提高开发人员修为的一种捷径 学会阅读源代码 如何阅读大型代码库? ...

  7. java左手画圆右手画方_左手画圆,右手画方真的很难吗?为什么人们很难做到呢?...

    导语:左手画圆,右手画方真的很难吗?为什么人们很难做到呢? 我们经常会看到有些人能够实现左手画圆.右手画方的这一个行为,并且是可以通过这样的方式来训练自己身体的协调能力的,那么当我们自己去尝试的时候, ...

  8. (资源)百度云盘:驴火歌王:阅读真的很难提分第2讲:洞茶 (2013北京中考)

    (资源)百度云盘:驴火歌王:阅读真的很难提分第2讲:洞茶 (2013北京中考)见上图 <祖逖>"天天练"(周六) 诸葛学堂<窦神归来文言文全年班>第 17 ...

  9. 数据结构真的很难学?

    如果你关注计算机专业招聘试题,会发现越是大型公司,问的问题越基础,有的甚至问你什么是栈和队列,反而一些小公司会关心你做过什么系统.从关注点的不同可以看出,大公司更注重基础扎实和发展潜力,而小公司希望你 ...

  10. 计算机一级office高级应用难吗,二级Ms Office全国通过率22%,真的很难吗?

    二级Ms Office全国通过率22%,真的很难吗? 全国计算机二级Ms Office考试,报名人数多年来居高不下,可实际通过率却屡创新低. 相信大家,在报完了二级MS office考试之后,都会出现 ...

最新文章

  1. 中国挪动批改KPI查核制度将器重客户满意度
  2. 使用Python实现真正意义上的随机数,谁能破解奖励1千万
  3. SQL Server 2005 Express附加(Attach)的数据库为“只读”的解决方法
  4. 【Windows 10 v1703】解决桌面出现Removable Storage Devices的问题
  5. systemd和sysv服务管理和配置
  6. php分城市的源码,userlist.php 源代码在线查看 - 城市分类信息,门户网站,我做为地方信息网 资源下载 虫虫电子下载站...
  7. c语言读写txt坐标文件数据,C语言——从txt文件中读写数据
  8. kettle 下载地址
  9. 数字万用表常用功能使用
  10. chrome(谷歌浏览器)固定到任务栏,点击之后出现两个图标
  11. java雷霆战机项目收获_java实习项目_雷霆战机
  12. 常见Linux命令pwd实现
  13. ue4生成粒子发射器
  14. matlab中用polyfit、regress、nlinfit等进行详细的回归分析
  15. IKEv2与IKEv1的差异
  16. 矩阵分析与应用-18-Moore-Penrose逆矩阵02
  17. Sql的行列(纵横表)转换
  18. c# 个人笔记 正在学习中....
  19. 北京2008奥运会门票到手
  20. UIpath for each遍历文件,判断,删除文件。catch捕捉全局异常

热门文章

  1. 用lua实现ByteArray和ByteArrayVarint
  2. UVa11809-Floating-Point Numbers
  3. 对于基类和派生类中的多态及重载的最好解释方法
  4. 自己做的一个水印生成类
  5. CSS hover 改变另外一个元素状态
  6. [UE4]复制引起的重复对象
  7. Centos 7 下 Mysql 5.7 Galera Cluster 集群部署
  8. spring 容器的理论知识
  9. 加速你的vs.net开发环境
  10. 多继承下的super()指向的不一定是直接父类