全文共4375字,预计学习时长11分钟

图源:unsplash

我是一家人工智能初创公司的技术联合创始人,然而我们并未取得成功。Pharma Foresight着眼于医药商业智能领域,下面是我们的电梯广告:

“目前制药公司的研发回报率低于资本成本,因此制药公司投资创新药物的利润越来越低。决定要进行哪些临床试验,获得批准的可能性是一个至关重要的指标,而这种指标目前正以一种非常主观且有偏见的方式来计算。我们的AI算法可以更准确地估计这个数字,它节省了时间和金钱,最终造福患者。”

我们有一个很强大的团队,并采用精益创业策略进行快速迭代;我们与各种不同的利益相关者进行了接近100次的访谈,以确定早期的产品购买者并验证了他们对我们产品的需求;仅仅4个月后,我们就与一家大型制药公司的全球投资组合管理办公室合作,该公司支付了我们构建模型的费用,我们也保留了所有的知识产权。

然而,尽管遵循了很多初创公司的成功经验,PharmaForesight还是失败了。由于时运不济和判断失误,我们最终并没有成功。

这次失败让我更清晰地明确了一个道理:人工智能初创公司与SaaS初创公司采用的策略和方法是有微妙的区别的——但这并没有得到广泛认可。这篇文章的目的就是讲述我们曾犯的错误,避免更多的AI初创公司重蹈覆辙。

首先,什么是人工智能初创公司?

有很多初创公司声称他们使用人工智能,但实际上,他们使用的只是外包的人工劳动力或是基本的统计技术。伦敦MMC Ventures的一项研究发现,40%的所谓人工智能初创公司实际上并没有使用人工智能。

而本文的观点是,如果没有相对现代的机器学习技术,人工智能初创公司是不可能存在的。比如,Poly.ai如果没有深度的学习算法就不可能存在。

这与那些只有部分产品使用了AI的公司形成了鲜明对比。例如,Spotify就在机器学习上投入了大量资金,而且机器学习如今已成为其战略的核心。但是,Spotify在以一种协调的方式使用机器学习之前就已经存在了。对我来说,它更像是一个SaaS公司。

从这个角度出发,我将向你介绍我在创办人工智能初创公司中学到的一些经验。

1.专有数据是关键

图源:unsplash

在商业情景中,思考人工智能的最佳方式是将其视为一种底层的支持技术,就像20世纪80年代出现的SQL数据库一样。SQL创造了价值数十亿美元的行业,比如客户关系管理。同样,人工智能将创造新的行业,并在大量商业用例中实现改进。

与SQL数据库一样,人工智能也依赖于数据。数据远比算法重要,这一点是公认的。高质量的专有数据对人工智能初创公司来说至关重要。

事后看来,我们的数据策略是错误的。最初,我们选择了更快更容易的方法——在公开的数据上构建工具的第一个版本。清洗和转换数据为机器学习做好准备,这花费了大量的时间,而当时的我们认为这其中有一定的可靠性。我们还以为,一旦我们获得了一定的可信度,那么访问更有趣、更可靠的专有数据集就要容易得多了。

事实证明,这些假设中有许多都是错误的。当开始构建模型时,我们找不到任何人来处理这个问题,但当我们完成模型构建时,又出现了许多竞争对手。即使我们的算法更精确,也难以与更成熟的竞争对手区分开来,尤其是似乎大家都使用了相似的数据。

构建模型似乎并没有让访问专有行业的数据集变得更容易(尽管我们当时资金用尽,否则我们无疑可以对此进行更彻底的测试)。对人工智能公司来说,访问专有数据集绝对是关键。

一般来说,有三种获取专有数据集的方法,而且它们不会相互排斥:

·        通过创建初始产品或服务的方式来收集数据,当用户与之交互时,该产品或服务会生成数据,这些数据随后可以用于改进产品或服务。例如Facebook、谷歌、Spotify和其他很多类似的网站都是这样。

·        通过手动收集一个小型专有数据集的方式来收集数据。这种方式可以用来训练初始的机器学习模型,此时模型需要表现得足够好,才能至少满足一些早期购买者的需求。随后的合作关系将使数据收集的规模得以扩大,从而可以改进模型等。Hoxton Analytics就是采用这种方法的公司之一。

·        与数据持有者(通常是大公司或公共机构)进行交易。例如,Sensyne Health已经与英国的几个国民医疗服务联合体(NHS Trusts)达成了一项交易。

在这三种选择中,我推荐第三种,原因如下:

如果你选择第一种,说明你并不是一家人工智能初创公司。因为你可以在没有人工智能的情况下提供服务,所人工智能对于你所能做的事情显然不是必要的。当然,人工智能可能会极大地改善你的产品或服务,但它必须足够优秀才能够收集到大量的用户数据。

如果选择第二种,还是很有可能创建一个人工智能初创公司的,但是为了能让成功几率最大化,初始数据集需要充足的利基市场,或者与现有的解决方案相比,你的方法需要足够创新。遵循这种方法的风险在于,在发展合作伙伴以收集大量数据之前,你的想法和数据集很容易被竞争对手复制,特别是当你处理一个广为人知的用例时。

这么看来,创建人工智能初创公司的关键途径就剩下第三种了——与大的数据持有者进行交易,以获取他们的数据。这就是绝大多数人工智能初创公司都是B2B的原因。

大型机构和公司通常行动迟缓,与他们交易通常需要一定的时间。是否允许另一家公司访问数据可能存在伦理或商业上的顾虑,这个问题也有待解决。但总的来说,公司会越来越意识到他们所持有数据的价值。

当然,还有一些人工智能初创公司并没有遵循上述任何一项选择,而是凭借自身算法的优势取得了不错的业绩,例如DeepMind(2014年被谷歌以5亿美元收购)和MagicPony(2016年被Twitter以1.5亿美元收购)。但这条路是很艰难的,在没有专有数据集的情况下,要保持竞争优势要困难得多。

2.为人工智能初创公司筹集资金非常困难

筹集资金是创业过程中最困难的部分之一。这一过程中其实包含很多技巧:讲好故事、推销、商业头脑、法律等等。为一家人工智能初创公司筹集资金则格外有挑战性。

图源:unsplash

我们原本以为,如果创业的想法和团队足够强大,并且有足够的吸引力,那么我们就能够筹集到资金。然而,我们大错特错了。

创业之初时就考虑可能的资金投入至关重要。不同的资助者有不同的目标和限制,从一开始就认识到这些是很重要的。早期创业的两大出资人是:

·        技术风险投资(VC)——对早期公司的机构投资者。在创业初期,他们主要关注三个方面——强大的团队、庞大的市场规模和良好的初始吸引力。

巨大的市场规模至关重要。由于风投通常会将大量资金投入风险极高的企业,他们会预计自己的大部分投资都会破产。所以为了投资成功,他们不仅需要看到超过10倍的回报,还需要看到时间周期在5年之内的回报。这意味着如今风投支持的公司通常是专注于颠覆大型行业的SaaS初创公司。

如果你接受了风投,那么创始团队通常对公司的控制权较小。大多数风投者坚持持有优先股(如果公司以低于他们投资价值的价格出售,那么你可以收回股权)和摆脱创始团队的能力(尽管这一点很少践行)。

·        天使投资者——天使投资者的形式和规模各不相同。有的希望与风投一起投资,而有的则希望能提供更稳定的资金。天使投资通常意味着你保留对自己的企业拥有更多控制权。在英国,除非你有良好的人脉,或者之前有过成功的创业经历,否则很难筹集到超过50万英镑的天使投资。大多数天使投资者会在10年左右之内退出。

基于上述的限制,为人工智能初创公司寻找投资格外有挑战性。

首先,人工智能初创公司通常比SaaS初创公司需要更长的起步时间。人工智能算法依赖于数据,而大的数据持有者通常是大公司,而通过任何方式获取获取大公司持有的数据都是很耗时。即使你可以访问数据,你不仅需要关注业务开发和软件平台(和在SaaS初创公司一样),还需要关注人工智能算法。

考虑到你需要更专业的技能,加之更长的起步时间,这意味着通常需要更多的资金来启动一家人工智能初创公司,这些资金需要是“稳定资本”。对大多数创始人来说,这就排除了长期天使投资的可能性(除非你人脉非常广)——因为所需的资金数额实在是太大了。

但当你向风投推销时,就是在与传统的SaaS公司竞争。如果一切顺利的话,这些SaaS公司可能会获得更快的回报。SaaS是一种很有吸引力的商业模式,它有定期的经常性收入,而且即使用户不经常使用该服务,他们也会忘记取消订阅。

在过去的十年里,SaaS商业模式对风投来说是非常成功,很多风投都陷入了这种思维模式中,但这种思维模式并不适用于很多人工智能初创公司。很多人说对我们说:“有了订阅收入后再来找我们。”

大多数人工智能初创公司会发现,至少在最初几年,你很难产生订阅收入,你需要采用一种完全不同的商业模式。你的提议需要更有说服力,才能筹集更多的资金。

3.根据用例,可解释性是关键

即使你有专有的数据集和出色的产品,也并不一定意味着你的产品会取得成功。如果你正在创办一家人工智能初创公司,一定要对人工智能和机器学习有一定的了解。然而,一般人并不熟悉这些话题,他们还可能会怀疑自己的潜力。

简单来说,你需要令人信服的证据来证明你的模型能顺利运行。现场演示可能有效。如果还不足以为信的话,那就尝试使用具体的、精心挑选的例子,而不是高精确度的数字。这听起来可能有悖常理,如果你有数学背景的话会更有体会。

能够解释模型的预测将增加人们对模型的信任。根据你的用例,能清楚地解释你模型的每一种预测通常与精确度同样重要。可解释性是一个很宽泛的话题,但总的来说,你的解释要尽可能得让人容易理解。

经验法则是,每个个体的预测越重要,其可解释性就越重要。

图源:unsplash

人工智能是一项令人惊叹的赋能技术,毫无疑问,它将在未来几年对我们的生活产生难以置信的影响。但这并不意味着创立一家人工智能初创公司很容易——其实困难远非如此。

我逐渐了解到创立人工智能初创公司有许多独有的困难,有许多方面没有得到充分的重视。在创立了PharmForesight之后,我坚信亨利·福特(Henry Ford)的名言:“真正的错误是我们没能从错误中学到经验。”

前车之鉴后事之师,我们犯过的上述错误,希望各位可以引以为戒。

推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:朱颜、闫欣阳

相关链接:

https://medium.com/swlh/three-crucial-lessons-for-launching-an-ai-startup-976d1d44f370

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

人工智能初创公司创办过程中的三个关键教训相关推荐

  1. 印花材料使用过程中的三个常见问题及解决方案

    印花材料使用过程中的三个常见问题及解决方案 1. 塞网及阴影 很多印花厂都是用简易厂房,气温比较高.有的在5~8月份可以达到40℃.气温比较高,容易出现塞网.印花时可适当添加5%以内的纯净水或3%以内 ...

  2. Moblin在MID软件系统中扮演三个关键角色........

    Moblin在MID软件系统中扮演三个关键角色: 1) 创建一个开发人员社区,关注创建和增强基于Linux的MID和其他设备所需的核心技术.最先创建Moblin时,这是该项目的首要目标.创建MID为目 ...

  3. 乔梁:实施 DevOps 过程中的两个关键思考

    <持续交付>译者<持续交付 2.0>作者 腾讯高级管理顾问 讲师介绍 大家都叫我"乔帮主"?这个绰号是我 2010年以领域专家身份加入百度PMO时得到的. ...

  4. 苏宁大调整中的三个关键

    带领苏宁贯穿线上线下的,是互联网思维,还是零售的逻辑? <商业价值>杂志 孙彤|文 尚文|摄 相继于阿里密会承销商.京东宣布新一轮7亿美元的融资之后,苏宁也刚刚完成了一次从模式.组织架构到 ...

  5. 链接与加载过程中,几个关键的概念

    http://www.cnblogs.com/qiaoconglovelife/p/5870000.html 加载(load) 将程序拷贝到存储器并运行的过程,由加载器(loader)执行. 链接分类 ...

  6. ai无法启动产品_启动AI启动的三个关键教训

    ai无法启动产品 重点 (Top highlight) Let me be upfront: I was the technical co-founder of an AI startup and i ...

  7. 进程在运行过程中的三种基本状态是什么?画出其转换图。

    进程三种基本状态 进程三种基本状态分别是就绪.执行和阻塞. 就绪状态 当进程已分配到除CPU以外的所有必要的资源,只要获得处理机便可立即执行,这时的进程状态称为就绪状态. 执行状态 当进程已获得处理机 ...

  8. mysql报错注入_关于Mysql注入过程中的三种报错方式

    放点原来的笔记,Mysql在执行语句的时候会抛出异常信息信息,而php+mysql架构的网站往往又将错误代码显示在页面上,这样可以通过构造如下三种方法获取特定数据. 实际测试环境: Default m ...

  9. DELL服务器安装过程中的三种模式AHCI, ATA, RAID

    BIOS 里的 SATA setting 有 AHCI mode, ATA mode, RAID mode三种模式. AHCI vs ATA ATA(AT Attachment) 是一个很久远的标准, ...

最新文章

  1. [C# Control] 仿RAR式进度条 (RarProgressBar)
  2. python下载word文件-python-docx操作word文件(*.docx)
  3. 解决windows显示开启HDR后chrome内截图泛白问题
  4. matlab的算法java_matlab环境下的回归算法分析
  5. 信息学奥赛一本通 1138:将字符串中的小写字母转换成大写字母 | OpenJudge NOI 1.7 13
  6. 面试官系统精讲Java源码及大厂真题 - 33 CountDownLatch、Atomic 等其它源码解析
  7. 解决频率选择性衰落的措施_螺杆压缩机,振动怎么办?解决办法在这里
  8. hdu 5996 dingyeye loves stone(博弈)
  9. oracle rman optimization,关于RMAN中的优化(Optimization)
  10. 小程序服务器配置要多高,小程序服务器配置要求
  11. 微博数据采集的10个经典方法
  12. Zigbee协议栈中文说明
  13. python pip 安装 升级 卸载命令
  14. MySQL数据库知识的总结
  15. OSChina 周二乱弹 ——普通高等男友招生考试
  16. 他把菜品变成远销省外的零食,经过口口相传,月卖70万
  17. 尼尔·斯蒂芬森 (Neal Stephenson) 谈他的新地球工程气候变化惊悚片并创造了“元宇宙”一词...
  18. ORACLE 统计男女数量
  19. 渲染多层材料的综合框架
  20. 循环嵌套之经典图形打印(C语言版)

热门文章

  1. php storm官网,phpstorm
  2. C++ Primer 学习笔记 第十章 泛型算法
  3. 看门狗配置以及计算详解
  4. SQlite增删改查
  5. 情境猜谜-关于你YES||NO的故事
  6. 【董天一】Filecoin: 影响力容错(PFT)和预期共识(EC)
  7. caffe-segnet编译
  8. 活动星投票乡村振兴案例网络评选投票小程序简单便捷的投票系统
  9. 或许你会想知道变老特效怎么弄
  10. 永磁同步电机的弱磁提速控制Simulink仿真