近日,一则题为“词错率2.97%:云从科技刷新语音识别世界纪录”文章进入大众的视野,文中的宣传“将错词率(Word Error Rate,WER)降到了惊人的2.97%,较之前提升了 25%,已超越人类专业速记员水平。该成果有望推动语音识别技术的大幅进步,已超越人类专业速记员的水平”的字眼令正在从事语音识别研究的科研工作者和技术提供商一阵错愕,不明真相的群众纷纷认为当前语音识别已经刷无可刷,语音识别技术已经没有门槛,语音识别是已经解决的问题了……

但是事实并不是这样,在LibriSpeech这种简单数据集上“刷”到词错误率2.97%并不困难,语音识别领域仍存在大量的问题需要解决。作为一名关注语音识别技术发展的业内人士,希望能通过本文还原语音研究和产业的真实情况。

语音识别技术(Automatic Speech Recognition,简称ASR)是指让机器可以自动将人的语音转化为文字的一种AI技术。语音识别研究最早开始于20世纪50年代,在早期,有科学家甚至把这项技术和“将水转化为汽油,从海里提取金子,治疗癌症”等并列为不可完成的任务。经过半个世纪的发展,语音识别技术在2011年之后迎来了黄金发展时期:前微软研究院俞栋和邓力研究员首次将DNN在大词汇量语音识别上成功应用,基于神经网络的语音识别技术迅速成为了研究和产业上的投入密集地,在工业界Google和国内的讯飞成为了最早上线基于DNN的语音识别系统的两家公司。经过接近10年的发展,语音识别技术取得了空前的进步,在多个场景下已经达到了实用水平。手机语音输入法、智能音箱、汽车语音交互等产品走入了寻常百姓家,语音识别技术也成为了人工智能中技术落地最早、用户范围最广的技术。国际上Google、微软、IBM、苹果等巨头都将语音技术研究放在很高的地位,国内除了科大讯飞外,百度、阿里、腾讯等巨头也进行了布局,包括思必驰、云知声等创业公司也先后进场,呈现出百花齐放的格局。

语音识别技术发展如此迅速,现在还影响语音识别效果的因素主要有哪些呢?笔者认为主要包括环境因素、说话人因素以及技术因素三个层面: 环境因素:主要是背景噪声和环境混响的影响。典型的场景就是在地铁里用语音输入效果会明显下降,在距离很远的地方去操控音箱也不怎么灵了。

说话人的因素:比如口音明显的人用语音识别很费劲;说话很快、口齿不清的人识别效果也一般。另外就是生僻的专业领域的识别率也不会很高。

技术因素:包括建模方法和训练语料两个方面,比如基于神经网络的系统就是比上一代GMM-HMM系统明显好;训练数据多了,覆盖实际场景多了效果就会更好。

那么,如何客观的评价目前语音识别系统的效果以及各家的技术水平呢?很容易想到的有两种方式:一种是拿到各家的产品,找第三方去做客观的对比。但是这种对比方式操作起来难度很大。首先是各家的产品形态不同,支持的业务不同,支持的说法也不同,不容易做统一测试。其次是有些学术机构技术水平很高,但是没有产品,无法参与对比。最后就是要找到真正客观的第三方也非易事。

另外的一种对比方式就是在公共的评测数据集上,各家拿出看家本领测出最好的效果。这种评测数据集的语种一般是英语,方便在国际范围内进行比较,而这样就的结果就能在很大程度上说明技术实力。

目前类似的测试集很多,难易程度也差别很大,结果相互之间并不可比。比如参加考试的是一群大学生,但是拿了个小学生的试卷来考试,会导致得分没有区分性,容易得到错误的结论。下面就对语音识别领域常见的一些评测数据集进行分析,从结论上就比较容易得出各家的技术水平如何。

SwitchBoard:一个电话通话录音语料库,作为国际通用的语音识别系统的基准,已被使用超过 20 年,具有广泛的影响力。该数据集是真实的电话数据,数据录音质量比较好,但是说话人口音多样,风格多变,是难度较大的测试集。SwitchBoard上最好成绩是微软研究院在2017年8月份取得的WER 5.1%(识别率94.9%)。

CHiME:Computational Hearing in Multisource Environments,始办于2011年,由法国、英国、美国的知名研究机构所发起,目的是希望通过比赛促进学术界和工业界针对高噪声和混响等实际场景提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性。赛事吸引了很多高水平的企业和机构参与。

2018年最新一届的CHiME-5比赛数据难度极大,语音识别领域的难点技术都包含在里面:多麦克风阵列录音同步问题;快语速和随意的说话风格;高混响和大环境噪声;大量的语音交叠(鸡尾酒会问题)。据悉很多原计划参赛的机构因为难度太大都没有提交最终的评测结果。国内的讯飞在这个赛事上力压欧美劲敌再次囊括了赛事的所有四项冠军,体现了极强的技术实力。但是,即使是讯飞最好的成绩也只有WER46%(识别率54%)左右,因此这次赛事被讯飞戏称为“史上最难语音识别任务”也不为过。

LibriSpeech、Aurora等:影响力较小、难度低的一些公开集合,这次云从科技使用的LibriSpeech数据集,是1000小时的朗读风格的数据集,信噪比也很高,所以在这种数据集上很容易“刷”出好成绩。

下面就通过一个表格,来从不同维度对数据集的难度进行打分,让大家有个更直观的对比: SwitchBoard CHiME-5 LibriSpeech

环境因素难度系数 ★★★ ★★★★★ ★

说话人因素难度系数 ★★★★ ★★★★★ ★

综合难度系数 ★★★☆ ★★★★★ ★ 通过以上的分析,基本可以得出来几个结论: 国际上的微软和国内的讯飞和是语音识别技术领域的第一梯队,领先优势还不可撼动。

语音识别问题还远没有解决,还需要学术界和工业界一起努力,继续推动技术向前发展。切不可因为某些刻意夸大的宣传导致**和工业界的投入的大幅度减少,研究大环境需要学术界和工业界来共同呵护和培育。

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐一:【小挖案例】人脸识别设备在金融领域的应用一、我国是人脸识别设备全球最大的消费区域2018年8月,国际调研机构GenMarketInsights发布了《全球人脸识别设备市场研究报告2018》,该报告研究了全球人脸识别设备的市场状况。报告显示,2017年,全球人脸识别设备市场价值为10.7亿美元,到2025年底将达到71.7亿美元,在2018年至2025年期间将以26.8%的速度增长。其中,中国异军突起,成为全球人脸识别设备最大的消费区域,数据显示,2017年占全球比例29.29%,2023年将达到44.59%,在2018——2023年复合年增长率预测为29.53%。从企业维度上看,排名前三的为云从科技、Aurora(英国)、浙大网新,市场份额分别为12.88%、4.18%、3.31%。可见,中国相关领域的金融科技公司已经领跑全球。从国内来看,IDC发布的《2018年中国计算机视觉应用市场研究》显示,我国已经诞生了多家具有竞争力的人脸识别设备制造商,云从科技、商汤科技、依图科技、旷视科技四家企业的总体市场份额达69.4%。表1:云从科技、商汤科技、依图科技、旷视科技等企业基本情况以人脸识别技术为代表的人工智能产业的快速发展,离不开我国政策的鼓励和支持。2017年7月,***印发《新一代人工智能发展规划》。该文件指出,我国目前语音识别、视觉识别技术世界领先,自适应自主学习、直觉感知、综合推理、混合智能和群体智能等初步具备跨越发展的能力,中文信息处理、智能监控、生物特征识别、工业机器人、服务机器人、无人驾驶逐步进入实际应用,人工智能创新创业日益活跃,一批龙头骨干企业加速成长,在国际上获得广泛关注和认可。未来,还将全面拓展重点领域应用深度广度,全面提升经济社会发展和国防应用智能化水平。2018年9月14日,国家工信部公示了2018年人工智能与实体经济深度融合创新项目名单,明确了我国人工智能核心关键技术布局,其中核心基础产品包括云从科技的“基于自研Soc芯片的高准确度人脸识别产业化应用”等。表2:2018年人工智能与实体经济深度融合创新项目名单之核心基础产品二、云从科技推进“人脸识别+金融”的战略布局云从科技是具有代表性的人脸识别设备制造商,成立于2015年3月,投资公司位于广州,运营公司位于重庆。截至2018年10月,累计完成融资额度约为35亿元。在落地场景上,安防和金融成为云从科技的主要选择。根据相关报道,目前,云从科技已成为中国银行业第一大AI供应商。包括农行、建行、中行、招行总行等全国400多家银行已采用公司产品,为全国银行提供对比服务日均2.16亿次。“人脸识别+金融”战略布局下,云从科技研发的产品主要解决了金融服务的两大痛点问题:服务成本和用户体验。在降低金融服务成本方面,云从科技可以以较低的成本,提供高效的身份认证服务。例如,云从科技提供的基础服务按次收费,在按量计费模式下,可以提前充值帐户,按实际调用量即时扣费。使用多少,支付多少。扣费项目包括API调用、存储服务,调用失败不收取费用。其中,人脸比对每次收费0.01元,身份证识别0.01元,年龄性别识别每次0.001元。在提升用户体验方面,根据官网披露,云从科技人脸识别算法准确率可达99%以上,具备支持毫秒级的识别响应能力,使用十分便捷。并且,基于安防产品的研发能力和应用经验,云从科技的人脸识别技术安全性也较高。表3:云从科技部分金融服务产品三、从人脸识别到智能感知再到智能分析的迭代升级云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段。2018年10月29日,云从科技宣布在语音识别技术上取得重大突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%。此次语音识别突破属于智能感知中的一环。智能感知即视觉、听觉、触觉等感知能力,能够让计算机通过各种智能感知能力与外界进行交互。相比于之前的人脸识别技术,云从科技在人工智能领域的应用水平又迈进一步。未来,通过智能平台的搭建,还将继续推进智能分析的迭代升级。而人工智能技术在金融场景的应用程度也将一进步加深,特别是在互联网征信与风控、精准营销、智能投研、金融信息安全等领域,具有较大的市场空间。资料来源:1.“从人脸识别到智能感知云从科技刷新语音识别世界纪录”,http://www.ceweekly.cn/2018/1029/238712.shtml2.“云从科技完成B+轮融资推进国家人工智能平台产业‘生态’发展”,http://www.sohu.com/a/258148648_1187933.“全球人脸识别设备市场研究报告2018,云从科技市场份额排名第一”,http://www.sino-manager.com/?p=91733挖财研究院成立于2015年,设有国内首家互联网金融博士后工作站,聚焦于大众用户利用互联网进行财富管理这一重要课题,打造具有行业影响力的“智库”和“创新源”,推动互联网金融创新,助力行业健康持续发展。(本文仅代表作者观点)

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐二:...”独角兽居然刷新了“语音识别”的世界纪录,影子股尽享龙头溢价

10月29日,云从科技今日宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,较之前提升了25%,超过微软、谷歌、IBM、阿里、百度及约翰霍普金斯大学等企业及高校。

在半个月之前,10月12日云从科技在京发布国家人工智能基础公共服务平台,正式加入“国家队”。国家发改委确定云从科技与百度、腾讯、科大讯飞,承担国家“互联网+”重大工程——“人工智能基础资源公共服务平台” 建设任务。目前,该平台已正式投入运营。

云从科技是中科院旗下国际领先的人工智能公司。公司已经在银行、**行业POC测试中超过63次获得第一,奠定生物识别行业领先地位。云从科技先后与**部、四大银行、民航总局建立联合实验室,推动人工智能产品标准的建立,也成为唯一同时参与起草和制定人脸识别国标、行标的企业。

相关公司方面,据选股宝主题库(xuangubao.cn)

*免责声明:文章内容仅供参考,不构成投资建议

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐三:讯飞输入法语音黑科技助力“子弹短信”登顶苹果应用榜

论“搞事情”的能力,整个科技圈都服老罗。比如重新定义七点半的发布会,漂亮的不像实力派的坚果手机,脑洞大开的One Step、BigBang、闪念胶囊等创新功能,使得锤子科技和老罗的关注度一直高居不下。这次8月20日锤子科技夏季发布会上,老罗“甩”出一款叫“子弹短信”的即时通讯软件。让人意外的是,这款APP近日登顶苹果AppStore应用榜,力压微信、QQ等热门应用,其火爆背后离不开智能语音这个杀手锏。

老罗在发布会上介绍,子弹短信为“高效沟通而生”,针对消息收发、工作管理以及信息备忘做了优化,尤其是子弹短信在消息处理上做的比即时通讯业老大哥微信更便捷高效,深得网友推崇。一般而言,即时消息无非语音或文字,子弹短信它发出的消息做到了实时语音转文字,语音识别率可达97%,用户还可以选择同时发出“语音+文字”。

发布会后,子弹短信已在各大Android应用商店和苹果AppStore中火速上架。意味着,除锤子自家手机,其他智能手机也能体验。从实际产品体验感知,语音是子弹短信的灵魂所在。据了解,子弹短信制作团队快如科技与亚太地区最大的智能语音与人工智能上市公司科大讯飞进行了合作,语音转文字功能是由讯飞输入法提供技术支持。

在提升效率这一点上,锤子科技和老罗总能让人惊喜。从方便程度看,用户不需要进入具体对话框,在聊天列表界面就能直接发消息,甚至在手机任何界面使用子弹短信悬浮窗长按语音输入,不用打开APP就能实现信息的发送。值得一提的是,有了讯飞输入法语音识别技术加持,子弹短信甚至能“听懂”方言。老罗在微博上回应称,“讯飞威武”!

在移动互联网时代横空出世的讯飞输入法,凭借对智能语音的持续探索和创新,实现语音输入效率1分钟400字,通用语音识别率高达98%。人工智能兴起时代,讯飞输入法在语音识别、语音合成、翻译等语言类AI技术上不断突破,大幅提升方言识别、语音翻译及语音交互效果。2018年,讯飞输入法面向全社会启动了“方言发音人招募”行动,对濒危语言、方言进行系统研究,实现对一个语言的完整“复制”,最终研究成果将开放给大众使用。

据赛诺最新发布的《2018上半年中国手机输入法报告》显示,语音输入占比提升至41%,大幅超过手写输入。报告同时显示,作为语音业界头号玩家的讯飞输入法,以9.2的高分位列用户满意度第一。随着人工智能技术渗透,输入法进入了智能语音输入时代。

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐四:美股开盘前瞻 |三大期指微涨,中概股继续向好 必读

2018年9月21日 21:03:31

智通财经APP获悉,美国股指期货基本持平,截至发稿,标普500指数期货涨0.11%,报2942点;道指期货涨0.18%,报26776点;纳斯达克100指数期货跌0.17%,报7621点。

欧洲股市向好。德国DAX指数涨0.53%,报12391点,法国CAC 40指数涨0.59%,报5483,富时100指数涨1%。美元指数期货跌涨0.34%,报94.13。纽约Comex黄金期货跳水,跌0.850.19%,报1201美元/盎司。NYMEX原油涨0.80%,报70.88。

个股方面

苹果公司(AAPL.US)盘前涨0.38%,微软公司 (MSFT.US)涨0.20%,谷歌 (GOOG.US)涨0.06%,Facebook (FB.US)涨0.20%。

亚马逊(AMZN)涨0.93%。市场消息称,亚马逊在周四的一场发布会上宣布推出15款Alexa新产品,进一步彰显了该科技巨头对于深入语音助理领域的决心。发布会上,亚马逊还介绍了将Alexa添加到第三方设备的新方法。

沃尔玛(WMT.US)跌0.26%。沃尔玛在致美国贸易代表莱特希泽(Robert Lighthizer)的函件中表示,如果特朗普**对进口自中国的产品加征关税,该公司可能会提高商品价格。函件称,关税将影响所有商品的价格,从食品到饮料和个人护理用品。

富国银行(WFC.US)涨0.36%。富国银行周四表示,将在未来三年内裁员约5%至10%。截至6月30日,这家美国第四大银行大约有26.45万名员工,裁员10%意味着将有2.645万人失业。此次裁员将有助于富国银行实现到2020年将成本降低40亿美元的目标。富国银行还表示,到2020年,将把分支机构数量减少约800家,并出售非核心业务,以降低成本,提高效率。上个月,富国银行的抵押贷款部门解雇了600名员工。

美光科技(MU.US)由跌转升,涨2.22%。

美光科技第四财季利润和收入强劲,但业绩指引不及预期。美光科技周四盘后公布的最新季度财报显示,该公司第四财季净利润43.3亿美元,合每股3.56美元,去年同期为23.7亿美元,合每股1.99美元;调整后每股收益3.53美元,高于分析师3.33美元的预期;收入同比增长37.4%至84.4亿美元,高于华尔街82.5亿美元的预期。美光科技预期下一财年第一财季每股收益为2.88至3.02美元,收入为79亿至83亿美元,不及预期的3.08美元和84.5亿美元。

此外,美光科技首席财务官David Zinsner表示,美国**特朗普的关税计划将打击该公司的毛利率。

中概股

京东(JD.US)盘前涨1.86%。京东持股的奢侈品电商Farfetch将于周五在纽约证券交易所上市,代号为FTCH,发售价为每股20美元,高于该公司此前设定的17至19美元的指示性发售价范围,发售股份总数为4420万股,融资总额为8.85亿美元,估值约55亿美元。去年6月,京东向Farfetch投资了3.97亿美元。此外,Farfetch在监管文件中承认,如果京东首席执行官刘强东遭到指控,相关调查会对其品牌产生负面影响。

百度(BIDU.US)涨1.86%。百度首席执行官李彦宏在由中央网信办主管的全国网信工作指导性刊物《网络传播》杂志发表署名文章。李彦宏表示,平台越大,责任就越大。因为好的、坏的,美的、丑的,真的、假的,在网上都有,这对百度的产品理念和行为准则提出了更高的要求。

阿里巴巴(BABA.US)涨1.88%。阿里云IoT市场总监王云词宣布,阿里云物联网平台设备接入网已经超过3000万。王云词表示,未来3年内阿里云IoT生态建设目标突破10万ISV合作伙伴,力争装载AliOS things芯片模组出货量超过10亿。

网易(NTES.US)涨超3%。近日,网易旗下第三方支付平台网易支付即将上线跨境收款服务。根据网易跨境支付官网显示,网易跨境收款平台将针对在境外电商平台开展货物贸易的出口跨境电商卖家,提供资金账户开设、收款结汇等服务。

其他方面,哔哩哔哩 (BILI.US)涨超1%,爱奇艺 (IQ.US)涨1.35%,唯品会(VIPS.US)涨1.98%。微博 (WB.US)涨2.34%,陌陌(MOMO.US)跌超2%。

重要消息

欧元区9月制造业初值回落至53.3,创两年新低。

英国媒体称特雷莎·梅的退欧计划在欧盟峰会上“遭羞辱”。

港元涨疯了破7.80关口,涨幅创十五年最大。

特斯拉再现人事动荡:供应管理副总裁出走,一个月内损失五名大将。

关注稍晚的美国9月Markit制造业、服务业PMI初值,以及美国上周石油钻井数据。

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐五:科技金融股上涨动力十足 复牌股补跌行情不一

本周大涨的板块有,人脸识别周上涨10.77%,语音技术周上涨10.67%,稀土永磁周上涨8.86%,机场航运周上涨8.78%,人工智能周上涨7.96%,新材料周上涨7.66%,智能医疗周上涨7.61%,证券业周上涨7.60%,云计算周上涨7.59%,啤酒概念周上涨7.57%,电子制造周上涨7.46%,医疗器械周上涨7.38%,软件行业周上涨7.18%,计算机设备周上涨6.92%;本周下跌的板块只有煤炭和消费金融,分别微跌0.91%和0.82%。

本周多只复牌股开启封板补跌模式,周二复牌的奥马电器(002668,股吧)和露笑科技(002617,股吧)连续4天封板跌停,单周分别重挫34.35%和34.23%,周三复牌的瀚叶股份也在本周重跌了27..19%,周四复牌的新光圆成2日总计下跌19.04%,周五复牌的东方金钰(600086,股吧)、宏图高科(600122,股吧)也是跌停收盘。但周一复牌的吉药控股在复牌第三天就结束了跌停,不过单周仍然补跌了19.77%,钱江生化(600796,股吧)更是只经历一个复牌跌停便稳住了股价,单周下跌11.84%;而云南白药(000538,股吧)则因资产重组继续停牌。此外,安德利在本周下跌了21.33%,ST中南在本周下跌了13.03%,仁东控股在本周下跌了11.78%,近期连续涨停的维宏股份在本周下跌了11.45%。

本周和下周沪深交易所均未安排新股上市;新股申购方面,本周三为迈为股份申购日,它的申购中签率为0.02%,投资者下周二可申购中国人保和贝通信,这两只新股的预计中签率都是0.05%。

下周个股解禁市值相对较小,5号的解禁市值最大,也不过刚刚突破百亿元,8号的解禁市值更是只有2亿出头。但仍然有一些解禁比例较高的个股,高升控股解禁占比为33.88%,贵州燃气解禁占比40.50%,盈峰环境和**科技的解禁占比也都接近30%。

巨丰投顾认为,市场成交量温和放大,但增量资金仍不足以扭转趋势,连续拉升的金融股存在调整预期,预计大盘箱体震荡是大概率事件。操作上,短线建议重点跟踪流动性充裕的超跌股,对低价低估值个股则可以中长线布局。

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐六:罗永浩称子弹短信完成A轮1.5亿融资,整体估值6亿 | 钛快讯

钛媒体快讯 | 8月28日消息:今日,罗永浩在微博证实,子弹短信已经完成第一轮1.5亿融资。

8月20日,在锤子科技坚果Pro 2S发布会上,子弹短信正式亮相。子弹短信是由北京快如科技研发、锤子科技投资的一款即时通讯App,其最大的亮点是高效沟通。它不仅支持语音、文本输入,同时还支持“语音输入、文字输出”。其功能包括: 1、全局悬浮球:无需进入App,在手机桌面按住悬浮钮直接说话,选择联系人即可发送。

2、快捷回复功能:用户无需进入聊天页面,在 App 的消息列表页面就可以快捷回复消息;列表页面支持直接展开多条未读,可以语音或文字快速回复。用户可以自己选择发送信息的类型,发送语音的同时会自动转为文字并附带,语音识别率高达97%,让用户在不同场景下都有高效的选择;

3、引用回复功能:任何端口都支持引用回复功能,让聊天过程中不再意义不明,拒绝低效率的沟通

4、与非子弹短信用户的好友也可以直接发送信息;

5、历史头像和“这是谁来着?”:子弹短信的每个用户主页中都将对其好友展示曾经用过的历史头像,也可以看到与该好友第一次的对话记录,帮助用户回想起来这是谁。

短短几日内,子弹短信便冲到了App Store排行榜第一名。8月23日,根据工商资料网站天眼查显示,子弹短信获得了数千万融资。

今日,罗永浩微博连发两条表示:子弹短信上线七天,已完成第一轮1.5亿融资,速度“令人发指”。罗永浩转发科技客微博,间接证实了如下消息:A轮融资1.5亿;整体估值6亿;或由成为资本和高榕资本领头。

截图自罗永浩微博

近几日,罗永浩的微博也不停提及子弹短信。除了融资消息外,罗永浩还帮助子弹短信招兵买马,”欢迎业界精英用子弹一样的速度投简历“。

根据子弹短信发布的招聘信息显示,子弹短信APP端(IOS端:IPhone/Ipad;安卓端)和Web端都在紧锣密鼓的研发中,这也就意味着,子弹短信未来将覆盖IPhone、IPad、安卓机和PC端。

同时,不少媒体称这是一款意图冲击微信的产品,针对类似的言论,罗永浩在微博表示,“1、没有挑战微信,只是做一个在意沟通效率的人群的细分领域而已。2.子弹短信不是锤子科技做的,是快如科技做的,我们只是其中一个投资方。3.腾讯投资部貌似已经在接触快如科技了。”

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐七:浙商证券:蓝思科技买入指数   扣非业绩大幅下滑,下半年旺季业绩将有望扭转

蓝思科技上半年归属于上市公司股东的净利润4.35亿元-4.98亿元;其中扣非前Q1为1.10亿元,Q2为3.25亿元-3.88亿元。由于公司收到客户支付的较大数额研发收入,非经常性损益约为8.59亿元。扣非后Q1为0.36亿元(YOY-77.39%),Q2为-4.60亿元至-3.97亿元(2017Q20.65亿元),扣非后业绩大幅下降,主要归因于一方面,公司配合各大品牌客户进行新技术、新材料、新工艺、新设备等研发试制,为下半年生产旺季做准备,投入了大量研发费用;另一方面,消费电子产品市场需求整体较为乏力,大量新品试制投产导致良率损耗加大,以及相关的固定资产折旧、员工工资等成本开支显著增长。

上半年手机市场遇“冷”,转机已逐步显现

1)上半年国内手机市场出货量为1.96亿部,同比下滑17.8%,去年全年出货量为4.59亿部,同比下降4%;iPhone系列一季度销量为5220万部,仅增长了3%,其中新机iPhoneX一季度销量1270台,出货量不及预期。我们预计今年整体智能手机低迷时期已过,随着进入传统的Q3旺季有望大幅拉货;2)2.5D/3D玻璃出货量增长迅速,随着国产机加速导入3D玻璃背板,2017年出货量达到2000万片,2018年上半年出货量达到2200万片,2018年全年将达到7000万片;2.5D玻璃日出货量达到100万片,预计全年出货量将达6.5亿片以上。我们认为上半年低点已过,三季度转机已逐步体现。

入股豪恩声学,逐步打造一站式平台

近期公司以自有资金人民币9047万元入股豪恩声学15%的股份进入声学领域,豪恩声学主要产品包括微型麦克风、语音识别模组、扬声器/受话器、有线/无线耳机和智能音箱等产品,已经成为全球500强企业的电声产品供应商,上半年净利润规模达到3174.58万元,通过产业整合,将导入公司优质客户的资源。公司从上市以来,通过业务板块不断的扩充,目前已经形成玻璃+触控Sensor+贴合+声学一站式解决方案平台,单机价值量大幅提升,另外,随着双面玻璃搭载率提升,3D玻璃前盖板在安卓手机渗透率加速,推动公司业绩增长。

盈利预测及估值

考虑到公司为全球消费电子产品防护玻璃行业的领先企业,顺应去金属化趋势,玻璃盖板出货加速,以及多元化布局贡献新增量。我们预计公司18-20年实现的净利润为28.95/38.25/51.15亿元,对应EPS分别为0.73、0.97、1.29元/股。我们看好公司盈利能力以及未来的成长空间,给予“买入”指数。

风险提示

下游需求不达预期,竞争加剧。

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐八:搜狗翻译宝Pro:智能翻译引领消费升级,背后AI科技功不可没   英国迷你剧《黑镜》里曾这样描述过未来世界:在不久的将来,趋于完善的智能科技彻底将人类从繁复的基础工作中解脱出来,人工智能打破了次元壁,并抚平了现实世界的绝对时空差,人与人之间的沟通交流再无障碍限制。 虽然影片中的世界尚未到来,但作为现实生活的映射,人工智能技术在21世纪高调走红,成为引领当前科技发展的潮流方向。同时,伴随着新一轮的消费升级,天猫精灵、小爱同学、搜狗翻译宝Pro等以AI智能为科技支撑的硬件时尚单品轻松占领现代消费红榜。在智能沟通方面,AI翻译硬件迅速走红,各大品牌纷纷涌进翻译类硬件赛道,发布翻译类产品,“AI翻译”类市场迎来百家争鸣之势。在这种情况下,品牌如何抓住市场及消费痛点,完善自身科技提升用户体验,成了各大品牌蓄力迎战、角逐C位的保命底牌。

“人工智能是我们需要把握的一个机会”,搜狗CEO王小川称,“搜狗以往长期从事网络搜索的基因,天然地对于AI文字理解具备优势。搜狗输入法庞大的用户群体,也都使得搜狗的智能语音交互技术更容易理解自然语音,这是其他同类企业所缺少的。”

作为最早发布AI翻译机的公司之一,近年来,搜狗以融入血脉的智能网络搜索基因为根基,并在此基础上不断加大AI科技研发力度,极大提升AI翻译技术在翻译硬件中的交互和认知能力,最终研发出的强大AI语音互译技术与AI离线翻译技术独放异彩,多年来始终处于行业领先水平,引领着AI智能翻译界的潮流和发展。 今年秋季,搜狗推出最新款时尚AI翻译机——搜狗翻译宝Pro,支持42种语言实时互译及中英日韩4种语言离线翻译。这款翻译宝可谓融合了以往搜狗单品的所有优势,只看外观,便会让人有惊艳的感觉。3.1寸高清触摸大屏加4款魅力色可选,时尚感十足;采用铝合金机身,颇具质感;打开主页,语音翻译、拍照翻译、录音备忘三个功能模块清晰美观;点击语音翻译后可以选择需要翻译的语言,机身侧面有一红一蓝两个按键,按住蓝键可以开始录音,红键可以播放翻译结果,使用起来极为便捷。 当然,一款智能产品之所以能走红成爆款,除了亮眼的外观,剩下的就是其背后蕴藏的超群技术了,搜狗翻译宝Pro也不例外。

早在2016年,搜狗就上线了神经网络翻译技术,并不断进行技术迭代,2017年7月升级为Transformer-NMT机器翻译,而2017 年 5 月份,搜狗参加了国际顶级机器翻译评测 WMT,获得了中英机器翻译全球第一,语音识别准确率高达97%,在线和离线语音识别模型几乎一致,远超同行业翻译设备。另外,对比目前翻译市场上的翻译软件,仅离线翻译这一关手机软件便被拒之门外,更别提高达97%的准确率。 同时,搭载Transformer-NMT黑科技的搜狗翻译宝Pro,不仅拥有强大的语音识别技术和语音合成技术,更采用搜狗自研的OCR图像识别技术,能够识别出图像内包含的文字内容,然后经过断字断句之后进行翻译。OCR技术不仅能应对光线、曲面、角度、透视、畸变等拍照状态,覆盖多种场景,还可以做到理解图像的排版,将翻译后的内容以原图的排版和格式呈现,方便查看。这就意味着,在外出旅游或商务沟通中,只要对着需要翻译的菜单或文件拍张照,搜狗翻译宝Pro就能实时帮你翻译成母语,让你不仅能够“听得懂”“说得出”,更能“看得懂”“写得出”! 毫无疑问,在当前智能翻译市场上,搜狗凭借着领先的AI智能科技已经取得了阶段性胜利,但探索永远不会止步,搜狗王小川表示,“未来,搜狗将继续以语言为核心,在‘自然交互+知识计算’的技术路线图上持续探索,实现‘无处不在的搜索’,成为中国人工智能领域的创新者和引领者,一起开创更加美好的未来!”

《语音识别再破记录,这个领域究竟哪家强?》 相关文章推荐九:美国股市全线高开 标普500指数创历史新高

【美国股市全线高开 道指、标普500指数创历史新高】标普500指数高开6.23点,涨幅0.21%,报2936.98点。道琼斯工业平均指数高开96.48点,涨幅0.36%,报26753.46点。纳斯达克综合指数高开11.91点,涨幅0.15%,报8040.14点。

东方财富网21日讯,美国股市周五全线高开,道指、标普500指数创历史新高。标普500指数高开6.23点,涨幅0.21%,报2936.98点。道琼斯工业平均指数高开96.48点,涨幅0.36%,报26753.46点。纳斯达克综合指数高开11.91点,涨幅0.15%,报8040.14点。

英国脱欧突然又生变!英镑今天已跌了超过100点

周五(9月21日)欧市盘中,英镑/美元大幅下挫,跌幅超过100点,料创逾两个月最大单日跌幅,最低跌至1.3149,隔夜曾攀升至近两个月以来的最高水平1.3297。

终于“缓过来了”?美元指数收复94.00关口

周五(9月21日)欧洲时段,美元指数由93.80附近的两个月低位反弹,回到94.00关口上方。

经合组织表示 全球经济增长“可能已经见顶”

在周四(9月20日)发布的最新中期展望中,经合组织预测,2018年和2019年全球经济增长率将达到3.7%。这一水平略低于十年前金融危机爆发前的水平。

港元“疯了”!0.6%的涨幅让沉闷的市场着实吃惊

北京时间周五(9月21日),消息称,说起汇率走势上的始料不及,今年我们已经见识了土耳其里拉和阿根廷比索,如今这个清单上得再添一员,那便是港元飙升0.6%。

高盛重夺大宗商品之王 大砍金价预期逾100美元

据Coalition Development Ltd研究,2018年上半年,高盛已经重夺大宗商品之王宝座,不过目前仍需要跟摩根士丹利及摩根大通共享这一称号。几十年来,高盛一直是华尔街主要的大宗商品交易商。

美光科技第四财季利润和收入强劲,但业绩指引不及预期。美光科技周四盘后公布的最新季度财报显示,该公司第四财季净利润43.3亿美元,合每股3.56美元,去年同期为23.7亿美元,合每股1.99美元;调整后每股收益3.53美元,高于分析师3.33美元的预期;收入同比增长37.4%至84.4亿美元,高于华尔街82.5亿美元的预期。美光科技预期下一财年第一财季每股收益为2.88至3.02美元,收入为79亿至83亿美元,不及预期的3.08美元和84.5亿美元。

Steelcase周四盘后公布的第二季度财报显示,该公司该季营收、每股收益和第三季度业绩指引均超华尔街预期。Steelcase第二季度营收由去年同期的7.756亿美元增至8.758亿美元,好于预期的8.737亿美元;每股收益为0.41美元,好于预期的0.29美元;Steelcase预计第三季度每股收益在0.28美元至0.33美元之间,营收在8.85亿美元至9.15亿美元之间,均高于华尔街预期的0.25美元和8.34亿美元。

United Natural Foods周四盘后公布的第四财季财报显示,该公司该季营收和每股收益均逊于华尔街预期。United Natural Foods第四财季营收为25.9亿美元,不及预期的26.1亿美元;每股收益为0.76美元,低于预期的0.85美元。United Natural Foods是亚马逊旗下全食超市的最大供应商。

特斯拉负责全球供应管理的副总裁Liam O‘Connor已经离职,Liam O’Connor于2015年3月从苹果公司跳槽到特斯拉。该电动汽车制造商最近已经历了一轮高管离职,其中包括首席会计官和三位负责人事关系、通讯和财务的副总裁。

有新的数据表明,特斯拉Model 3 Performance销售情况不错,最近两周售出1124辆,按6.4万美元的起售价,销售额至少达到7200万美元,在计及选配因素后,可能会超过8000万美元。特斯拉预计将在两周内发布第三季度产量和交付数据。

Adobe公司周四宣布,已以47.5亿美元收购了私营云计算营销软件公司Marketo.Adobe此笔收购交易,可能对HubSpot、甲骨文、SAP和Salesforce等竞争对手产生影响。Marketo的****包括佳能、嘉信理财(Charles Schwab)、Eventbrite、通用电气、微软和现代公司等。

亚马逊在周四的一场发布会上宣布推出15款Alexa新产品,进一步彰显了该科技巨头对于深入语音助理领域的决心。发布会上,亚马逊还介绍了将Alexa添加到第三方设备的新方法。

富国银行周四表示,将在未来三年内裁员约5%至10%。截至6月30日,这家美国第四大银行大约有26.45万名员工,裁员10%意味着将有2.645万人失业。此次裁员将有助于富国银行实现到2020年将成本降低40亿美元的目标。富国银行还表示,到2020年,将把分支机构数量减少约800家,并出售非核心业务,以降低成本,提高效率。上个月,富国银行的抵押贷款部门解雇了600名员工。

美国最大连锁药店沃博联宣布将在阿里巴巴天猫国际平台上开设旗舰店,向中国消费者销售博姿(Boots)品牌美容产品。

半导体公司Resonant周五宣布,该公司任职不到三周的首席财务官Michael Seifert已辞职,该公司并未透露Michael Seifert突然离职的原因。

麦当劳宣布将季度股息由1.01美元上调15%至1.16美元,并表示将在第四季度派发近9亿美元股息。麦当劳称美国的减税举措和强劲的业务表现为提高股息奠定了基础,并预计销售额将按3%至5%的速度增长,每股收益将按高个位数的速度增长。

德州仪器宣布将现金股息由62美分上调24%至77美分,并将于11月19日派发。董事会还授权了额度为120亿美元的股票回购计划。

京东持股的奢侈品电商Farfetch将于周五在纽约证券交易所上市,代号为FTCH,发售价为每股20美元,高于该公司此前设定的17至19美元的指示性发售价范围,发售股份总数为4420万股,融资总额为8.85亿美元,估值约55亿美元。去年6月,京东向Farfetch投资了3.97亿美元。此外,Farfetch在监管文件中承认,如果京东首席执行官刘强东遭到指控,相关调查会对其品牌产生负面影响。

百度首席执行官李彦宏在由中央网信办主管的全国网信工作指导性刊物《网络传播》杂志发表署名文章。李彦宏表示,平台越大,责任就越大。因为好的、坏的,美的、丑的,真的、假的,在网上都有,这对百度的产品理念和行为准则提出了更高的要求。

阿里云IoT市场总监王云词宣布,阿里云物联网平台设备接入网已经超过3000万。王云词表示,未来3年内阿里云IoT生态建设目标突破10万ISV合作伙伴,力争装载AliOS things芯片模组出货量超过10亿。

近日,网易旗下第三方支付平台网易支付即将上线跨境收款服务。根据网易跨境支付官网显示,网易跨境收款平台将针对在境外电商平台开展货物贸易的出口跨境电商卖家,提供资金账户开设、收款结汇等服务。

关键字:

识别

阅读全文

语音识别再破记录,这个领域究竟哪家强?相关推荐

  1. 0.38秒!MIT 机器人还原3阶魔方的时间再破记录

    作者 | Leo 魔方大家应该都玩过,能在短时间内还原魔方的孩子常常被很多家长认为是聪明的表现,人类目前还原三阶魔方的记录为4.69秒. 不过和围棋不一样,在这项竞技上,机器不给人类任何机会. 现在由 ...

  2. 阿里再破记录!代表中国企业首次在这项国际比赛中摘得银牌!

    2月9日在洛杉矶举行的第11届网络搜索与数据挖掘国际会议(WSDM 2018)上,公布了今年的WSDM Cup竞赛成绩,来自阿里巴巴的AliOS团队凭借优秀的算法能力,摘得榜眼. 这是该赛事举办11届 ...

  3. 再破记录!2019天猫双11八小时总成交1504.9亿,开场后8分1秒发货量破1亿

    11月11日,根据阿里巴巴实时数据显示, 2019天猫双11开场后八个小时总成交1504.9亿元. 而在此之前,2019天猫双11仅仅用时1小时26分7秒成交额便超过人民币1207亿元,超过2016年 ...

  4. 跟谁学市值赶超新东方,在线教育究竟哪家强?

    在线教育最近可能要变天了. 近日,一个让在线教育后浪们激动的事情发生了--上市仅1年的跟谁学,超过了上市15年的新东方.目前跟谁学的股价仍在上涨,截止美东时间8月6日收盘,跟谁学股价131.260美元 ...

  5. GeenMedical让你知道本领域哪家强,该谁才是真同行,统计检索结果一作、通讯、关键字和国人发文

    文章目录 统计分析 分析结果 功能一:期刊统计 功能二:第一作者 功能三:通讯作者 功能四:keywords分析 功能五:Mesh分析 功能六:年份统计 功能七:国人发刊 测试Plant Microb ...

  6. 抗DDOS攻击哪家强?是堵还是疏?

    近期,安全狗SRC联合i春秋SRC部落,携手推出了爆款话题:传统抗D设备vs新兴CDN抗D:抗D效果哪个好? 话题一经发布,好评如潮,热评无数,四方雷动.为了避免懒癌晚期的表哥们错过这个干货满满的内容 ...

  7. 【安全狗SRC】抗D设备哪家强?你来!大佬告诉你答案

    上周,安全狗SRC联合SRC部落,携手推出了爆款话题: 传统抗D设备 vs 新兴CDN抗D:抗D效果哪个好? 一经发布简直好评如潮,热评无数,四方雷动(?) 原帖在此,错过的吃瓜表哥们可以再围观一下~ ...

  8. 自动驾驶哪家强?全球自动驾驶竞争力排行分析

    近年来得益于传感器处理.自适应算法.高精度地图和人工智能等技术的快速迭代及进步,自动驾驶汽车市场及技术正走向一个新的水平.据Research and Marketing预测数据,至2030年,全球自动 ...

  9. SnnGrow快讯:Apple Books上线AI读书功能、有声书市场将迎来颠覆时刻、刚过7岁生日的OpenAI估值达到290亿美元、跻身全球独角兽排行榜前20、中国航天2023全年发射将再破60次

    一.Apple Books上线AI读书功能,有声书市场将迎来颠覆时刻 卫报的记者发现,Apple 悄悄推出了人工智能讲述的语音书功能,可能标志着人类播音员时代终结的开始,也可能是科技公司试图颠覆有声读 ...

最新文章

  1. vsftpd配置文件详解
  2. golang微服务框架对比_微服务里程碑,Golang与Spring Cloud Alibaba完美结合
  3. C#常见金额优选类型及其三种常用的取整方式
  4. MySQL 学习笔记 二
  5. 【Java从入门到头秃专栏 6】语法篇(五) :多线程 线程池 可见、原子性 并发包 Lambda表达式
  6. python写一个crm系统_用Python打造一个CRM系统(四)
  7. JavaScript数据类型之算术运算符(7)
  8. Android连接管理的评分机制(WIFI,Ethernet,BT,移动数据
  9. Network | parity bit
  10. 用Linux编写C语言程序
  11. Java复习 思维导图
  12. 学习Spring框架这一篇就够了
  13. 【图解CAN总线】-7-Classic CAN 2.0总线网络“负载率”计算(方法二)
  14. 性能服务器阵列,存储性能101:服务器、阵列与网络架构基础
  15. Cronlog日志分割器
  16. Java常见面试题(2)
  17. Window xp 桌面主题修改为windows经典后,再恢复为Window xp 的方法
  18. Expected a string but was BEGIN_OBJECT at line 1 column 2 path $
  19. json字符串转list集合
  20. Matlab学习——滑块曲线生成APP设计

热门文章

  1. Win11 PowerShell字体大小设置
  2. Echarts调色盘
  3. 配电网分布式电源和储能选址定容 以配电网总成本最低为目标函数,其中包括年运行成本
  4. 实时数仓之 Kappa 架构与 Lambda 架构
  5. 百度云使用proxyee-down下载
  6. Suricata-IDS与IPS
  7. [Unity3D]Unity3D游戏开发之MatchTarget实现角色攀爬效果
  8. Ubuntu紫色背景颜色代码
  9. 简谐振动基本方程的推导
  10. FPGA学习altera 系列 第十七篇 自动售货机设计