简介: 通过阿里云为流利说量身打造的数据湖解决方案,解决了流利说多种应用的各类数据的统一存储,帮助流利说构建数据规模高达上千亿的“中国人英语语音数据库”。

公司介绍

流利说是世界领先的科技驱动的教育公司,作为智能教育的倡行者,流利说拥有一支业内领先的人工智能团队,经过多年积累,流利说已拥有巨型的“中国人英语语音数据库”,累积实现记录大约 37 亿分钟的对话和 504 亿句录音。

流利说自主研发了领先的英语口语评测、写作打分引擎和深度自适应学习系统,从听、说、读、写多个维度提升用户的英语水平,为用户提供一整套系统性的英语学习解决方案,截止 2020 年 6 月 30 日,累计注册用户达1.856 亿。

业务场景介绍

2013 年流利说推出了第一款产品“英语流利说”,集成了语音识别、打分和自适应学习等多种核心技术。具有上下文情景对话、发音指导课程等丰富内容,并提供人工智能英语老师和游戏化的学习体验,为用户在英语学习中获得更多乐趣。这款有趣又有效的产品很快就占领了当时的市场并获得了用户的高度认可。
但业务快速发展,用户数大幅度增长,平台的用户数量已从当初的百万级,增长至过亿,因此业务的高低峰期数据流量变化、业务复杂度和分析难度都给给 IT 架构带来了巨大的挑战。

业务难点

流利说在面对日常业务需求量以及用户数量飞速增长的情况下,流利说常常需要面对以下几个不同的挑战

不同时段流量变化大,系统需要支持动态请求流量
由于每天不同时段流量变化很大,高峰时段的流量会达到平时的 10 倍,需要系统有足,够的能力支持动态变化的请求流量,因此对于系统弹性拓展能力,就提出了很高的要求。

产品组合和功能丰富,如何为系统平稳运行提供保障
由于产品组合和功能越来越丰富,对于系统的能够提供的性能要求不断增加,大量的付费用户对于访问体验有很高的期望,因此需要高可靠、高稳定的系统,来支撑各款产品平稳地运行。

数据量级与应用系统复杂度增加,系统容量和性能成问题
流利说自研口语评测、写作打分引擎和深度自适应学习系统,每天都需要根据用户学习情况进行分析,根据每个用户不同的学习给予评分和指导建议,随着用户数的增加和应用复杂度的增加,对于大数据系统的容量和性能都有着极高的要求。

阿里云数据湖解决方案

针对流利说日常业务对云服务的弹性、稳定性和大算力的极高要求,阿里云为流利说量身定制了一站式数据湖解决方案。

首先,对于数据存储,流利说的大数据平台使用 OSS 作为数据基础层,解决了流利说多类数据的统一存储,同时对接多种计算引擎。而且 OSS 提供了 99.9999999999% (12 个 9)的数据持久性和99.995% 的高可用性,有力的保障流利说的业务稳定和可靠。

在大数据计算方面,通过阿里云 EMR 构建大数据计算集群,提供了包括 Hadoop、Hive、Spark、Presto 在内的多种大数据计算引擎。基于数据湖的存储与计算解耦合架构,所有计算任务的最终数据都是存储到 OSS 持久存储。

同时,阿里云数据湖解决方案对开源生态提供非常友好的支持,客户基于开源框架开发的应用和业务代码,可以不用修改,直接基于阿里云的数据湖解决方案运行。

最后,阿里云 VPC 网络、RAM 等访问控制保障体系,更是为流利说的核心资产“中国人英语语音数据库” 提供了更可控,更细粒度的安全访问控制保护。

达到的效果

通过阿里云为流利说量身打造的数据湖解决方案,解决了流利说多种应用的各类数据的统一存储,帮助流利说构建数据规模高达上千亿的“中国人英语语音数据库”。使用阿里云构建的数据湖,可以充分发挥计算与解耦合架构的优点,结合阿里云 ECS 弹性实例和 K8S,根据实际业务需求,动态扩展、缩减对应计算资源,无须按照业务峰值常驻计算资源,这种灵活的使用模式,能够帮助流利说最大程度地优化成本。

原文链接
本文为阿里云原创内容,未经允许不得转载。

存储计算解耦合,构建中国人英语语音数据库相关推荐

  1. 近十年数据库流行趋势纵览!存储计算分离、ACID 全面回归......

    作者 | 黄东旭 责编 | 郭   芮 回看这几年,分布式系统领域出现了很多新东西,特别是云和 AI 的崛起,让这个过去其实不太 sexy 的领域一下到了风口浪尖,在这期间诞生了很多新技术.新思想,让 ...

  2. Spring底层控制反转解耦合(IOC)

    简单的例子解释IOC控制反转进行解耦合 一.相关概念 (1)解耦合 解耦合就是把程序中互相不相关或有限相关的模块分割开来,把不同模块互相之间的关系用接口进行准确定义,解耦前,两个模块之间共享所有信息: ...

  3. 如何用解耦合提升开发效率?闲鱼团队有了新发现

    阿里妹导读:在业务开发的过程中,往往存在平台代码和业务代码耦合严重难以分离.业务和业务之间代码交织缺少拆解的现象.平台和业务代码交织导致不易修改,不同业务的代码交织增加了不同负责团队之间的协同成本.因 ...

  4. 架构整洁之道(三)-解耦合与复用

    一.为什么要解耦合 前面说到,好的架构是要花费最少的人力成本来构建和维护软件. 对应到写代码上,有两个关键点. 维护的时候,每次修改尽可能少的代码. 维护的时候,每次修改或者添加功能,工程师要少做决策 ...

  5. 百度上线英语语音输入功能识别准确率高得惊人

    (2018年4月25日,广州)第十届全球移动互联网大会(GMIC)明天将在北京举行.本届GMIC聚焦"人工智能",将主题定为:"AI"生万物,寓意科学技术要有人 ...

  6. 云计算,不仅仅是数据的存储计算,更应该是数据的分析、挖掘计算- 电饭锅产业技术路线图发布:明晰发展方向

    注:个人感觉,电饭锅做饭好吃外,智能是一大需求.不光定时就完了,还要能远程控制,更要能支持云,这样电饭锅将用户的各种习惯.数据上传到云,在云端进行统计分析,然后向电饭锅下达指令,或者提示用户,这个月天 ...

  7. 云计算,不仅仅是数据的存储计算,更应该是数据的分析、挖掘计算- 电饭锅产业技术路线图发布:明晰发展方向...

    注:个人感觉,电饭锅做饭好吃外,智能是一大需求.不光定时就完了,还要能远程控制,更要能支持云,这样电饭锅将用户的各种习惯.数据上传到云,在云端进行统计分析,然后向电饭锅下达指令,或者提示用户,这个月天 ...

  8. 【小白的CFD之旅】20 计算区域的构建

    计算域是什么 计算域如何创建 常用的建模软件 计算域几何的特殊之处 具体的计算域提取方法 小白总结 自从上次在食堂听了小牛师兄关于计算网格的一些问题后,小白决定在寒假期间好好的补习一下关于计算网格的划 ...

  9. 云原生存储详解:容器存储与 K8s 存储卷

    作者 | 阚俊宝 阿里云技术专家 导读:云原生存储详解系列文章将从云原生存储服务的概念.特点.需求.原理.使用及案例等方面,和大家一起探讨云原生存储技术新的机遇与挑战.本文为该系列文章的第二篇,会对容 ...

最新文章

  1. Merry Christmas Happy New Year!!
  2. android开发 获取父控件的高宽
  3. 实战SSM_O2O商铺_16【商铺注册】前后端联调验证整体模块功能
  4. Haproxy + Pacemaker 实现高可用负载均衡(一)
  5. JSP第十四次课:JSP项目开发高级操作2---在线编辑器应用及前台首页显示商品
  6. pytorch已经安装成功了为什么不能使用import_使用auto keras的过程
  7. 如何使用Bootstrap Modal和jQuery AJAX创建登录功能
  8. Java基础学习总结(172)——手写Java 重试机制
  9. java setviewport_Java ImageView.setViewport方法代码示例
  10. 数据结构——>稀疏数组
  11. 戴尔optiplex3020主板接线_戴尔XPS 13 2020上手,12999元的高端精致怪,让苹果也很有压力!...
  12. web网页设计实例作业 ——二手书店-大学生书店(13页) 学生个人网站作业模板 简单个人网页制作
  13. php支付接口要改动的参数,京东支付接口2.0PHP集成遇到的一些问题:所有参数必须是string!...
  14. 基于STM32的STM8脱机编程器源码分享
  15. 3D游戏角色模型设计都要学习什么?
  16. Unity3d场景快速烘焙【2020】
  17. 计算机与通信学院方阵解说词,方阵解说词
  18. 用php实现本地文件的上传
  19. 结合《穹顶之下》看中、美宽带提速
  20. 用Python批量替换更改掉txt文本的内容

热门文章

  1. python接口 同花顺_利用python探索股票市场数据指南
  2. idea集成python_IDEA集成Python插件,SDK配置
  3. Java 哪些事最困扰你?
  4. windows的python切换环境_Windows下的python虚拟环境设置
  5. note.js和mysql的优劣_nginx与Node.js的优缺点是什么?
  6. linux u盘刻录软件,Deepin Linux下刻录Windows安装U盘:WoeUSB的介绍和应用
  7. 【LeetCode笔记】41. 缺失的第一个正数(Java、哈希)
  8. php分页类smary,Smarty分页实现方法完整实例
  9. android 自定义控件的宽高_巧用Handler获取View控件信息
  10. leetcode 3 --- 无重复字符的最长子串