图文原创:谭婧(王❤凌老粉)

“爷青回”

“我们只是老了,并没有死。”

谭老师作为老粉,热烈庆祝“甜心教主”王❤凌成为现象级翻红顶流。

只要地球不爆炸,她的数据就一个都不能丢,还得用好了。

那为王❤凌从头开发一套大数据与智能系统吧?

答案,没必要。

不能把精力花在和IT基础设施你死我活地缠斗中。

就好比,当你的目的是去开会,那就不能去搭建会议室。

所以,这边建议电视台:

把所有数据放到公有云上,使用无服务器架构(Serverless),将项目命名为 :

“王❤凌老粉打Call数据项目”

每一家云厂商都能拿出足够的资料来证明自己的产品才是最好的,我们不在此处争论。

方案技术选型上,一步到位,挑选一朵最大的,全球部署的公有云,方便❤凌文化出海。

用亚马逊公有云,全方位无死角给❤凌打Call。

首先,王❤凌的视频,音频,电视剧,演唱会等大批量历史数据,不存放在本地IDC上。

现在疫情,供应链紧张,硬件采购周期太长,电视台的审批流程也太长,不能等。

直接将❤凌的所有数据妥善存储在Amazon S3 数据湖中。

不同种类的数据都能存,量大量少都能存,而且不会丢,永远在数据湖里,安全,放心。

技术上,这些文件存进S3数据湖自动成为数据API,方便调用,标准一致,取用方便。

怪不得,有人称S3为事实上的云计算对象存储标准。

没有数据指导的业务,怎么可能做好?

领导着急看数,数据分析人员更着急,这个情况不允许发生,立刻配备云数据仓库Amazon Redshift。

联合查询的功能不能少:

比如,某电视台数据分析专家想查手机APP平台和大屏电视机顶盒观看平台的用户之间的联系。

Redshift联合查询可以直接从手机App平台(已入湖),大屏电视机顶盒平台(基于数据库),获取数据的联系。

晚上九点,晚饭后,某一批用户在电视上反复观看王❤凌现场舞蹈(产生的行为数据存在数据库中,包括当时产生的很多标签)。

然后,我们直接查询一批用户在手机App中的观看过和这些行为数据中的标签相关的视频(这些数据存在数据湖里),比如标签里有“甜心教主” “电视剧”。

这两类数据存放在不同的地方,一个在数据库,一个在数据湖。如果之前没看过相关视频(“王❤凌男孩跳舞热榜”),就向手机App端推送。

实时智能分析必不可少:

先将历史数据和新鲜(实时)两种数据同时接入云数据仓库Redshift。

Amazon Redshift ML 使数据分析师和数据库开发人员可以在Redshift 数据仓库中使用熟悉的 SQL 命令轻松创建、训练和应用机器学习模型。

实时看板必不可少:

某电视台,没有设置王❤凌线上投票,实在令人遗憾,氛围感差些些。

建议电视台开展线上投票,并公开实时看板,让全国粉丝了解投票热度整体进展,即时知道投票效果。

所有产生的实时打榜数据,接入流式数据管道Amazon Kinesis,数据像水流一样一直灌进来。

并不是所有人时时刻刻在打榜,水流有大有小,而无服务器架构的Kinesis可以基于水流的大小即时弹性扩缩,无需关心流量高峰低谷,安心接入。

Redshift创建流式物化视图对接Kinesis,结合数据仓库内历史数据生成实时看板。

那些不能从电视台数据仓库里直接取数的外部团队,比如,抖音和快手,办法是电视台借助Amazon Redshift Data Sharing的功能,将数据安全共享。

查询并发高峰的时刻,Redshift并发扩展能力也能轻松应对。

总而言之,数据仓库性能越高越好,价格越便宜越好。

这就要靠云厂商的技术手段了,压力给到亚马逊云科技这边。 

“王❤凌老粉打Call数据项目”项目,危险行为识别必不可少:

用日志分析服务Amazon OpenSearch,做链路追踪,监视黑产恶意刷榜,确保公平。

“王❤凌老粉打Call数据项目”项目,数据库选型如下:

1. 如果王❤凌开直播,刷礼物的交易数据,先放入极致弹性的Amazon DynamoDB中,再将历史数据同步到Redshift数据仓库。

2. 手机APP用户浏览王❤凌视频的行为,记录等,也得存入非关系型数据库DynamoDB中。

本方案,为突发状况,准备了预案。

突发情况一:

突然,某天,要查询一遍过去十年的王❤凌数据,可能几十PB。

方法一:这种使用频率极低,又要分析海量数据,成本还要低的查询,就用Amazon Athena。

方法二,搭建一个Hadoop系统。但是,为了干这件事情,耗费的人力物力非常可怕,从头干起大约两个月。

在Athena里,查询按次按量计费,一定要查询的话,这笔费用可以出。

突发情况二:

“王❤凌男孩跳舞热榜”现象,让人始料不及。跟风创作,大量上传热舞视频。

实时处理这些视频并提取特征,为下一阶段分析提供数据,得用什么技术呢?

答案是,流式数据分析技术,Amazon Kinesis Analytics。

另外,历史数据怎么处理呢?

答案是,使用托管大数据平台Amazon EMR处理大规模历史数据,为❤凌的每一个历史视频都打上标签。同时EMR Serverless以极简的开发来处理数据,同时实现最低的成本。

最后强调一句,亚马逊云科技Serverless无服务器架构,很黑科技。

“王❤凌老粉打Call数据项目”方案的技术选型部分就介绍完了。

有任何好的方案建议,欢迎留言交流。

初听还是小学生,再听已是社会人,支持❤凌,致我们逝去的青春。

(完)

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨贾扬清独家专访(二)

DPU系列:

1.造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

其他:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 隐私计算:消失的人工智能 “法外之地”

4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

5.  AI芯片公司:拿下“超级石油”,助力地质模拟和人工智能

6. 两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500

7. “重型卡车自动驾驶,无量产,则无意义”赢彻科技CTO杨睿刚博士观点

漫画系列

1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5.想帮数学家,人工智能算老几?

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992。

还想看我的文章,就关注“亲爱的数据”。

"分享、在看、点赞、打赏、阅读原文 "五连都是爱~

给王凌打Call的,原来是神奇的智能湖仓相关推荐

  1. 写着代码的插画师—王凌 |WLOP|

    王凌(wlop),出生于江苏苏州,毕业于香港大学工学院,是一名工程师,自学的数字艺术与插画. 个人主页: http://wlop.deviantart.com/ 微博id: wlop- 以下部分内容来 ...

  2. 趣乐王正盛:如何认真地做一把智能吉他?

    看上去不像智能硬件的智能硬件 智能硬件创业者往往把自己的产品外观做得与众不同,人们也愿意相信,智能的东西看上去总会有些奇特.不过,呈现在雷锋网(公众号:雷锋网)编辑面前的这把吉他,无论是观感还是触感, ...

  3. 晨山资本王志飏:万物智联时代,智能企业的创新路径

    2020 年 11 月 7 日,由边缘计算社区主办的全球边缘计算大会在北京成功召开,作为业内首个专门为边缘计算人打造的行业盛会,此次活动现场共有超过 500+来自政.产.学.研.用各界的企业负责人.权 ...

  4. 全新英特尔®凌动™处理器E3900系列:支持下一代智能互联的物联网设备 —— 这个全新处理器系列把计算能力迁移到更靠近传感器的位置,从而减轻把所有处理工作推向数据中心的需求...

    物联网让数十亿智能互联设备互相连接,正在改变人们的生活和工作方式.到2020年,互联设备的数量预计将显著提高,500亿个设备(思科IBSG)每年产生44 ZB(44万亿字节)的数据,并且在端和雾网络中 ...

  5. 云从科技从容大模型:大模型和AI平台什么关系?为什么造行业大模型?

    原创:亲爱的数据 2023年5月18日,坐标广州南沙,来自云从科技的"云从从容大模型"正式亮相. 自此,云从科技从CV四小龙"进阶"成为一家AI大模型公司,同时 ...

  6. 看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?

    图文原创:亲爱的数据 美国大模型水平领先,国内大模型蓄势而发. 国内大模型参与者众多,百度文心一言第一个有勇气站出来发布. 此处应有掌声. 事前事后,中国网友的呐喊声不绝于耳:"文心一言到底 ...

  7. “重塑商汤研发体系”“动员整个公司”,我和商汤首席科学家王晓刚聊AI大模型...

    文丨谭婧 原创丨亲爱的数据 如今,大模型的故事,须写尽能写之事. 越是如此,观点越犹如过江之鲫,难辨优劣. 而大模型竞争犹如武火烹菜,顶级科学家没时间辟谣. 拿一组仅供我自己参考的数字--全国做大模型 ...

  8. 一场九年前的“出发”:奠基多模态,逐鹿大模型

    原创:谭婧 全球AI大模型的技术路线,没有多少秘密,就那几条路线,一只手都数得过来. 而举世闻名的GPT-4浑身上下都是秘密. 这两件事并不矛盾.为什么呢? 这就好比,回答"如何制造一台光刻 ...

  9. ChatGPT大模型用于刑侦破案只能是虚构故事吗?AI大模型企业服务趋势探讨(一)...

    故事开始了. 一阵疼痛痉挛,脚下地面渐渐返潮,他知道又要下雨了. 刑警老周摸索着爬到台阶的高处,等待老城区电子工厂夜班的收工铃声.素来挡风的夹克挡不住湿冷刺骨的潮气.这股子潮气里还不时翻滚浓烈的腐败腥 ...

最新文章

  1. 参数等效模型可以用于_等效媒质理论(介电参数反演)
  2. 电子学会青少年编程等级考试案例:曲奇饼干
  3. python列表的解析(转)
  4. ScriptManager同时存在于两个dll中的问题
  5. openladp升级一
  6. dot pairs 点_Dott入局欧洲共享单车市场 明年3月伦敦巴黎推出
  7. 潘淳:国士无双《微软技术俱乐部(苏州)成立大会暨微软技术交流会介绍》附专题视频...
  8. 没有主清单属性_原神:晴知的主C诺艾尔大型进阶攻略初版
  9. 《构建之法》课程总结及建议
  10. 支持javascript的ppt软件_强大CSS3的3D幻灯片工具reveal.js(推荐)
  11. FlexForAndroid:文件读写
  12. 问题六十八:着色模型(shading model)(1)——反射模型(reflection model)(3.1)——辐射学(Radiometry)
  13. 强大的Mockito测试框架
  14. 如何解决Configuration system failed to initialize
  15. 环一维数组最大子数组问题
  16. 被果树点名做一个Blog游戏,答案如下...接下来换我点名了~~!!!
  17. 目标检测数据集下载及算法训练教程
  18. 【云计算学习教程】探讨私有云计算平台的搭建(附带3套解决方案)
  19. ICWPT 2022 | 从技术突破到生态构建,小米坚持做充电领域的拓荒者和领先者
  20. 网页前端设计-作业三(JavaScript)

热门文章

  1. 赖大师新文章 :Xilinx 开箱-KV260相机,两个小时轻松搞定,文章不能用我坐飞机过去帮你调哈。
  2. MySQL数据库基础——数据库基础
  3. 微型计算机的英文简写是,电脑英文简写?
  4. 百度云实现语音识别及语音合成
  5. MySQL中计算两个年份的相差
  6. Linux socket编程
  7. 用Comparator接口进行排序 --java
  8. 南研所前辈对华为的认识
  9. bilibili直播地址获取
  10. java 一元线性回归_线性回归 - Java教程 - 找一找教程网