文/北妈

阅读本文需要 4.5分钟


最近又有读者,问我要不要转去学大数据,好像前端和大数据一点不沾边.... 说实话我是无语的

文长,需耐心看完,读时有耐心,看完有信心。

这几年大数据和机器学习一直很热门,而且凡是和大数据沾边的行业或者公司,好像很牛x的样子。

并且很多人一直有个误区:后端才和大数据、机器深度学习、数据模型有关系,前端总插不上手。

而且很多人担忧再往后,前端给淘汰了,大数据吃香,薪水高,然后打算纷纷转大数据试试水。

其实,北妈早说过,你错了,前端在未来几十年都是热门和不可或缺的存在。

其实结论是:你压根不用转大数据,而是大数据本身就离不开前端数据可视化,只不过我们要做的是要学习并了解他们的关系。

就像汽车刚出来是煤气发动,后来是蒸汽机发动,后来是现在的汽油、电混合动力,后面是无人驾驶、纯电动或者高效能源。

只不过不同时代换了不同形态去驱动,但汽车本身并不会消失,人们也不可能离开汽车。

web前端由于所见所得的特殊性,在各行各业都有至关重要的作用和展现,只不过,后面的前端越来越偏向工程化、全面化和领域细分。

就算之后,机器统治了世界,web前端开发领域也不会消息,更不会没落,除非,人 都瞎了。

下面我摘一段 阿里数据可视化组工程师的一篇文章的部分段落,大家可以感受一下。

《大数据浪潮下的前端工程师》

马云曾经说过『人类正从IT时代走向DT时代』。

正如他说言,今天几乎所有的互联网公司背后都有一支规模庞大的数据团队和一整套数据解决方案作决策。

这个时代已经不是只有硅谷巨头才玩数据的时代,是人人都在依赖着数据生存,可以说如今社会数据价值已经被推到前所未有的高度。

我作为一名前端工程师在阿里巴巴数据团队工作多年,深入了解数据生产加工链路与产品化。我们这群前端是与界面最近的工程师们

完整数据链路

首先,我用直观的一张图绘制出数据采集到产出的流程,中间省略技术细节。

业界常提到的 Hadoop,Spark,Druid 都在用户侧的下方,也就是数据研发与数据挖掘职能的工作。相对于前端职能而言,一定是与输出终端相关,包括本职工作数据类产品的研发。

如阿里指数或百度指数这样的数据展示型产品,还有较为复杂的 BI 工具等,细分起来,最特别的工作应该是数据采集和数据可视化的工作。

但到今天而言,数据研发工程师已经很难说只精通其中一种技术。

任何一环深入下去都涉及到整条链路的打通,我就从数据采集,数据可视化,数据产品研发到人工智能几个板块来写写我的体会与经验。

数据采集

过去还是流量为王的年代,流量就意味着钱,互联网都用着简单粗爆的方式导流。

在过去做过站长的对数据采集已然不陌生,包括著名的第三方平台 CNZZ(现友盟+) 和 google analytics 两个平台几乎都使用过。

Web 端的数据采集的链路从客户端或后端开始一直到存储结束。因此,数据采集这个动作涉及到了前端,客户端,数据研发,产品经理等职位的参与。

在这个过程中,前端工程师的工作集中在不同客户端上(PC、iOS、Android)的信息收集及埋点上。

此外,业务反馈还可以从前端本身看,前端需要的稳定性指标也是从界面上采集到的,比如加载性能、JS 报错等。大规模应用背后开发一般都有自己的监控平台,而前端的监控就从用户界面开始。

数据可视化

经过清洗,计算与存储后达到数据展现的阶段。无论是面向哪个群体的数据产品都绕不开对数据的可视化,可以说产品端除了考虑分析链路或操作链路外,最重要的工作就是如何更好的反应它们

可视化在其中至关重要。

数据可视化绝不是单纯的视觉,也不是单纯的图表,它是帮助人类从原始信息中做到对信息有一定程度的认知,任何可视化手段都为了这个过程,而非结果。

数据可视化对于我们而言其实是一个跨界的领域,交互视觉知识远远不够,还还涉及硬件、客户端编程、数据分析、机器学习等领域。

我们看过形形色色的图表,可视化图表是从数据 -> 清洗 -> 交互 -> 视觉 -> 开发的整个过程下创造的。

但饼图还有一个致命的问题就是不能反应时间维度的变化。加入时间维度的分析,等于加入了变化的趋势,不再是定量分析,这时候用堆积面积图(Stacked Area Chart)是最合适的。


回到我说的原则了,即直观又丰富表示了我们尽可能的展示我们所能提供的数据,用一种最直观的形式。


算法领域

再说到算法领域,在分析领域我们已经看到会引入像聚类的可视化手段。而在更底层的算法领域其实早就在利用可视化做工作了。

这里就提到了可视化在算法领域的主要工作之一——模型评估

对于一个场景而言,比如定性分析用户的类别,我们可能会同时跑逻辑回归或决策树多个算法,怎么知道我们的算法欠拟合或过拟合呢,当然可以直接看结果。

更好的方式就是通过可视化的方式直观的对比。此外,以下还会提到深度学习中的应用。

另外,算法过程可视化近年来慢慢流行起来。这个页面就展示了决策树的可视化过程。


对算法过程作可视化对于非专业人员去理解算法来说很有必要。

一方面可以作为算法在学校或工作中的教学辅助,另一方面可以给非专业人员讲解算法的运算过程。

前端与人工智能

最后,讲讲前端在 AI (人工智能) 时代的位置。目前,前端涉及到 AI 的主要是算法数据可视化,这一点在上述也讲到了。

很有意思的是,去年我们在做一款前端监控平台也涉及到了机器学习。我们都知道常规异常报警思路是一旦发生错误就发生通过。

传统异常检测是机器学习算法的一个常见应用,利用多维度的值的分布符合某个参数的正态分布来判断。


但前端错误本身,我们无法判断是否会造成影响,有时只是一个报错而已,需要前端工程师自己去排查,这一点与传统异常检测的思路就不一样。

我们就利用出现的规模,时长,影响人数等因素利用统计学中的3σ原则,当然,进一步我们利用特征工程的方法实时来检测错误的影响程度。

除了在稳定性方面,只要是生产力工具都可以去思考是否让 AI 改变我们的开发现状。这个地方留给所有的工程师思考。

总结设想

不论讲到采集还是可视化,还是做数据产品,我都想讲两点:

第一,数据的完整链路。没有『好』的数据,没有看到其中的意义,没有这条链路中清洗计算部分,都是没有意义的,这也说明

前端工程师专注在一个领域,不等于只看到冰山一角

第二,不同的思考方式。就说可视化与机器学习,从某种意义上来说思路完全相反,可视化需要人类从感知数据到认知数据,而机器学习是通过大量样本学习得到结论。

现在的科技由机器学习的技术还无法做到的事,都还会通过类似于可视化的方式传递给人类。

如果某一天机器也可以做到能理解世界,那么真正的人工智能就来到了。

因此,人工智能今天还是技术,也是思路,我们可以用在任何环节,不论是哪个岗位的工程师都应该掌握。

在过去,前端的工作只与界面相关,而今天前端在一定程度上已经具备了全栈开发的能力,前端工具化平台化已经很常见,可以利用机器学习完善工具

今天立足在 Web 领域我们是有优势的,那么在其它领域呢,我们今天的技能是否做到了编程语言与平台不受限。

由此也看到前端工程师在大数据时代涉及的一些工作非常需要有综合能力。

前端工程师的基础能力从过去纵深到现在更趋向于 T 字型发展。我相信这是未来工程师们的基本形态。

重点来了

那么说了这么多,但是学海无涯, 北妈向大家清楚的解释和分析了前端和大数据行业的关系和发展领域

大数据到底可以干什么,这么海量的数据也造就了无数工作机会,我们怎么第一时间掌握技术栈 把握住?

这些疑问,我也收到很多,那么今天找了一个专门研究大数据的高手,统一给大家回复,他的机构也是专门研究和教授大数据技术和从业指导,我相信对有心人是极有帮助,我上边讲解的这些也都有交。

如果你感兴趣和问题就 识别二维码加他吧,毕竟术业有专攻。


另外加他咨询,可以领取 1024G大数据资料

1024G 会员专属资料共享:内容涵盖大数据基础入门与学习线路”、“Oracle高级技术总监带你学习大数据”、“Hadoop全分布式搭建”、“Hadoop DataBase与Google论文BigTable”、“Hive的执行计划/典型的实时计算架构”、“大数据实战应用案例”等,价值3W全套视频源码免费发放!


还是那句话:
有需要的可以联系,没需要的也可以了解或者无视。

扫码下方二维码添加询问

前端转行大数据?没必要相关推荐

  1. 写给大数据初级开发者或准备转行大数据的人

    中国的IT行业因为有人口福利,所以但凡有个细分领域可以互联网+的,搞个应用服务,能有个日活10w+都可以活的很好了,当然像抖音那种现象级的APP日活过亿的,早已赚的盆满钵满.中国的IT行业的蓬勃发展, ...

  2. 软件开发全套视频教程汇总(javaSE,javaEE,linux,android开发,C# ,web前端,大数据云计算,数据挖掘,web前端,php开发,UI设计,C++开发,3D视频)

    软件开发全套视频教程汇总(javaSE,javaEE,linux,android开发,C# ,web前端,大数据云计算,数据挖掘,web前端,php开发,UI设计,C++开发,3D视频) 这是我以前学 ...

  3. 开源前端 可视化大数据交互前端动态模板

    介绍: 如今老板都很在乎公司实力形象 往往会在大厅投放展示大数据巨屏 你是否也想实现这样大数据效果展示 本次带来一套开源的前端可视化大数据交互动态模板网页前端模板,是HTML网页模板 只要稍微懂点前端 ...

  4. 转行大数据还是人工智能,哪个发展更好

    大数据.人工智能.物联网,新兴的技术概念不断涌现,而每个新兴技术领域的背后,也将带来相关岗位机会的增加.在近几年的趋势当中,大数据和人工智能无疑都是风头正劲.那么转行大数据还是人工智能,哪个发展更好, ...

  5. 数据库开发转行大数据开发工程师怎么样?

    数据库开发转行大数据开发工程师怎么样?大数据的方向的工作有大数据运维工程师.大数据开发工程师.数据分析.数据挖掘.架构师等.有工作经验想转行大数据开发主要考察基础.学习能力.解决问题的能力.想转转行大 ...

  6. 程序员都是吃青春饭,40岁以后怎么办?转行大数据是不错的选择

    程序员的高薪让很多人羡慕,但是你不知道的是,在你安然入睡,陪伴家人的时候,他们还在电脑桌前加班.你以为大部分程序员都像雷军这样吗?你不知道的是,程序员创业大部分都会失败,因为很多程序员只会技术,不会和 ...

  7. 数据库开发工程师转行大数据开发可以吗?

    对有工作经验想转行大数据开发主要考察三个方面,一是基础,二是学习能力,三是解决问题的能力. 基础很好考察,给几道笔试题做完基本上就知道什么水平了.数据库开发工程师转大数据开发怎么样? 首先给大家普及一 ...

  8. Java程序员,到底要不要转行大数据?

    前几天有个朋友在群里提问:如何看待大数据的未来?有必要转大数据方向吗? 关于这个问题,谈谈我的思考.伴随公有云厂商的兴起,大数据的应用进入了2.0时代. 传统大数据那种需要大量购买机器以及Hadoop ...

  9. 转行大数据,编程学Java还是Python?

    Python和Java,是大数据行业最常见的两种编程语言,对于想转行大数据的人来说,学习哪个语言是比较好的选择呢? Python和大数据: Python本身的特点是高效率的开发和简单的维护,大数据运维 ...

最新文章

  1. MySQL用户管理、常用sql语句、数据库备份
  2. java根据日期生成表主键_java 利用时间生成主键
  3. 网络上的FreeBSD在线文档
  4. Sql Server 2008R2版本中有关外键Foreign的使用
  5. POJ-排序-归并排序与逆序对
  6. 无代码iVX编程实现简单跳跃超级玛丽游戏
  7. 【渝粤教育】广东开放大学 演讲与口才 形成性考核 (1)
  8. Hbase JMX 监控 - Region
  9. Mac安装Spring Boot CLI
  10. 《软件需求最佳实践》阅读笔记02
  11. sql日期处理(出自邹建的book)
  12. vue文件上传 vue-simple-upload的使用方法
  13. C语言:百鸡百钱问题
  14. FlashFXP 5.4.0注册码
  15. mysql查询语句中使用星号真的慢的要死?
  16. 数栈人:从青铜到星耀,10年大数据人的奋战晋级之路
  17. numpy学习笔记1—ravel() 和 flatten()
  18. vue/JS实现输入框失焦
  19. 混沌系统matlab程序,dynamos混沌系统的追踪控制matlab代码
  20. 智云通CRM:如何与客户建立信任关系?

热门文章

  1. 2021国潮新消费产业洞察报告
  2. 你会和丑且家境不好,但对你好的男孩结婚吗?
  3. 线下实战-8月24号上海
  4. cydia软件路径_Cydia报错解决大全
  5. ac3168无线网卡驱动下载_更换BCM94360CS2网卡,拯救黑苹果无线网络
  6. conceptd什么时候上市_阳山水蜜桃多少钱一斤?什么时候成熟上市?
  7. 【数字逻辑设计】Logisim构建三种多路选择器
  8. 洛谷 P5708、P5714、P5720、P5725、P5726、P5732、P5738 题解
  9. 使用VSCode+PlantUML+C4-Model快速画架构图
  10. 为html.EditorFor添加样式