公式不懂也无妨,业务精通才是真正的算法工程师
没有公式推导的机器学习,这是一种新颖的学习方式,它不需要掌握高深的数学知识,只需要懂业务。
在这种方式中,每个人都将成为一名算法工程师,负责解决实际问题,而不是花费大量时间推导公式。这种方式非常适合那些希望进入机器学习领域,但又不想深入研究公式的人。它不仅可以掌握机器学习的基础知识,还可以在实际工作中运用这些知识。
未来打算封装成不同的傻瓜软件给更多的小伙伴,降低门槛。其实在我的眼中人人都是掌握 机器学习/深度学习 的算法工程师。
文章目录
- 机器学习的误区
- 不会公式推导也能做算法模型
- 业务理解本身大于算法模型调参
- 学术圈和应用圈相辅相成
- 如何进行机器学习入门
- 有监督学习
- 无监督学习
- 强化学习
- 业务中灵活的应用
机器学习的误区
很多人都误解数学不好做不了这行,其实是一个极大的误区。
从两种不同的工作环境来解释下这个事,我之前的单位比较有代表性的有学术圈的 清华大学天津高端装备研究院 和 非学术互联网圈的 中国网,对于 机器学习/深度学习 算法方面完全是两种不同的态度。
对于学术圈,更多是关注底层的实现以及创新等等内容,而非学术圈更关注如何快速的应用实现某些场景的功能,通过这样简单的描述为了让有幸看到本文章的人能明白几件事情。
不会公式推导也能做算法模型
能否掌握机器学习中的公式推导是一个经常被问到的问题。实际上即使拥有丰富的数学功底,在计算机进行大规模计算时,可能仍然无法调整参数或优化模型。这是因为在当今科技发达的时代,这是由计算机来完成的。
事实上,尽管这种情况是客观存在的,但是当评估模型的结果指标,比如AUC、ROC、MSE、R2AUC、ROC、MSE、R^2AUC、ROC、MSE、R2 等时,能通过公式和矩阵来发现问题所在吗?如果能的话,那么你就是一个非常了不起的人,但是大多数人都不能。
通常来说,对于同一类型的问题通常使用不同的算法,配合不同的损失函数和正则化标准来评估。但是有时候所有的结果都不理想,这是很常见的。
这时需要“调包侠”和“调参侠”来帮助解决问题。他们并不需要掌握具体的公式推导,但是需要掌握业务逻辑应用,并结合对业务的自身感觉,也就是所谓的经验,来快速解决问题。
业务理解本身大于算法模型调参
机器学习中,业务理解本身比算法模型调参更重要。
算法是死的,而人是活的。
在学术界许多研究都是对已有成果进行微调,然后论述其成功性。这就是为什么很多人说国内的论文缺乏创新性,几乎都是千篇一律。
然而在实际应用中,使用死的算法来解决活的业务并不合适。因此出现了一些熟练工和流水线工人,也就是所谓的"调包侠"和"调参侠"。
但是实际上,更重要的是要基于业务的理解,如果不了解业务、行业规则和行业猫腻,只会调包和调参是不够的。因此不必担心学术界会抢走应用界的饭碗,而且应用界也不必担心会被学术界取代。因为非科班出身的人几乎不可能跨越这个鸿沟。
学术圈和应用圈相辅相成
学术界和应用界是相辅相成的。虽然学术界和应用界之间有着相互的怀疑和不理解,甚至害怕对方抢走自己的饭碗,但实际上他们可以发挥各自的优势,共同发展。
对于应用界来说,不断扩大知识面,了解更多算法模型的应用,在不同的场景中熟练使用,这是足够的。也就是说能够通过文字描述,将学术界关于机器学习和深度学习的成果完美地应用到实际业务场景中,才是最重要的。学术界提供了各种算法模型和理论研究,而应用界则将这些成果转化为实际应用,两者相辅相成,共同推进机器学习和人工智能的发展。
如何进行机器学习入门
对于普通人应用 机器学习/深度学习 来说需要掌握 调包 & 调参 的基本常识内容,结合自身业务才能熟练的掌握和使用,本身不需要了解数据矩阵怎么计算的,公式是怎么来的的问题。
既然是机器学习就要先了解三种机器学习领域。
有监督学习
是基于现有的数据和标签进行训练构建模型,通过模型对未知的数据进行判断的过程。
骗了我们那么多年的所谓专家打标签
很多人都说 有监督学习 是利用带有专家标注的标签的训练数据,学习一个从输入自变量X到输出因变量Y的函数映射过程。这些年我们都被 专家 这俩字骗了,所谓的专家并不是咱们想象中的那种高高在上的人(他们是没有那个时间打标签的),而是那些在一线勤勤恳恳做一线业务的小伙伴,做这行业久了的都知道做训练的标签数据从业者都是那些最底层的、文化程度可能还比较低的人,所以千万不要被 专家吓唬到了。
能解决的问题领域
分类问题:通过可见的信息来进行判断预测结果 二分类问题:是/不是、有/没有,多分类问题:具体属于哪一个组/类别。
比如输入一张图片,图片的信息用计算机的语言量化之后,判断预测这张图片里面是否有动物,得到的结果 有/没有,这种就属于二分类问题。如果判断预测这张图片里的动物是猫咪、狗狗、乌龟或者其他什么的,这种就属于多分类问题。最终的结果属于类别,在统计学中也称为离散型数据。
回归问题:通过可见的信息来进行判断预测结果 结果为具体的数值。
比如通过了解某地区连续几年平均工资的基本信息,预测未来几年平均工资的一个走势,即未来3年的一个工资涨幅情况,最终的结果属于具体的数值,在统计学中也称为连续性数据。
无监督学习
是基于现有的数据进行训练构建模型,在没有明确标签的情况下,通过数据本身的自有属性进行模型构建的过程。
能解决的问题领域
关联分析:俗称关联规则,早期应用于超市,经典的案例就是《啤酒与尿布》的故事,发现不同事物之间同时出现的概率。在购物篮分析中被广泛地应用,超市就会把啤酒和尿布放在相邻的货架上。
聚类问题:将相似的样本划分为一个簇(cluster)。与分类问题不同,聚类问题预先并不知道类别或者标签,而且训练的数据也没有对应的标签。
维度约减:利用特征提取和特征选择的方法,达到维度约减的效果。经常应用于复杂事务特征简单话处理的方法。
强化学习
通过学习获得最大回报的行为,强化学习可以让agent(个体)根据自己当前的状态,来决定下一步采取的动作。强化学习算法通过反复计算和试验来学习最优的动作。
能解决的问题领域
比如金融界的量化投资交易,与其说是经验判断,实际上很多都是通过模型计算预测达到一个最大收益后进行下一步行为,或者是在损失最小的时候进行止损行为。
业务中灵活的应用
之前也提到了 有监督学习、无监督学习、强化学习 分别能解决的一些问题,这些问题基本上能覆盖我们日常生活中95%的事情,以结果为目标导向,灵活的应用不同的机器学习第三方库,勇敢的做一名 调包侠 & 调参侠 ,只要能解决你实际生活中的问题,那就是好的。
什么公式推导之类的不是你要关心的问题,数学重要吗?非常重要的,大学的数学基础即可,如果你都忘了,大致的印象还是有的吧,我觉得与其从头过一遍数学,不如边学边查,一个合适的做法就是哪里不会点哪里,我每天也在查很多知识点,不是那种太学术的,而且基于业务理解的白话的内容。
很多人要问了应该怎么学?
机器学习本质包含了数学原理推导与实际应用技巧,机器学习中有很多经典算法,既然要学习,那就需要清楚一个算法应用的场景、参与影响结果的因素以及结果如何根据实际业务进行评估。
掌握好 机器学习/深度学习 的套路你会发现你未来发现问题以及解决问题的能力会高人一等。
公式不懂也无妨,业务精通才是真正的算法工程师相关推荐
- 通达信大智慧同花顺益盟操盘手股票指标公式编写从入门到精通-七天学会指标编写
通达信大智慧同花顺益盟操盘手股票指标公式编写从入门到精通-七天学会指标编写
- 算法工程师怎样提升业务理解能力?
文 | 桔了个仔@知乎 本文已获作者授权,禁止二次转载 我刚转做金融风控时,觉得自己写代码多年了,对金融风控的业务不上心,公司让我做什么我就用自认为及其优雅的编码方式解决,但对为什么要做这个事,做了对 ...
- 算法工程师如何应对业务方和老板的灵魂拷问?
文章作者:姚凯飞 编辑整理:Hoh 内容来源:作者授权 出品平台:DataFunTalk 导读:你是否有过来自用户.业务和老板们的 badcase "灵魂拷问": 我运营的首页频道 ...
- 《理想之城》“打光太暗”是有意为之?算法工程师揭秘什么才是“好画面”...
电影.电视剧本质上都是声画艺术,影视艺术的特性决定了,主创要努力通过声画手段将观众带入故事的规定性情境中,进而让观众沉浸其中.走入人物内心,产生共鸣共情."爱奇艺自制剧<理想之城> ...
- 一个业务型算法工程师的技能清单
我们知道算法工程师分为两类:研究型算法工程师和应用型算法工程师.虽然都叫算法工程师,别看只有2字之差,但其实他们的 有着很大的区别. 研究型算法工程师:研究型算法工程师主要分布再各类大厂的研究院,基本 ...
- 一个公式告诉你为什么程序员要转算法工程师
原来的标题是:算法工程师工资调查 20170611 今天(2017年6月11日)爬了某招聘网站的十大城市的算法工程师职位. 算法工程师 这里的算法工程师包括比较广泛.有做数据科学的,有做图形的,有做信 ...
- 乖离率背离公式_乖离率多少才合理 BIAS指标计算公式-BIAS-技术指标-股票入门基础知识学习网...
对于炒股的人来说肯定是要了解不同指标的含义和计算公式等等的基本解析了,乖离率(BIAS),又称偏离率,简称Y值,是通过计算市场指数或收盘价与某条移动平均线之间的差距百分比,以反映一定时期内价格与其MA ...
- 通用版AlphaGo登《Nature》!最强AI棋手,不懂规则也能精通游戏
文章转载自 智东西,作者 子佩 DeepMind推升级版MuZero,玩围棋.国际象棋.日本将棋.Atari游戏都很擅长. 继AlphaGo扬名海外后,DeepMind再推新模型MuZero,该模型可 ...
- poi 操作 excel 里面设置的公式不会自动计算 需要双击才会触发
//excel设置公式自动计算 sheet.setForceFormulaRecalculation(true);
最新文章
- LOJ P1155 双栈排序 二分图染色 图论
- nginx log response_python+pandas分析nginx日志的实例
- element Table表格实现前x行恒展示,不会被折叠,设置点击表头按钮排序。
- 东莞理工c语言作业,东莞理工学院C语言网上作业..doc
- java 视频监控 分屏ui_视频监控网页ActiveX视频分屏播放控件开发
- atm取款机的简单程序代码_LeNet:一个简单的卷积神经网络PyTorch实现
- ppt 2 html工具,PPTools PPT2HTML
- windows和linux如何通信,别总是把Windows和Linux混为一谈
- 【Codeforces	1421	D】Hexagons,贪心,模拟
- VS实现格式化代码及代码缩进
- java开发pc端和移动端的区别,移动端和PC端的区别
- 拯救者Y7000在ubuntu下的1660Ti驱动安装
- ValueError: operands could not be broadcast together with shapes (204,111104
- oracle数据库查看scanip,rac下查看scanip 在哪個節點上
- 趋高机器视觉之机械手臂的应用
- thinkphp6如何部署在虚拟主机上?
- 三无电子烟与即将到来的监管时代
- 胡喜:我是如何从菜鸟做到架构师的
- 人脸识别准确概率计算——超详细
- 猿学~被误解的MVC和被神化的MVVM