有硕士同学问:小弟现在正在高校读硕士,目前跟着导师做自然语言处理的研究,虽说听起来高大上,但是做过的都知道,例如深度学习框架跑起来就是各种调包,运气好凑个模型出来发发论文,技术含量就比较稀少了,感觉现在的工作随便找个由点编程经验的培训一下就能上手了。

所谓外练筋骨皮,内练一口气,想请教一下各位大佬:你认为计算机专业真正的价值在哪呢?把编程部分剔除之后,计算机真正该研究的是什么呢?它的气又在哪儿?

本文来源:知乎

回答一

作者:演奏代码的程序媛
链接:https://www.zhihu.com/question/327494084/answer/1641774776

目前来看,起码在计算机视觉自然语言处理领域确实是这样。

深度学习当前最主要的两个应用也就是计算机视觉和自然语言处理。

其一,这两个领域在专家们搞不清楚内部原理的情况下,就用不断堆叠的网络层数已经颠覆了传统算法。

对于论文作者来说,你又说不出个具体原理,大家凭什么相信你的这个结构能达到自己论文说的精度?只能发论文的时候开源代码,留给大众检验。看当前深度学习论文有没有用,先得看他敢不敢开源。

所以,现在大多数好用的深度学习算法都开源,包括目标检测的rcnn系列,yolo系列,ssd等。

其二,也正因为说不出什么道理,真正深入研究各种深度学习算法和网络结构的大牛,要不通过实验室里强大的计算资源来试凑各种有效的框架(非常烧钱)——比如谷歌提出的inception系列网络结构就是试出来的;

要不就是凭借对深度学习的深刻理解和强大的创新能力,提出了新颖的深度学习算法——比如提出反向传播和玻尔兹曼机的Hinton,以及提出卷积神经网络和将深度学习引入图像识别的Yann LeCun(这里说的提出不是拍脑袋一想就瞎说的,人家是靠数学硬生生推导出来的),这种天才百年难遇。

而工业界又需要借助人工智能的东风提高自己公司的竞争力。但是大多数公司却没有能力自己设计好用的网络结构和算法,只能照着大牛的论文来包装。不会改只会用,这样就造成了算法少、需求多的局面。现在大牛提出的很多著名的深度学习算法,基本都被实现遍了。

其三,当前深度学习程序普遍用Python语言编写,Python以包多、调包方便而闻名,在机器学习方面有著名的scikit-learn包,在数据处理方面有Pandas、图像处理有skimage、pillow等,更别说主流的深度学习框架Tensorflow、Pytorch、keras等都主要运行在python下,copy别人的代码复用简单,只要你能找得到。

所以。在以上三个原因结合之下,目前起码在这两个领域,整个工业界都是在调包、调参

做一个小的比喻:目前深度学习好比做中餐,师傅(论文作者)告诉你做包子要加入适当的盐、大料、味精。虽然你不明白这个适当到底是多少,但是他顺带给你把馅儿和皮儿都准备齐全了,你需要做的就是按照自己的喜好把包子形状捏一下。

再说说人才供求方面,目前做自然语言处理和图像处理的,对应于企业的岗位是「算法工程师」。通过前边所述,目前这个听起来高大上的「算法工程师」,其实技术含量并不比开发高多少(甚至只会更低),学学吴恩达的课,就自称算法工程师的不在少数。

但是目前大多数公司给的岗位工资比开发还高不少。

长久来看,只会调包肯定是没有竞争力的,当大量「调包侠」涌入这个行业,挤掉行业泡沫的时候,算法工程师这个职位总会洗去铅华,做一些更有难度和挑战性的工作。

对于有志于未来进入这个行业的学生来说,我的建议有两条路:

  1. 对于以后想做语音识别和计算机视觉的同学来说:

为了完成工作可以调包,但是趁着现在有大量的时间,最好可以自己亲手实现一下主流的算法(虽然这个过程比较难),一来提高自己的动手编能力,二来深入理解算法设计思想,实在不行以后做开发也用的到编程能力。

  1. 对于以后没有明确目标,只想从事人工智能的同学来说:

建议了解一下强化学习相关内容。强化学习算法才有可能制造出真正的人工智能,alpha go下围棋那么厉害,起决定性作用的决策算法也是采用了强化学习的思想,更重要的是,强化学习算法对于数学要求更高,进入门槛也更高。

回答二

作者:霍华德
链接:https://www.zhihu.com/question/327494084/answer/721135096
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

我想你可能做了虚假的AI,虚假的AI有以下特点:

  • 从不自己收集、处理、清洗、标注数据,而是找一个现有的数据集,疯狂 过拟合数据集。

  • 科研idea主要来自于各种模块的花式排列组合,包含但不限于:各种CNN,各种RNN,各种attention,各种transformer,各种dropout,各种batchNorm,各种激活函数,各种loss function

  • 而不是从实际问题和自然语言的现有挑战出发来思考idea

  • 总是指望靠一个算法、一个模型可以解决所有问题

想做好真实AI,必须:

  • 不断反馈,分析,改进。据说谷歌的搜索质量负责人Amit Singhal博士每天要看20个以上的不好搜索结果,然后持续不断的迭代改进。

  • 面对真实环境中获取数据难,数据标注成本高,数据脏难清洗等问题

  • 从实际问题和自然语言的现有挑战出发,设计针对问题最适合合理有效的模型

  • 从不指望一个算法和问题可以解决所有问题,所有遇到的问题会做出合理的分析和拆解,针对各个难点设计最优解决算法,各个击破。

回答三

作者:zibuyu9
链接:https://www.zhihu.com/question/327494084/answer/723626230

我当年读博的时候,机器学习和自然语言处理的好用开源软件很少,新发表论文也没有开源代码的习惯,复现别人工作总是最费时、费神、折磨人的环节。从那个时期过来的,我觉得现在开源之风大盛,能让大家方便地站在巨人肩膀上登高望远,是多么幸福的事情。

所以,在工具成熟之后,就给人更多选择的可能性,有的人满足于熟练使用现有工具,有的人致力于更好地做创新研究,各取所需而已。这就像微软等软件企业,致力于研制改进各类软件工具,而更多的人使用这些工具,整个生态就是这样慢慢成熟起来。相信未来机器学习领域也会慢慢诞生微软这样的企业,有人研制,有人使用。

回答四

作者:万盛中路摇滚乐队
链接:https://www.zhihu.com/question/327494084/answer/702810200

调参是 ML 这一领域不可避免的,但 ML 并不只是调参。

学习 ML 这一方向,最重要的,个人认为是搞懂基本数学原理。尤其是在当前各种包极大丰富的情况下。

就比如线性回归,你需要搞懂,数学公式当中,哪些部分是学习出来的,哪些部分是固定的,每一部分的“物理意义”是什么,一个公式里面,绝不会有无缘无故多出来的东西,每个东西都有其存在的意义。

然后才是尝试去写代码,比如要实现一个线性回归,你会怎么实现(这个可以看现有包的源代码)。进而可以推广到其他的模型方法。

你是做 NLP 的,那你应该至少会看 ACL / EMNLP / NAACL / COLING 的文章吧。找到自己感兴趣的文章,反复阅读。

看文章的重点在于,

  1. 搞清楚文章要解决什么问题。

  2. 当前这个问题存在的现状是什么样的,为什么会存在,现有的解决方法是什么。

  3. 现有解决方法的不足是什么。

  4. 作者提出的解决方法是基于什么思想,这一步非常重要。

  5. 作者的模型是怎么做的。

从我的学习经历来看,这其中,5可能是最不重要的。而搞清楚 4 直接可以推出各种不同的5。我之前有实验室的哥们,分析了某一篇文章的4,然后在那篇文章的5上加了不到20行代码,效果提升了20%。

如果你对机器学习还是很有热情的,那你可以多专心思考一下机器学习当中一些脱离了编码的本质问题。多看论文,多写代码,写一些脱离了现有包的代码。这有助于你培养很好的问题分析 insight。

如果你对机器学习感到绝望,请像我一样,转方向吧。之所以感到绝望,是因为穷,买不起显卡

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
获取本站知识星球优惠券,复制链接直接打开:
https://t.zsxq.com/qFiUFMV
本站qq群704220115。加入微信群请扫码:

现在的计算机专业(比如机器学习)已经沦为调包专业了吗?相关推荐

  1. 现在的AI专业(如机器学习)已经沦为调包专业了吗?

    现在的AI专业(比如机器学习)已经沦为调包专业了吗?听听大神怎么说? 高赞回复一 作者:霍华德 链接:https://www.zhihu.com/question/327494084/answer/7 ...

  2. 灵魂拷问:机器学习、深度学习专业已经沦为调包专业了吗?

    有硕士同学问:小弟现在正在高校读硕士,目前跟着导师做自然语言处理的研究,虽说听起来高大上,但是做过的都知道,例如深度学习框架跑起来就是各种调包,运气好凑个模型出来发发论文,技术含量就比较稀少了,感觉现 ...

  3. 【大数据专业】机器学习之模型调优的评估工具 验证曲线 学习曲线

    学习目标: 在学习网格搜索,交叉验证之后,对模型优化的效果进行图形化的评价的两种工具: 验证曲线: 由于训练集的评分已经被用于参数调优,因此该评分用于评估效果已经不再客观,需要使用验证集的评分用于评估 ...

  4. 清华大学交叉信息研究院招收计算机图形学、机器学习方向博士

    来源:机器之心 课题组简介杜韬博士于 2022 年秋季加入清华大学交叉信息研究院担任助理教授,领导课题组开展计算机图形学和机器学习相关方向的研究.课题组常年招收博士生.科研助理.实习生.访问学生.助理 ...

  5. 同济计算机转专业吗,被不喜欢的专业录取了?大学想转专业需谨慎

    如果被不喜欢的专业录取了,想要转专业,怎么办呢? 一.可以转专业的3种情况 目前,很多高校确实都为考生提供了转专业的机会,但限制较多.根据高校的不同情况,考生进入大学后大致有以下三种情况重新选择专业. ...

  6. 永州科技学院有计算机专业吗,永州科技学院有哪些专业

    2014年湖南科技学院广播电视编导专业-湖南科技学院 主要课程: 学院简介 理学院是学校为深化院系管理体制改革与加强学科.专业建设于2015年初在原数学与计算科学系和电子工程系基础上组建而成的.设有数 ...

  7. 网络工程师计算机类吗,机房网络工程师 | 网络工程专业的你知道吗?

    原标题:机房网络工程师 | 网络工程专业的你知道吗? 网络工程专业介绍 专业背景:网络工程专业的出现的另一背景是从上一世纪九十年代,计算机网络技术及其应用得到迅猛发展的背景下提出的,从专 业定名.培养 ...

  8. 计算机技能测试小学老师,小学信息技术教师专业技能测习题-20210726171728.docx-原创力文档...

    小学信息技术教师专业技能测习题 小学信息技术教师专业技能测习题 PAGE 小学信息技术教师专业技能测习题 2017-2018学年第二学期教师专业测试 姓名: 得分: 一.选题:1.对于信息,以下说法错 ...

  9. 河南单招哪所学校主学计算机,河南单招学校王牌专业 2021年河南单招王牌专业...

    河南单招学校王牌专业,专业的选择直接影响到我们的未来,所以大家在条报志愿时都会比较纠结.2021年河南高职单招即将开始,今天小编就为大家整理了一些河南单招学校王牌专业. 河南单招学校王牌专业 1.新能 ...

最新文章

  1. IS-IS 的 DIS (伪节点) 及 DIS 和 OSPF中DR 的区别
  2. django之ORM查询操作(二)
  3. VS 2005 不能调试无法找到调试信息 未使用调试信息生成二进制文件
  4. boost::mp11::mp_pop_front相关用法的测试程序
  5. Redis的过期键删除策略和内存淘汰机制
  6. Android-HelloWorld
  7. 威纶通触摸屏与仪表通讯_威纶通触摸屏与英威腾变频器通信详细说明
  8. MES助力日立电梯提升精细化管理水平
  9. mp3格式转换软件哪个好?
  10. DRILLNET 2.0------第十三章 尾管固井扭矩/摩阻模型
  11. 过去式加ed的发音_关于动词过去式+ED的发音 动词过去式发音规则
  12. MSF evasion模块的使用
  13. 幕布图像大小与投影仪亮度关系对应表,--怎样选投影机和银幕不用愁了
  14. 字节跳动否认完成支付牌照收购,但金融野心一直有
  15. 【 爬虫解决了什么问题】
  16. Python基础刻意练习:魔方方法
  17. 【urllib的使用(上)】
  18. 人脸识别打卡项目(2)
  19. 安装方正电子教室 缺少dll
  20. linux看zip的目录结构,无需解压如何查看一个归档或压缩文件的内容

热门文章

  1. Phpcms之核心目录phpcms
  2. 阶段1 语言基础+高级_1-2 -面向对象和封装_9两个引用指向同一个对象空间
  3. AssetBundle
  4. BZOJ3916 [Baltic2014]friends
  5. android 数据存储----android短信发送器之文件的读写(手机+SD卡)
  6. HTTPS是如何加密的
  7. Jmeter实现压力测试(多并发测试)
  8. Golang 函数function
  9. 【坑】记录型信号量/AND信号量/管程解决生产者-消费者问题
  10. HITAG 2 125kHz RFID IC Read-Write 256 bits