现在的AI专业(比如机器学习)已经沦为调包专业了吗?听听大神怎么说?

高赞回复一

作者:霍华德
链接:https://www.zhihu.com/question/327494084/answer/721135096
来源:知乎

我想你可能做了虚假的AI,虚假的AI有以下特点:

  • 从不自己收集、处理、清洗、标注数据,而是找一个现有的数据集,疯狂 过拟合数据集。

  • 科研idea主要来自于各种模块的花式排列组合,包含但不限于:各种CNN,各种RNN,各种attention,各种transformer,各种dropout,各种batchNorm,各种激活函数,各种loss function

  • 而不是从实际问题和自然语言的现有挑战出发来思考idea

  • 总是指望靠一个算法、一个模型可以解决所有问题

想做好真实AI,必须:

  • 不断反馈,分析,改进。据说谷歌的搜索质量负责人Amit Singhal博士每天要看20个以上的不好搜索结果,然后持续不断的迭代改进。

  • 面对真实环境中获取数据难,数据标注成本高,数据脏难清洗等问题

  • 从实际问题和自然语言的现有挑战出发,设计针对问题最适合合理有效的模型

  • 从不指望一个算法和问题可以解决所有问题,所有遇到的问题会做出合理的分析和拆解,针对各个难点设计最优解决算法,各个击破。

高赞回答二

作者:万盛中路摇滚乐队

来源:知乎

调参是 ML 这一领域不可避免的,但 ML 并不只是调参。学习 ML 这一方向,最重要的,个人认为是搞懂基本数学原理。尤其是在当前各种包极大丰富的情况下。就比如线性回归,你需要搞懂,数学公式当中,哪些部分是学习出来的,哪些部分是固定的,每一部分的“物理意义”是什么,一个公式里面,绝不会有无缘无故多出来的东西,每个东西都有其存在的意义。然后才是尝试去写代码,比如要实现一个线性回归,你会怎么实现(这个可以看现有包的源代码)。进而可以推广到其他的模型方法。你是做 NLP 的,那你应该至少会看 ACL / EMNLP / NAACL / COLING 的文章吧。找到自己感兴趣的文章,反复阅读。看文章的重点在于,

  1. 搞清楚文章要解决什么问题。

  2. 当前这个问题存在的现状是什么样的,为什么会存在,现有的解决方法是什么。

  3. 现有解决方法的不足是什么。

  4. 作者提出的解决方法是基于什么思想,这一步非常重要。

  5. 作者的模型是怎么做的。

从我的学习经历来看,这其中,5可能是最不重要的。而搞清楚 4 直接可以推出各种不同的5。我之前有实验室的哥们,分析了某一篇文章的4,然后在那篇文章的5上加了不到20行代码,效果提升了20%。

如果你对机器学习还是很有热情的,那你可以多专心思考一下机器学习当中一些脱离了编码的本质问题。多看论文,多写代码,写一些脱离了现有包的代码。这有助于你培养很好的问题分析 insight。

如果你对机器学习感到绝望,请像我一样,转方向吧。之所以感到绝望,是因为穷,买不起显卡。

高赞回答三

作者:Xenophon Tony
来源:知乎

计算机科学需要抽象需要站在巨人的肩膀上发展,这都不是无脑灌水的理由,灌水是讨巧的做法,是一种套利搬砖,很快当这个领域的迭代速度越来越快信息变得越来越有效,甚至出现真正成熟易用的automl的时候,这样的套利机会会消失,也就不存在所谓的调参搬砖了。我不是说调参不好,只是指出了一个大趋势,而这个大趋势适用于所有领域。只有当人们从繁复的体力劳动中解放出来,才能静下心来研究机器学习中更有趣的话题。如果你见过机器学习中更壮丽的风景,就一定会认同我说的话。

你的感觉没错,这个领域的平均技术门槛就是很低,而且在走生化环材的老路,听说某大佬因为idea太多没时间写代码,他导师给他专门招了一个RA帮他写代码,像不像伪化生实验室里的lab assistant?总有一天这些灌水的paper干不过搜出来的网络,这波人也就自动消失了。计算机的气就是经历了时间检验的系统,算法和理论。我们应不应该花大量的时间读那些最新的研究?应该,但更多地时候,它们不配。

高赞回复四

作者:纳米酱
来源:知乎

这问题暗含着调侃,无奈,以及心酸。

按道理来说,在计算机领域,调包是非常值得鼓励的行为,一来增加了代码复用率,减少重复造轮子,降低开发成本,使得人们能够快速使用第三方工具产生生产力,本质是技术的进步。

很可惜,重复造轮子的难度,以及成本都特别低的时候,达到人人都觉得自己能够造轮子的时候,该行为会变成恶俗。

当然,有些地方啃技术硬骨头,人家才不会开源呢,你想调包都调不了。

总结

调包是必须掌握的,但基础知识更重要,两者缺一不可。

不管今后AUTOML怎么发展,做个既懂基础,又会调包的人,这才是人才。

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am本站qq群1003271085。加入微信群请扫码进群:

现在的AI专业(如机器学习)已经沦为调包专业了吗?相关推荐

  1. 灵魂拷问:机器学习、深度学习专业已经沦为调包专业了吗?

    有硕士同学问:小弟现在正在高校读硕士,目前跟着导师做自然语言处理的研究,虽说听起来高大上,但是做过的都知道,例如深度学习框架跑起来就是各种调包,运气好凑个模型出来发发论文,技术含量就比较稀少了,感觉现 ...

  2. 现在的计算机专业(比如机器学习)已经沦为调包专业了吗?

    有硕士同学问:小弟现在正在高校读硕士,目前跟着导师做自然语言处理的研究,虽说听起来高大上,但是做过的都知道,例如深度学习框架跑起来就是各种调包,运气好凑个模型出来发发论文,技术含量就比较稀少了,感觉现 ...

  3. 一调计算机专业综合理论试卷,一调计算机专业综合理论试卷(盐城)(新编)

    一调计算机专业综合理论试卷(盐城)(新编) (15页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 14.9 积分 盐城市2013年普通高校单独招生第一次 ...

  4. 【大数据专业】机器学习之模型调优的评估工具 验证曲线 学习曲线

    学习目标: 在学习网格搜索,交叉验证之后,对模型优化的效果进行图形化的评价的两种工具: 验证曲线: 由于训练集的评分已经被用于参数调优,因此该评分用于评估效果已经不再客观,需要使用验证集的评分用于评估 ...

  5. 让AI学习AI:自动化机器学习的概述、发展和研究意义

    导读:我们在之前的文章<>中概述了人工智能,并引出了AutoML--自动化机器学习.本文将介绍AutoML的概述.发展和研究意义等概念性知识. 作者:王健宗 瞿晓阳 来源:大数据(ID:h ...

  6. Power AI:堪称机器学习的“破壁人”

    本文讲的是Power AI:堪称机器学习的"破壁人"[IT168 评论]机器学习时代的到来如云计算一般,迅速.规模庞大而且不可逆转,甚至隐隐透露着一丝猝不及防的意味.好像一夜之间, ...

  7. 500万AI人才缺口!教育部新增高职人工智能专业

      转载于 新智元   编辑:亮亮 [新智元导读]继浙江大学等35所高校本科新增人工智能专业后,教育部近日再次发布公告,高校职业教育(专业)新增人工智能等9个专业.高校AI人才培养加速,将填补我国50 ...

  8. Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)

    Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习.深度学习.大数据.云计算等)推荐系统(包括语音生成.识别等前沿黑科技) 导读 基于Python的GUI界面设计的一套 ...

  9. AI基础:机器学习的损失函数

    0.导语 无论在机器学习还是深度领域中,损失函数都是一个非常重要的知识点.损失函数(Loss Function)是用来估量模型的预测值 f(x) 与真实值 y 的不一致程度.我们的目标就是最小化损失函 ...

最新文章

  1. CMU创建一个开源的AI代码生成模型,C语言表现优于Codex
  2. git 提交跳过检查
  3. Cannot set property 'render' of undefined
  4. aidl demo调用原理
  5. Android中DatePicker日期选择器的使用和获取选择的年月日
  6. 习题3-11 Kickdown UVA - 1588
  7. python存数据到excel_python爬取的数据--保存数据到excel
  8. 中国电网招聘 计算机岗位
  9. 设 l í {a,b,c}* 是满足下述条件的符号串构成的语言,编译原理模拟试题1和2的答案...
  10. 旧文重发:程序员的七种武器
  11. 谷歌Pixel 6系列手机发布会官宣定档 10月19日发布
  12. 填表法解“银行家算法”问题
  13. Ubuntu 20.04 安装 ModSecurity3.0+Nginx
  14. scrapy爬虫项目的建立
  15. 循环冗余校验码CRC原理与LFSR循环码编码器原理
  16. 题目:js实现求100以内的质数
  17. Java前端内联和外联的区别,css外联和内联、嵌入的区别是什么?
  18. 《阿凡达》《泰坦尼克号》
  19. 为知笔记(PC端) 康奈尔模板各栏间距调整
  20. 1.js基础01-计算机基础

热门文章

  1. 自动驾驶中雷达感知:时域关系的充分利用
  2. python小爬虫—抓取pixabay网站的图片资源
  3. 学习笔记-用PLAN法提高执行力
  4. 项目管理如何提升项目中的执行力
  5. 宅男程序员给老婆的计算机课程之5:设计模式
  6. Linux中vgextend的含义,vgextend(8)
  7. 首席商学院新媒体运营黎想:抖音直播入门教学,点这!
  8. 3年Python编程自学经历,分享一些心得经验
  9. STM32-使用IIC接线的OLED显示屏
  10. Pico XR Unity开发时如何设置应用版权保护