大二上学期(回顾与展望)————写在大二下学期开学的前一天

想起去年此时,壮志满满,感觉自己可以一天工作25小时保持高效,做事从不拖拉,然而现在却非常墨迹,寒假开始要完成的事拖到现在,或许明年也不会再写了吧。

去年这个时候,我说我想学算法(刷ACM)和做项目(学MFC)。虽然现在看当时的想法很native,但是也是有一定道理的。

  • 算法:代表了学术方向
  • 项目:代表了工程方向

这两个方向可以说是所有计算机类专业学生的共同方向,学术工程,虽然听说大多数人以后都是走工程道路。这两个方面相辅相成,搞学术需要工程师来实现想法,工程需要学术的产出作为理论基础。

当然不是说学术方向都是算法,也不是说工程方向只是做项目。都有夹杂着的。

1. 回顾:

  • 算法:
    程序设计竞赛中比较有名的就是ACM了,虽然ACM的题目大多都是求精确解,属于第一代算法(基础算法)的应用,对于解决现实问题没有太大的实际意义,但是对脑力的锻炼和对解决问题的培养个人看来帮助还是非常大的。但是对于ACM,目前连省赛的奖都拿不了,连省赛三等奖都没拿过。可见其实这方面我也不是特别强。
    不说ACM,说其他的像机器学习算法(贴近于现实应用的)。但是这些算法学习效果又没有比较权威的检测标准。而且这些算法用到了许多书本没教的高等数学和概率论知识,好吧我去自学。
    这里就要说一下去年参加过的一个校级的数据发现大赛的,我会调用python的机器学习API,用SVM去预测银行数据,我一看数据,标准17列,没有空的出来,抑郁读取,只有2种情况预测,好简单二分问题,数据量化直接跑,然后准确率还90多,感觉自己好厉害。然后看了一下数据,发现数据有严重的样本数量不平衡现象。好我砍掉一些样本再训练,搞完提交,准确率不像我预想的那样。再观察一下,虽然没有空格,但是人家空缺值用Unkown填充,而且有一列unkonw占比例非常大。后续….
    总之这里要说的是,由于机器学习算法已经很成熟了,并且由许多优秀的库来给你使用,因此就是你不深知底层原理,你还是可以做出结果出来,而且所使用的算法一般都不是决定效果的因素。决定效果的因素大多是你输入向量(特征值对实际要预测的数据的表达效果如何)也就是特征工程其实在整个机器学习的过程中是非常重要的。虽然目前出现了深度学习技术,号称只要神经网络够复杂,只要数据量够大,数据的预处理变得不那么重要,因为它在训练过程会逐层分解你的数据。想那个建了几百层神经网络然后训练识别猫的图片,用了一个超算中心。但是这种基于连接主义的算法本来就是黑匣子,目前学术界也没有给出为何可以取得如此好的效果的理论解释。因此目前来说,数据预处理还是很重要的。但是我的状况呢,对机器学习算法的理解停留在只能给门外汉吹水的水平,对数据预处理几乎没有什么擅长的,cv领域就只会一个二值化+压缩一下,就丢给算法训练了,而且是丢像素,什么haar特征,Hog特征都没怎么试过。NLP没接触过。常规数据,想银行数据之类的只会标准化一下,然后就直接丢了。反正就是很水。
  • 工程:
    虽然做了一个所谓大创项目,但是我就是调用一下微软API,再调用一个脑电的API,然后组装起来,然后用opencv掉一下摄像头,做一下效果。而且写出来难以维护,高耦合,低内聚。
    那种几万行代码的项目都没怎么接触过,什么设计模式,框架也只停留在听过的水平。工程能力也是水。

2. 展望:

  • 学术:
    ACM有空可以刷一下,不能太沉迷。
    做研究的话主攻方向可以人工智能方向(但是这个还是太宽泛,但是太清晰我也说不出来,比如说像在机器视觉,或者自然语言处理,还是大数据分析等具体领域应用),目前是计划先搞机器学习算法,然后搞几个数据挖掘比赛,学一下如何处理数据。
    但是这有个问题,学机器学习算法见效非常慢,然后我又是一个非常功利的人(我想搞机器学习是因为听说薪酬高,而且现在是移动互联网下半场,它的浪潮过去下一个时代就是人工智能时代拉。如果搞web开发的薪酬能高于数据工程师,计算机视觉开发之类职位,我肯定会毫不犹豫地转web的。)学算法可以看吴恩达在斯坦福的公开课我觉得,不过一集相当长,1个多2个小时。
    为什么说见效慢了,前段时间学的唯一动力是要写论文,我要努力使我的论文没有逻辑错误因此我要去研究算法的内在理论。而实际应用,我一行API就解决的事好吧。
    还有就是数据处理,这个的效果可以在数据挖掘类比赛体现出来,目前就照着《利用python进行数据分析》在学,感觉整本书就是一本工具书。学得很浮躁,翻得极快。

  • 工程:
    工程能力在学校是学不到的,努力找实习吧。

现在也没有什么见效快的学习方法,总结一下接下来个人学习计划:
1.数据分析方法。结合《利用python进行数据分析》
2.机器学习算法。斯坦福公开课,周志华《机器学习》
3.有空可以刷一刷ACM题,不可沉迷。

这学期计算机网络,操作系统,数据库就要来了。这种程序员的基础也要好好打。

大二上学期(回顾与展望)相关推荐

  1. 大二上学期做的不入眼的导航系统。

    大二上学期,数据结构老师说要让我们做一个课程设计,记得是从民航管理系统.导航系统.和电话管理系统三个系统里选择其中一个,而我就因为看会了floyd,就决定写写导航系统把,事实并没有非常熟练地掌握,一拖 ...

  2. 大一下 暑假 大二上学期规划

    还有几天暑假就要结束鸟~~~~~~~~~国际惯例,做个样子,写个总结. 大一这一年过得很快,出乎我意料的快,快到我觉得好像什么也没有体验过就结束了. 我的大一,平淡,真的很平淡,没有什么波澜.甚至让我 ...

  3. 大二上学期总结计算机专业,计算机学生的大二第二学期自我总结-自我总结

    计算机学生的大二第二学期自我总结-自我总结 一个学期很快就过去了,但这次的心情与以前有很大不同,归心似箭的心情早被考试不理想的惆怅所掩盖.想想若是考的不好如何向父母交代?尤其这次我为了应付英语四级着实 ...

  4. 大二上学期计算机学什么,大二上学期学习计划

    时间飞逝,不知不觉中就度过了大一,从一个新生,变成了学姐.整整一年看似忙忙碌碌,实则收获甚浅.由此我总结出了以下几个原因:学习目的不明确:学习时间安排不合理:学习效率低下等.针对上学年自己所得的经验教 ...

  5. 大二上学期C++总结

    前言 记录2020大二上半学期C++所学知识,早就写好了.一个字"懒" 第一个C++程序 •编译器:g++ –也可以用gcc,但要加上-lstdc++ •扩展名:.cpp/.cc/ ...

  6. 大二上学期的学习感想

    大二学习数据结构课程采用了翻转课堂的模式来学习,虽然这只是刚开始使用,但是由于老师和同学的配合,我觉得还是比较成功的.每周课前的学习方案和重要知识点的学习视频老师都会发布在蓝墨云班课上,让我们进行自主 ...

  7. 大二上学期 学习计划

    我感觉我大一自己也过的浑浑噩噩的,除了刷了绩点什么事情都没有干.而且绩点也不是太高.找到自己感兴趣的方向,去学习吗?谁知道以后会怎么样呢.暑假还剩下二十多天,还是和以前一样,明天就回学校吧.学习c++ ...

  8. 大二上学期 自我总结

    时间如白驹过隙,转眼间大二这一学期就嗖的一下就到尾声了,同样的大三的学长学姐们要么忙着去顶岗实习,要么就是努力备考专转本,而身处中间的我们,也就名正言顺的成为了校园的老油条.三年即逝,我们要珍惜在校的 ...

  9. 【大学复习】终极版计算机网络复习提纲自制(大二上学期)

    ▪概述: 1.p2计算机网络的两大基本功能: 连通性和共享性 2.p29网络协议三个基本要素:语义.语法与同步: 语法:是用户数据与控制信息的结构与格式,以及数据出现的顺序的意义: 语义:用于解释比特 ...

最新文章

  1. fastjson又被发现漏洞,这次危害可导致服务瘫痪!
  2. 小A与欧拉路(牛客-树的直径)
  3. 3P5 Industrial Engineering Lecture 1-2: Method of Study
  4. ubuntu上安装nodejs
  5. C#多线程开发-任务并行库
  6. 时钟同步及其应用(接上一篇)
  7. 调整latex表格_选择LaTeX还是Word的建议
  8. OpenGL6-纹理动画
  9. css 外弧_css 伪类实现弧形
  10. CSS div 塌陷问题
  11. html弹出层全覆盖滚动条,JS弹出层遮罩,隐藏背景页面滚动条细节优化分析
  12. 【语音合成】基于matlab线性预测系数和基音参数语音合成【含Matlab源码 563期】
  13. Java基础-----基类Object源码分析
  14. 插桩valgrind_动态二进制插桩的原理和基本实现过程(一)
  15. linux查询hba卡驱动版本,Linux下查看HBA卡的驱动版本和WWPN
  16. 公司装了cofax传真服务器真的解决了收发传真时存在的诸多不便
  17. Python爬取堆糖网图片的代码
  18. 使用video speed controller给视频加速
  19. Ribbon的基本应用
  20. 代码随想录第六天 LeetCode 242、349、202、1 (哈希表)

热门文章

  1. 多媒体文件格式之ASF
  2. 详细解说脏读、幻读和不可重复读
  3. 转 利用Ajax实现长连接 模拟推送,半长连接
  4. 腾达fh450虚拟服务器,腾达(Tenda)FH450/FH451/F450/F451无线路由器设置 | 192路由网
  5. https referer
  6. IDEA中同项目引用报红问题
  7. Hibernate实体关联关系映射
  8. 全网最全python爬虫系统进阶学习(附原代码)学完可就业
  9. 数据库恢复的三种方式
  10. M-Arch(番外4)GD32L233评测-系统资源主要频率获取和打印