从今年四月份到现在已经工作快9个月了,最开始是做推荐系统,然后做机器学习,现在是文本挖掘,每个部分研究的时间都不多,但还是遇到了很多问题,目前就把一定要总结的问题总结一下,以后有时间多看看,提醒自己看有没有解决。

  推荐系统:

  1.冷启动热启动区别和联系?各个阶段需要的算法?

  2.每个算法的数学推导、适用情况、优缺点、改进方法、数据类型?

  3.如何平衡热启动时的准确率和召回率,两者不可能同时高,怎么平衡?从算法本身还是业务层面?惊喜度怎么添加?

  4.如何评价推荐系统的好坏?指标是啥?

  机器学习:

  1.能解决哪几类问题?(分类聚类回归预测?)每一类型会有哪些算法?

  2.每个算法优缺点各是什么?各能解决什么问题?侧重点是什么?对数据的平衡性要求大吗?对初始值敏感吗?需要的数据类型是什么?(数值 or 类别?或者混合使用?)

  3.每个算法是如何推导的?如果要调优要从哪些步骤着手?目前的局限是什么?(背后的数学依据)各个算法之间的联系和区别是啥?各算法之间可以结合吗?瓶颈和局限是什么?

  4.python的scikit-learn包是不是都熟悉了,源码有没有看过?自己尝试把每个算法写一下,看看和scikit-learn包跑起来有没有区别?精确度是否会提高?

  5.每个算法的评价指标是什么?(精确度召回度f1-score还有别的吗?)可视化有哪些方法?(ROC曲线?目前只知道这个,还有其他的吗?)

  文本挖掘

  1.基本步骤是啥?(清洗数据(缺失值、噪音数据、平滑处理)--->中文分词(各种方法)--->特征提取(tfidf还有其他几种方法) --->特征选择(卡方互信息发IG法等等)--->用机器学习算法跑)有没有漏的?或者有没有哪些步骤还有补充的可以提高精度的?

  2.各个步骤之间各有哪种方法?每种方法区别和联系?数学推导是什么?有没有可以改进的地方?有没有新的方法可以自己造的?

  3.数据编码转码不容忽视,不要忘记“不可见字符”(windows--->linux系统时候容易出现的问题)

  这是工作到现在觉得必须要解决的问题,以后有新的发现再补充。关于这些问题的解决,不定期的在博客里发出来,不断修改,不断添加,总之,学习是个不断迭代的过程,fighting!:)

【原】机器学习几个基本的问题相关推荐

  1. 机器学习入门需要多久

    原入门机器学习需要会哪些编程语言? 38 0 对"机器学习"跃跃欲试的你,可能也有这样的问题:入门机器学习,我需要会那种(些)酷炫的编程语言呢?别问了,这个问题的"正解& ...

  2. 机器学习小组知识点45:批量梯度下降法(BGD)和随机梯度下降法(SGD)的代码实现Matlab版1

    原 机器学习小组知识点4&5:批量梯度下降法(BGD)和随机梯度下降法(SGD)的代码实现Matlab版 2016年10月19日 10:17:28 Eric2016_Lv 阅读数:3379 这 ...

  3. Lesson 6. Scikit-Learn使用与进阶

    Lesson 6.1 Scikit-Learn快速入门 # 科学计算模块 import numpy as np import pandas as pd# 绘图模块 import matplotlib ...

  4. 计算机书籍-机器学习导论(原书第2版)

    书名:机器学习导论(原书第2版) Springer人工智能三大重点导论之一,全新修订,浅显易懂,速学入门 作者:[美]米罗斯拉夫.库巴特 出版社:机械工业出版社 出版时间:2018年10月 去当当网了 ...

  5. 自学python推荐书籍同时找哪些来实践-机器学习:Python实践 PDF 原书完整版

    给大家带来的一篇关于人工智能相关的电子书资源,介绍了关于机器学习.Python实践方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小124.7 MB,魏贞原编写,目前豆瓣.亚马逊.当当.京 ...

  6. CCAI 2017 | 德国DFKI科技总监Hans Uszkoreit:如何用机器学习和知识图谱来实现商业智能化? 原2017.07.25AI科技大本营 文/CSDN大琦 7 月22 - 2

    CCAI 2017 | 德国DFKI科技总监Hans Uszkoreit:如何用机器学习和知识图谱来实现商业智能化? 原2017.07.25AI科技大本营 文/CSDN大琦 7 月22 - 23 日, ...

  7. 《机器学习与R语言(原书第2版)》一2.3 探索和理解数据

    本节书摘来自华章出版社<机器学习与R语言(原书第2版)>一书中的第2章,第2.3节,美] 布雷特·兰茨(Brett Lantz) 著,李洪成 许金炜 李舰 译更多章节内容可以访问云栖社区& ...

  8. 机器学习——支持向量机SVM之非线性模型(原问题转化为对偶问题)

    目录 一.复习(原问题.对偶问题.KKT条件.凸函数) 二.将最优化问题标准化为原问题(严格转化为标准形式) 1.原最优化问题 2.标准化后的问题 三.转化为对偶问题(注意变量的对应关系) 四.对对偶 ...

  9. 机器学习——支持向量机SVM之非线性模型(原问题和对偶问题)

    目录 一.原问题(prime problem) 二.原问题的对偶问题(dual problem) 1.定义一个辅助函数 2.定义对偶问题 >>>问题1:上面说到遍历w,那w的取值范围 ...

  10. 机器学习与R语言(原书第2版)》一1.4 实践中的机器学习

    本节书摘来自华章出版社<机器学习与R语言(原书第2版)>一书中的第1章,第1.4节,美] 布雷特·兰茨(Brett Lantz) 著,李洪成 许金炜 李舰 译更多章节内容可以访问云栖社区& ...

最新文章

  1. 【新番前线】2009年公开剧场版动画汇总
  2. .c和.cpp的区别
  3. 005_Buzz播放音频
  4. 支持向量机SVM(四)
  5. cglib动态代理导致注解丢失问题及如何修改注解允许被继承
  6. OpenCV:使用python-cv2实现视频的分解与合成
  7. 如何突破网吧禁止下载的限制~?
  8. asyu中datagrid load 与reload
  9. ssh配置公钥_CentOS配置SSH免密登陆
  10. HTML——多选框和按钮、搜索框滑块简单验证
  11. C4D界面认识及常用操作
  12. 51单片机12864液晶显示模块控制
  13. 自己动手,丰衣足食。普通键盘实现键盘宏(Windows和Mac版)
  14. Oracle账号怎么注销,qq账号如何永久注销?qq账号永久注销的条件以及详细操作方法...
  15. pyká Unlimited for Mac(项目管理软件)
  16. 一个人在家怎么做自媒体?4个靠谱平台,门槛低、变现很简单
  17. [ 物联网篇 ] 11 - NXP i.MX8M Mini 集成Mender OTA解决方案
  18. 阿里国际站金品诚企不可忽视的权益
  19. 吉林大学[离散数学(68集)AVI] 下载地址 百度云盘
  20. 大数据人才能炙手可热 薪酬更高发展更全面

热门文章

  1. android文字多行滚动显示,Android实现在TextView文字过长时省略部分或滚动显示的方法...
  2. php foeeach页面输出,PHP数组foreach遍历输出例子详解
  3. java链式语法_javaScript链式调用原理以及加法实现
  4. OFFICE技术讲座:边框底纹对布局的影响
  5. 六石管理学:夸大成绩,当事人自己是否知道
  6. fatal error: GL/glut.h: 没有那个文件或目录
  7. 泰山OFFICE适配龙芯新架构(loongarch64)UOS初步完成
  8. 全网首发:LINUX制作安装deb版本时,打开方式的适配总结
  9. version GLIBC_2.28 not found
  10. 越南也自研5G设备,有这么容易?