如何入门AI?五大新手项目奉上
鱼羊 编译整理
量子位 报道 | 公众号 QbitAI
这年头不学点AI知识,可能都不好意思说自己是新时代的接班人了。
人工智能风头正盛,无论你是支持还是怀疑,AI对这个时代的影响都已逐渐渗透到各行各业当中,哪怕身处非互联网行业,也能感受到AI的滚滚浪潮。
学习已成刚需,不过对于初学者而言,要正正经经上手机器学习,如何入门就有点让人头大了。
好在计算机领域向来有和谐互助之风,德国程序猿Michiel Mulders近日就精心炮制了一份机器学习入门新手指南。一起来看看AI大法该当如何修炼吧。
入门指南
欲练此功,首先要知道,纸上谈兵是本门大忌。
吴恩达就曾经说到,想要入门机器学习,应该进行一些项目实践。
所以入门第一步,从选择一个数据集开始:
找到一个大小合宜,并且相对容易分析的数据集。UCL ML Repository和Kaggle盛产此物。
对数据集进行试验。挑几个顶级的机器学习算法跑一跑这些数据,看看数据的表现,了解一下每种算法的性能。
挑选表现最佳的算法,调教它。
这就完事了?no,no,no,本份指南还贴心奉上五佳项目,任君挑选。
↓↓↓↓↓↓
TOP 5
项目:监督式机器学习
数据集:鸢尾花数据集
鸢尾花数据集堪称机器学习领域的“Hello World”。对数据一无所知?那么选择它就对了。
这个数据集的好处是足够小,仅仅只有150行,并且它只有四个属性:花瓣长度,花瓣宽度,萼片长度和萼片宽度。
通过判别四个已知属性,四种不同类型的鸢尾花在数据集中被标记出来,所以你可以拿它来学学监督式机器学习。
这里建议使用多元分类训练方法。
另外,记得给自己设立一个小目标:根据花瓣和萼片的大小对三种花进行分类。
相关链接:
UCI机器学习仓库(UCI ML Repository):
https://archive.ics.uci.edu/ml/index.php
Kaggle数据集:
https://www.kaggle.com/datasets
项目:交易预测
平台:GNY
很多流行的机器学习服务价格高昂,对于新手十分不友好。不如选择GNY团队的机器学习平台,这个平台挺好挺强大,最重要的是提供免费的下载安装。
GNY团队还发布了一个通过神经网络预测零售交易的demo,正式版本将在今夏登陆,还将提供定制服务。
对于机器学习新人小白来说,这个demo不失为一个有趣的入门项目。你可以到MLWave上找一个数据集,根据消费历史来预测哪些人会成为回头客。
相关链接:
GNY机器学习平台:
https://www.gny.io/
MLWave回头客数据集:
https://mlwave.com/predicting-repeat-buyers-vowpal-wabbit/
项目:情绪分析
数据集:twitter
情绪分析是机器学习里非常有趣的一种应用,检索数据也很容易获得,Reddit、Facebook和Linkedln都提供了易于使用的API。不过首选还是Twitter的数据,Twitter平台上的数据格式一致,预处理也要容易得多。
首先!pip install Python -twitter,然后就开动吧,不过过度使用可是会被列入黑名单的哟。
再列几个具体的方向以供参考:
分析对新发布电影的情绪,并将其与IMDB和其他评级网站上的评论进行比较。
分析围绕特定选举或任何其他政治话题的情绪。
根据推文的情绪预测前50种加密货币未来的价格。
相关链接:
Twitter数据集:
https://github.com/shaypal5/awesome-twitter-data
项目:推荐系统
数据集:Movielens
想必没有人会对推荐系统感到陌生。
推荐系统是机器学习技术在商业中最成功和最广泛的应用之一,几乎渗入到了日常生活的每一个角落。网易云音乐的个性推荐,神奇的抖音算法都属于这一范畴。
关于推荐系统,可以使用两种算法:
基于内容推荐算法:寻找内容的相似性。
协作过滤算法:寻找交互中的相似性。即对一大群人进行分析,确认品位相近的人。
Movielens是最受欢迎的电影评级数据集之一,对初学者来说是试验推荐算法的理想数据集。
于是你可以再立一个小目标了:根据用户评分来预测他们会喜欢哪部电影。
项目:股票价格预测
数据集:Quandl
对于股民来说,如果能预测股票价格,那岂不是亦可赛艇?
但不管你是不是股民,都可以试试用机器学习来实现股票价格预测。
我们先来列列关键字:
波动率指数
历史价格
全球宏观经济指标
基本面分析
指标技术分析
股票市场具有更短的反馈周期,也就是预测的结果可以更快被验证,十分适合新手学习。
选择一个简单的机器学习示例,到Quandl.com上下载股票市场数据集,就可以动手预测未来6个月的股票价格变化了。友情提醒:AI只负责产生结果,不对结果负责。
相关链接:
Quandl数据集:
https://www.quandl.com/
新手向TOP 5项目介绍完毕。看到这里,是不是已经摩拳擦掌,感觉自己可以分分钟入门AI啦?快拎上数据集,AI江湖等你亮剑~
— 完 —
订阅AI内参,获取AI行业资讯
加入社群
量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;
欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
如何入门AI?五大新手项目奉上相关推荐
- 10个简单易学的AI计算机视觉开源项目,新手入门!
人工智能(AI)最具挑战性的主题之一是计算机视觉技术.在过去的几年中,随着计算机视觉的应用不断增加,AI计算机视觉技术持续用于多个新领域,包括机器人技术,安防监测和医疗保健等. 在本文中,我们列出了十 ...
- 不必上抖音,AI Studio社区项目帮你完成简约风格迁移
点击左上方蓝字关注我们 AI Studio经过两年的建设,现已累计了数以万计的优质项目和数据集,首先感谢大家伴随我们成长~ 上次给大家推荐了用户项目精选项目合集,好评如潮~本次给大家带来近期平台热门优 ...
- 各大AI研究院共35场NLP算法岗面经奉上
本文涵盖了腾讯微信事业群模式识别中心,PCG和TEG事业群,阿里达摩院,蚂蚁金服,百度研究院,京东研究院,头条AI Lab,滴滴AI Lab,微软亚洲研究院,微软工程院以及联想研究院等等多个公司NLP ...
- 滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接
乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI 没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜. 这一项目名为DELTA,是一个深度学习模型训练框架 ...
- PADS-VX入门到精通实战项目讲解(上)—LOGIC部分-覃小刚-专题视频课程
PADS-VX入门到精通实战项目讲解(上)-LOGIC部分-9259人已学习 课程介绍 本课程介绍PADS-VX软件应用,软件的主要三部份分别为Logic.Layout. Router ...
- 2021人工智能年度评选结果揭晓!AI落地最佳参考在此奉上
组委会 发自 凹非寺 量子位 报道 | 公众号 QbitAI 刚刚,「2021人工智能年度评选」结果已正式揭晓. 在量子位MEET 2022智能未来大会上,50大领航企业.20大最具价值创业公司.30 ...
- 史上最简单的人脸识别项目登上GitHub趋势榜
来源 | GitHub Trending整理 | Freesia译者 | TommyZihao出品 | AI科技大本营(ID: rgznai100) 导读:近日,一个名为 face_recogniti ...
- 六个经典的HTML5面试问题奉上,太有用啦!
随着移动互联网时代的到来,HTML5流行风盛行,HTML5开发工程师在人才市场中变得非常吃香.而2021年的今天,招聘网站上的HTML5开发工程师职位数量依旧庞大.那么求职者们怎样才能成功的面试上HT ...
- 怎么学python入门?python新手学习路线
怎么学python入门?python新手学习路线,Python入门应该了解一些基本的计算机编程术语.Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言,Python 的设计具 ...
最新文章
- skynet 控制台管理使用技巧
- 《LeetCode力扣练习》第6题 C语言版 (做出来就行,别问我效率。。。。)
- WorkFlow设计篇Step.2—传参的用法-订单金额的处理(续)-WF4.0
- 移动端重构系列1——前期准备工作
- gradle wrapper 版本与 android build tool 版本匹配要求
- 用碧海潮声制作的宋体(雅黑宋体)替换Windows7原生的火柴棍式的宋体
- android多个闹钟实现,Android编程实现PendingIntent控制多个闹钟的方法
- python正则表达式group用法_【Python】正则表达式用法
- matlab学习:人脸识别之LBP (Local Binary Pattern)
- Java求两个数的最大公约数
- 强化学习 —— 资源清单
- Atitit java字符串模板渲染总结 目录 1. 总结:指标	1 1.1. 支持中文变量 提升可读性	1 1.2. 变量placeholder简单性,,velo可以直接¥前导简单。。Free的
- 阿里云oss Referer设置
- 数据包络(DEA)分析法python实现
- 夜曲歌词 拼音_周杰伦夜曲歌词
- nssl 1467.U
- 虚拟机模拟搭建Redis集群环境
- 2023内蒙古大学计算机考研信息汇总
- php检测硬件代码,查看“硬件设置”的源代码
- WM_KILLFOCUS和WM_SETFOCUS
热门文章
- javaweb实训第三天下午——Web基础-Servlet交互JSP原理及运用
- 15数码 java_A*算法求解15数码问题
- jquery button disabled_jQuery练习
- 诺基亚自带36个铃声_vivo手机的6个隐藏功能,快开启,帮你玩转vivo
- 广东计算机学会 信息学省初赛,全国青少年信息学奥林匹克竞赛联赛-广东计算机学会...
- python 除数总是提示为0_Python错误的处理方法
- ip68能达到什么程度防水_电子主控电路板使用什么样的胶水可以达到防水效果?...
- 华为p20nfc怎么复制门禁卡_“碰一碰”即可开大门,华为手机上这个“逆天”功能,你用了吗?...
- css3动画保持状态不变
- linux 将当前时间往后调整2分钟_Python处理时间序列常用方法汇总