哈工大人工智能暑期课实践项目建议

这个博客介绍了暑期课实践作业的建议。
时间:7/10 - 7/22. 一周上课, 一周项目实践。
要求:项目实践的过程请用公开的博客记录。 项目的源代码请放到 github 中。

每4 ~ 5 人一个小组,从下面的候选中选择题目:

1)手写数字识别增强版。 在 MNist示例程序 的基础上进一步扩展,
阶段要求:

  1. 能实现多个数字的手写体识别
  2. 能实现加减乘除符号的识别
  3. 能做一个手写体识别四则运算的APP (可以是网页服务或手机App)

微软讲师提供:识别单个字符的基本版程序。
给学生的建议:我们通过这个练习要学会如何增量改进人工智能模型(把已有模型加强,多个模型的合作)。
另外,我们借用这个练习来学习 OCR 的通用流程,看看有哪些可以重用的地方。
工程上的建议:先设计整个流程,并写完程序框架。把整个程序跑通后,再关心如何提高识别质量。

2) 识别海报照片中的信息并给用户提醒。
场景:你路过一个海报, 上面写了“某年某月某日 有某某活动”, 觉得有点意思,就随手照了一张照片,继续办你的事情去了。 过了一会儿,你的手机自动给你加了一个提醒,提醒内容就是刚才看到的那个海报,但是程序自动识别了海报的日期,标题,地点等关键信息。你的手机上还有其他很多照片,但是 AI 程序并没有把那些照片搞成提醒, 它是怎么做到的呢?

微软工程师提供:一个基本的框架,并在课程中使用这个框架
给学生的建议:
收集训练数据,比如从网上爬取,自己从校园内收集
大量数据需要标记,考虑使用或自制工具辅助标记工作

3) 控制智能家居
在微软讲师提供的实例程序之上,增加新的场景
典型场景:
可以通过语音下达指令。
支持自然语言的多轮对话,如“打开卧室的灯。厨房的也打开。”
通过个性化的语音(如学生自己的语音)进行反馈。
微软讲师提供:语音控制开关灯的示例程序
给学生的建议:
通过微软认知服务语音转文本、语言理解来识别声音输入。
可以尝试通过识别特定的词汇来判断是否是后几轮对话,并复用之前识别出的上下文。
通过微软认知服务文本到语音转换来实现个性化语言输出。

4) 漫画的文字翻译
场景:很多优秀的漫画都是英文或日文的,我们能否用AI 把这些漫画中的文字抠出来,翻译为中文,并把中文再放回原来的地方,这样用户可以马上看到中文的漫画了?
阶段要求:
能替换、翻译基本的文字
能替换、翻译特殊字体的文字(如装饰性文字、音效文字)
能保持原有文字的字体和风格
微软讲师提供的材料:Microsoft Cognitive Service 介绍和示例程序。
给学生的建议:深入了解认知服务中视觉、语言以及必应的服务。着重在如何将几种服务集成到一起,设计出解决问题的流程。避免一开始将太多时间花在界面、数据等问题上。

5) 打造一个 黄金点 竞赛平台并用AI 程序参与比赛
详情见: 黄金点游戏

6)自选项目 (项目必须通过老师的审核,请准备 NABCD 的项目提案文档)

作业要求

  1. 创建一个团队博客,(可以在csdn.net 或 cnblogs.com), 请把博客地址告诉老师(发布到微信群里)
  2. 博客1:列出团队要实现的项目和大致的计划,列出项目的源代码仓库(见下面第3点),博客必须有一个团队成员在工作的照片(可以遮挡脸部)。
  3. 博客2:项目结束后,写一个博客描述项目的进程,软件的功能演示(可以录制视频或截屏),以及你在这个过程中碰到的困难, 对AI 工具的反馈,等。
  4. 在Github 创建一个公开的项目,把项目的代码签入到那里。 希望可以看到每天大部分队员都有代码签入,而不是最后一天 所有代码 “神奇地” 由一个成员签入。没有中间的签入代码的,项目部分得 0 分。 另外,项目可以使用外部的模块/数据/AI模型,请说明模块/数据/模型的来源,并尊重知识产权和遵守使用的要求。如果违背原来作者的使用协议,则项目部分得 0 分。
  5. 检查标准:
    博客1, 博客2,Github 的程序能够被 clone 并能在一个全新的机器编译成功,基本功能运行成功。

[人工智能教程] 人工智能暑期课实践项目建议相关推荐

  1. 哈工大人工智能暑期课实践项目——手写体识别四则运算

    一.项目介绍 手写数字识别增强版. 在 MNist示例程序 的基础上进一步扩展, 阶段要求: 能实现多个数字的手写体识别 能实现加减乘除符号的识别 能做一个手写体识别四则运算的APP (可以是网页服务 ...

  2. 哈工大人工智能暑期课实践项目——手写体识别四则运算(项目计划)

    项目介绍 手写数字识别增强版. 在 MNist示例程序 的基础上进一步扩展, 阶段要求: 能实现多个数字的手写体识别 能实现加减乘除符号的识别 能做一个手写体识别四则运算的APP (可以是网页服务或手 ...

  3. 【源码+教程】Java课设项目_12款最热最新Java游戏项目_Java游戏开发_Java小游戏_飞翔的小鸟_王者荣耀_超级玛丽_推箱子_黄金矿工_贪吃蛇

    马上就要期末了,同学们课设做的如何了呢?本篇为大家带来了12款热门Java小游戏项目的源码和教程,助力大家顺利迎接暑假![源码+教程]Java课设项目_12款最热最新Java游戏项目_Java游戏开发 ...

  4. 人工智能教程第四课 yolo入门和案例

    4.4.yolo系列 学习目标 知道yolo网络架构,理解其输入输出 知道yolo模型的训练样本构建的方法 理解yolo模型的损失函数 知道yoloV2模型的改进方法 知道yoloV3的多尺度检测方法 ...

  5. 三维数字沙盘电子沙盘人工智能地理信息系统开发教程第14课

    三维数字沙盘电子沙盘人工智能地理信息系统开发教程第14课 很久没有写了,主要前段时间在针对怎么显示高精度的 倾斜数据而努力,现在终于实现了效果不错.以前的版本显示倾斜数据控制不太好.最近SDK也改动了 ...

  6. Python金融领域人工智能教程

    Python金融领域人工智能教程 财务分析.时间序列分析.投资组合优化.CAPM.算法交易.Q-Learning 等等! 课程英文名:Financial Engineering and Artific ...

  7. 8月6日云栖精选夜读 | 阿里云CPFS在人工智能/深度学习领域的实践

    2019独角兽企业重金招聘Python工程师标准>>> AI/DL在迅速发展 随着数据量的爆发式增长和计算能力的不断提升,以及在算法上的不断突破,人工智能(AI,Artificial ...

  8. 人工智能导论 王万良教授_FCES2019 panel4:人工智能的第一堂课究竟讲什么?

    全文共1877字,预计学习时长5分钟 说起人工智能教育,最基本的是回归课堂.在北京大学李文新教授的主持下,panel4变成了一场:"讲课真老师之间的体会.经验.教训和收获的分享会" ...

  9. 最新!大象机器人myCobot机械臂应用于Unity人工智能机器人编程实战课

    今年5月,Unity作为全球最大的虚拟现实与人工智能开发平台,联合大象机器人推出基于myCobot机械臂的人工智能机器人编程实战课(国际课程). Unity 是全球领先的实时3D互动内容创作和运营平台 ...

最新文章

  1. git概念篇(remote,base,local)的含义
  2. 数据库性能优化的误区!
  3. vs2005添加live555工程
  4. 【152】C# 操作 Excel 杂记
  5. Xilinx zynq-7000系列FPGA移植Linux操作系统详细教程
  6. python必考面试题目
  7. oppo刷机工具_黔隆科技刷机教程OPPOR9TM忘记密码免刷机保资料解屏幕锁教程
  8. java实现邮件定时发送
  9. jdbc 连接 mysql 时的中文乱码问题
  10. 201204NEWS
  11. 李嘉诚培养23岁孙女接班 每年安保费就要花10亿!
  12. 金山词霸划译功能对IDE的影响
  13. 笔记19-字节缓冲流字符流
  14. IT6801FN图像质量调优
  15. 请求响应数据?Controler层注解!
  16. 如何将域名地址转换成对应的IP地址?
  17. 罗永浩回应被叫行业冥灯:完全不能同意;联想一员工侵占公司工时费近1000万;爱彼迎CEO:办公室时代已过去 | EA周报...
  18. 在win7中要修改计算机的虚拟内存,Win7虚拟内存要设置?
  19. AES加密/解密报错,Input length must be multiple of 16 when decrypting with padded cipher
  20. 基于Python制作的24点游戏生成器

热门文章

  1. Broadcast简单使用
  2. 【30集iCore3_ADP出厂源代码(ARM部分)讲解视频】30-8底层驱动之RTC
  3. 为Visual Studio 2010添加HTML5的项目模板
  4. 3.1_ 1_ 内存的基础知识
  5. Spring中注解大全
  6. ArrayList的容量
  7. python模块分类_Python-模块分类及导入
  8. mysql删除记录后id不连续_Mysql数据库中使用DELETE语句时,一般删除一条记录后ID会不连续,才能让序号继续按顺序排列?...
  9. redis实例python_生产消费者模式与python+redis实例运用(基础篇)
  10. linux查看关键词前后几行内容