姓名:刘小瑜 班级:电气卓越1701 学号:201701019
一.课程总结
在上本课程之前,我对于人工智能和大数据的了解基本上只是局限于媒体报道,知道它在日常生活中有着很广泛的应用,但是对于其原理和实现过程并没有去深究。经过老师深入浅出的讲解以及自己通过互联网的学习之后,对于人工智能以及大数据了解的更为深入。
人工智能方面,我印象最深的就是深度学习。我课后在网上自己也看了吴恩达的深度学习课程,自己也通过互联网学习了一些相关的理论。发现深度学习是通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。【5】其数学原理本质上其实可以认为是把数字运算向量化,变为了矩阵运算。它的应用十分广泛,其中最主要的有图像处理,语音识别和自然语言处理等领域。
关于大数据技术,IBM公司提出大数据的5V特点:大量、高速、多样、低价值密度、真实性。综合课堂内容和所查资料,我认为大数据技术就是通过高效的数据存储结构和先进的并行数据处理技术来实现对大量、多样、高速生成的数据的管理和利用。其中Google提出的大数据技术“三宝”—— Google File System,Google Bigtable和Mapreduce为大数据的管理和利用注入了新的动力,提供了新思路。
总的来讲,《大数据与人工智能》这门课程让我学到了很多关于大数据和人工智能背后的原理、思想,自己感觉收获颇丰,感谢向老师的辛勤付出!

二.Google大数据三大论文读后感
读完Google大数据三大论文之后,对于大数据的原理了解更加深入的同时也不禁感慨大数据系统设计的复杂性。其中大数据系统处理数据的并行性和分布式储存给我留下了较深的印象。
第一篇论文讲的是一个文件系统Google File System。Google GFS文件系统是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。与传统文件系统相比,GFS文件系统提出了一种完全不同的设计思路。主要有四条:第一,组件失效被认为是常态事件,而不是意外事件;第二,以通常的标准衡量,google的文件非常巨大,因此很多设计的假设条件和参数都需要重新进行调整;第三,绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据的方式;第四,应用程序和文件系统API的协同设计提高了整个系统的灵活性。从具体的设计过程上来讲,主要的流程包括设计概述,系统交互,Master节点的操作,容错与诊断,度量,经验总结等。【1】
第二篇论文讲的是一个数据存储系统Google Bigtable。Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。它被广泛应用于谷歌的产品当中,如Google Earth、Google Finance等。Bigtable的特性有适用性广泛、可扩展、高性能和高可用性。与普通数据库不同的是,它不支持完整的关系数据模型,且将储存的数据全部视为字符串,客户可以通过模式参数的选择来决定数据的存放位置。关于Bigtable的原理部分,论文主要介绍了数据模型、客户端API、Bigtable底层使用的Google基础框架、Bigtable实现的关键部分、提高性能的调优方法、Bigtable的性能数据等。【2】
第三篇论文讲的是一个编程模型Mapreduce。它是用来配合GFS和Bigtable使用的一个处理和生成超大数据集的算法模型。作者计划设计一个新的抽象模型,使用这个抽象模型可以抽象出并行计算、容错、数据分布、负载均衡等复杂问题,而使用者只需要关心想要执行的简单运算,这就让不熟悉并行编程的程序员也能充分发挥分布式系统的威力。论文主要介绍了模型的实现、技巧、性能和经验总结等。【3,4】

参考文献:
[1] Ghemawat S, Gobioff H, Leung S T. The Google file system[C]// 2003.
[2] CHANG, Fay, DEAN, et al. Bigtable : A Distributed Storage System for Structured Data[J]. Acm Transactions on Computer Systems, 2008, 26(2):1-26.
[3] Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters[C]// Proceedings of Sixth Symposium on Operating System Design and Implementation (OSD2004). 2004.
[4] “读Google Mapreduce有感” .CSDN. Retrieved 18 April 2019.
[5] “深度学习”.baike. Retrieved 18 April 2019.

刘小瑜 大数据与人工智能论文相关推荐

  1. 大数据与人工智能论文

    经过一学期的学习,我对大数据与人工智能有了基本的认识.身处大数据时代,云计算.人工智能等核心技术正在以"一往无前"的气势推动着企业创新和新一轮技术的变革.数据记录着庞大的行为轨迹以 ...

  2. 大数据与人工智能论文作业

    经过一学期的学习,我对大数据与人工智能有了基本的认识.身处大数据时代,云计算.人工智能等核心技术正在以"一往无前"的气势推动着企业创新和新一轮技术的变革.数据记录着庞大的行为轨迹以 ...

  3. 小总结大数据和人工智能

    大数据.云计算和人工智能是当下比较热的IT方向,BAT都有了云,都有了AI部门,各有优势,也不可避免的产品功能同质化. 移动互联网产生的大量数据,促使大数据的发展,大数据的发展又和云计算相互促进,这两 ...

  4. 这份书单,给那些想学Hadoop大数据、人工智能的人

    一.简单科普类 (文末附下载链接) 1.<人工智能:李开复谈AI如何重塑个人.商业与社会的未来图谱2> 作者:李开复,王咏刚 推荐理由:文章写得一般,但李开复和王永刚老师总结的还可以,算国 ...

  5. 爱思唯尔云论坛:疫情挑战下的大数据与人工智能研究

    2020注定是不寻常的一年,新冠肺炎疫情在全球多点暴发并迅速蔓延,给社会带来巨大影响的同时,也为大数据与人工智能研究者带来新的挑战.值此疫情之际,由爱思唯尔旗下大数据期刊Big Data Resear ...

  6. 详解云计算、大数据和人工智能的区别与联系

    今天跟大家讲讲云计算.大数据和人工智能.为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据.谈人工智能的时候会提大数据.谈人工智能的时候会提云计 ...

  7. IEEE 第二届大数据、人工智能与物联网工程国际会议 (IEEE-ICBAIE 2021)

    2021年3月26-28日    中国·南昌 会议重要日期 截稿时间:2021年02月28日 录用通知时间:投稿后4-5个工作日 注册截止时间:2021年02月28日 会议官网:IEEE-ICBAIE ...

  8. 大数据、人工智能如何融合?来自微软、阿里、滴滴、科大讯飞等的 120 多位专家要用 3 天为你解答!

    大到传统行业的巨头领导者,小到初创公司,从医疗健康.金融.零售.广告.到交通.教育.农业等,「大数据」与「智能化」已经渗透到当今每一个行业和业务职能领域,二者缺一不可.譬如,没有传感器收集数据,再利用 ...

  9. 这是您正在找的大数据、人工智能实战培训课程!

    实战!实战!实战!课堂没有冗长乏味的理论讲授,通过密集的高强度实战课程,带领学员克服大数据.人工智能能力提升中各阶段的典型痛点和难点,帮助学员迅速从"初出茅庐"的新兵成长为&quo ...

最新文章

  1. html页面判断其他div为空,将外部html加载到div中 - 页面加载然后变为空白
  2. WGS 1984 Web Mercator 对于在线地图服务的意义
  3. 4-Qt6控制台项目信号与槽
  4. SSAS-MDX#001 - MDX 基本结构
  5. 未来计算机是否有意识或者人为的赋予意识,人工智能会有自我意识吗?
  6. LeetCode 2210. 统计数组中峰和谷的数量
  7. 继续畅通工程(HDU-1879 )
  8. Android系统性能优化(73)---总结
  9. 看看什么是藏匿而不申请[重复]
  10. MySQL使用EXPLAIN查看SQL的执行计划
  11. c4d导出html,C4D动力学如何导出fbx或者其他格式?
  12. 【征文】极客头条使用体验及改进建议
  13. yuv420转rgba
  14. LeetCode337打家劫社Ⅲ(树形动态规划)
  15. jar启动指定JDK/JRE 安装路径教程
  16. Shell脚本实现MySQL主从自动化配置
  17. 3.2 Ad Hoc 网络路由协议
  18. HttpClient通过RetryHandler实现超时重试
  19. linux 总结 原创-胡志广
  20. 公路养护管理:高速公路养护施工安全管理探析

热门文章

  1. 2021-07-14 PMP 横道图、网络图、看板、燃尽图了解
  2. 图片处理算法工程师面试及笔试
  3. 睿智的目标检测32——TF2搭建YoloV4目标检测平台(tensorflow2)
  4. 渤海银行增收不增利:信用卡等不良率暴涨,李伏安被市场“打脸”
  5. 未成年人勿进 谨以献给1980~1990出生的人(五)
  6. AutoLeaders控制组——51单片机学习笔记(AD/DA、红外遥控)
  7. python networkx 导入CSV文件画关系网络图
  8. Php扫码签到功能怎么实现,python扫码签到程序python中如何定义类
  9. 函数默认参数的TDZ
  10. JavaScript实现在线MD5、SHA、AES、Rabit 、RC4、TripleDES Ripemd160 加密解密工具-toolfk程序员在线工具网