数据结构思维 第三章 `ArrayList`
第三章 ArrayList
原文:Chapter 3 ArrayList
译者:飞龙
协议:CC BY-NC-SA 4.0
自豪地采用谷歌翻译
本章一举两得:我展示了上一个练习的解法,并展示了一种使用摊销分析来划分算法的方法。
3.1 划分MyArrayList
的方法
对于许多方法,我们不能通过测试代码来确定增长级别。例如,这里是MyArrayList
的get
的实现:
public E get(int index) {if (index < 0 || index >= size) {throw new IndexOutOfBoundsException();}return array[index];
}
get
中的每个东西都是常数时间的。所以get
是常数时间,没问题。
现在我们已经划分了get
,我们可以使用它来划分set
。这是我们以前的练习中的set
:
public E set(int index, E element) {E old = get(index);array[index] = element;return old;
}
该解决方案的一个有些机智的部分是,它不会显式检查数组的边界;它利用get
,如果索引无效则引发异常。
set
中的一切,包括get
的调用都是常数时间,所以set
也是常数时间。
接下来我们来看一些线性的方法。例如,以下是我的实现indexOf
:
public int indexOf(Object target) {for (int i = 0; i<size; i++) {if (equals(target, array[i])) {return i;}}return -1;
}
每次在循环中,indexOf
调用equals
,所以我们首先要划分equals
。这里就是:
private boolean equals(Object target, Object element) {if (target == null) {return element == null;} else {return target.equals(element);}
}
此方法调用target.equals
;这个方法的运行时间可能取决于target
或element
的大小,但它不依赖于该数组的大小,所以出于分析indexOf
的目的,我们认为这是常数时间。
回到之前的indexOf
,循环中的一切都是常数时间,所以我们必须考虑的下一个问题是:循环执行多少次?
如果我们幸运,我们可能会立即找到目标对象,并在测试一个元素后返回。如果我们不幸,我们可能需要测试所有的元素。平均来说,我们预计测试一半的元素,所以这种方法被认为是线性的(除了在不太可能的情况下,我们知道目标元素在数组的开头)。
remove
的分析也类似。这里是我的时间。
public E remove(int index) {E element = get(index);for (int i=index; i<size-1; i++) {array[i] = array[i+1];}size--;return element;
}
它使用get
,这是常数时间,然后从index
开始遍历数组。如果我们删除列表末尾的元素,循环永远不会运行,这个方法是常数时间。如果我们删除第一个元素,我们遍历所有剩下的元素,它们是线性的。因此,这种方法同样被认为是线性的(除了在特殊情况下,我们知道元素在末尾,或到末尾距离恒定)。
3.2 add
的划分
这里是add
的一个版本,接受下标和元素作为参数:
public void add(int index, E element) {if (index < 0 || index > size) {throw new IndexOutOfBoundsException();}// add the element to get the resizingadd(element);// shift the other elementsfor (int i=size-1; i>index; i--) {array[i] = array[i-1];}// put the new one in the right placearray[index] = element;
}
这个双参数的版本,叫做add(int, E)
,它使用了单参数的版本,称为add(E)
,它将新的元素放在最后。然后它将其他元素向右移动,并将新元素放在正确的位置。
在我们可以划分双参数add
之前,我们必须划分单参数add
:
public boolean add(E element) {if (size >= array.length) {// make a bigger array and copy over the elementsE[] bigger = (E[]) new Object[array.length * 2];System.arraycopy(array, 0, bigger, 0, array.length);array = bigger;} array[size] = element;size++;return true;
}
单参数版本很难分析。如果数组中存在未使用的空间,那么它是常数时间,但如果我们必须调整数组的大小,它是线性的,因为System.arraycopy
所需的时间与数组的大小成正比。
那么add
是常数还是线性时间的?我们可以通过考虑一系列n
个添加中,每次添加的平均操作次数,来分类此方法。为了简单起见,假设我们以一个有2
个元素的空间的数组开始。
- 我们第一次调用
add
时,它会在数组中找到未使用的空间,所以它存储1
个元素。 - 第二次,它在数组中找到未使用的空间,所以它存储
1
个元素。 - 第三次,我们必须调整数组的大小,复制
2
个元素,并存储1
个元素。现在数组的大小是4
。 - 第四次存储
1
个元素。 - 第五次调整数组的大小,复制
4
个元素,并存储1
个元素。现在数组的大小是8
。 - 接下来的
3
个添加储存3
个元素。 - 下一个添加复制
8
个并存储1
个。现在的大小是16
。 - 接下来的
7
个添加复制了7
个元素。
以此类推,总结一下:
4
次添加之后,我们储存了4
个元素,并复制了两个。8
次添加之后,我们储存了8
个元素,并复制了6
个。16
次添加之后,我们储存了16
个元素,并复制了14
个。
现在你应该看到了规律:要执行n
次添加,我们必须存储n
个元素并复制n-2
个。所以操作总数为n + n - 2
,为2 * n - 2
。
为了得到每个添加的平均操作次数,我们将总和除以n
;结果是2 - 2 / n
。随着n
变大,第二项2 / n
变小。参考我们只关心n
的最大指数的原则,我们可以认为add
是常数时间的。
有时线性的算法平均可能是常数时间,这似乎是奇怪的。关键是我们每次调整大小时都加倍了数组的长度。这限制了每个元素被复制的次数。否则 - 如果我们向数组的长度添加一个固定的数量,而不是乘以一个固定的数量 - 分析就不起作用。
这种划分算法的方式,通过计算一系列调用中的平均时间,称为摊销分析。你可以在 http://thinkdast.com/amort 上信息。重要的想法是,复制数组的额外成本是通过一系列调用展开或“摊销”的。
现在,如果add(E)
是常数时间,那么add(int, E)
呢?调用add(E)
后,它遍历数组的一部分并移动元素。这个循环是线性的,除了在列表末尾添加的特殊情况中。因此, add(int, E)
是线性的。
3.3 问题规模
最后一个例子中,我们将考虑removeAll
,这里是MyArrayList
中的实现:
public boolean removeAll(Collection<?> collection) {boolean flag = true;for (Object obj: collection) {flag &= remove(obj);}return flag;
}
每次循环中,removeAll
都调用remove
,这是线性的。所以认为removeAll
是二次的很诱人。但事实并非如此。
在这种方法中,循环对于每个collection
中的元素运行一次。如果collection
包含m
个元素,并且我们从包含n
个元素的列表中删除,则此方法是O(nm)
的。如果collection
的大小可以认为是常数,removeAll
相对于n
是线性的。但是,如果集合的大小与n
成正比,removeAll
则是平方的。例如,如果collection
总是包含100
个或更少的元素, removeAll
则是线性的。但是,如果collection
通常包含的列表中的 1% 元素,removeAll
则是平方的。
当我们谈论问题规模时,我们必须小心我们正在讨论哪个大小。这个例子演示了算法分析的陷阱:对循环计数的诱人捷径。如果有一个循环,算法往往是 线性的。如果有两个循环(一个嵌套在另一个内),则该算法通常是平方的。不过要小心!你必须考虑每个循环运行多少次。如果所有循环的迭代次数与n
成正比,你可以仅仅对循环进行计数之后离开。但是,如在这个例子中,迭代次数并不总是与n
成正比,所以你必须考虑更多。
3.4 链接数据结构
对于下一个练习,我提供了List
接口的部分实现,使用链表来存储元素。如果你不熟悉链表,你可以阅读 http://thinkdast.com/linkedlist ,但本部分会提供简要介绍。
如果数据结构由对象(通常称为“节点”)组成,其中包含其他节点的引用,则它是“链接”的。在链表 中,每个节点包含列表中下一个节点的引用。其他链接结构包括树和图,其中节点可以包含多个其他节点的引用。
这是一个简单节点的类定义:
public class ListNode {public Object data;public ListNode next;public ListNode() {this.data = null;this.next = null;}public ListNode(Object data) {this.data = data;this.next = null;}public ListNode(Object data, ListNode next) {this.data = data;this.next = next;}public String toString() {return "ListNode(" + data.toString() + ")";}
}
该ListNode
对象具有两个实例变量:data
是某种类型的Object
的引用,并且next
是列表中下一个节点的引用。在列表中的最后一个节点中,按照惯例,next
是null
。
ListNode
提供了几个构造函数,可以让你为data
和next
提供值,或将它们初始化为默认值,null
。
你可以将每个ListNode
看作具有单个元素的列表,但更通常,列表可以包含任意数量的节点。有几种方法可以制作新的列表。一个简单的选项是,创建一组ListNode
对象,如下所示:
ListNode node1 = new ListNode(1);
ListNode node2 = new ListNode(2);
ListNode node3 = new ListNode(3);
之后将其链接到一起,像这样:
node1.next = node2;
node2.next = node3;
node3.next = null;
或者,你可以创建一个节点并将其链接在一起。例如,如果要在列表开头添加一个新节点,可以这样做:
ListNode node0 = new ListNode(0, node1);
图 3.1 链表的对象图
图 3.1 是一个对象图,展示了这些变量及其引用的对象。在对象图中,变量的名称出现在框内,箭头显示它们所引用的内容。对象及其类型(如ListNode和Integer)出现在框外面。
3.5 练习 3
这本书的仓库中,你会找到你需要用于这个练习的源代码:
MyLinkedList.java
包含List
接口的部分实现,使用链表存储元素。MyLinkedListTest.java
包含用于MyLinkedList
的 JUnit 测试。
运行ant MyArrayList
来运行MyArrayList.java
,其中包含几个简单的测试。
然后可以运行ant MyArrayListTest
来运行 JUnit 测试。其中几个应该失败。如果你检查源代码,你会发现三条 TODO 注释,表示你应该填充的方法。
在开始之前,让我们来看看一些代码。以下是MyLinkedList
的实例变量和构造函数:
public class MyLinkedList<E> implements List<E> {private int size; // keeps track of the number of elementsprivate Node head; // reference to the first nodepublic MyLinkedList() {head = null;size = 0;}
}
如注释所示,size
跟踪MyLinkedList
有多少元素;head
是列表中第一个Node
的引用,或者如果列表为空则为null
。
存储元素数量不是必需的,并且一般来说,保留冗余信息是有风险的,因为如果没有正确更新,就有机会产生错误。它还需要一点点额外的空间。
但是如果我们显式存储size
,我们可以实现常数时间的size
方法;否则,我们必须遍历列表并对元素进行计数,这需要线性时间。
因为我们显式存储size
明确地存储,每次添加或删除一个元素时,我们都要更新它,这样一来,这些方法就会减慢,但是它不会改变它们的增长级别,所以很值得。
构造函数将head
设为null,表示空列表,并将size
设为0
。
这个类使用类型参数E
作为元素的类型。如果你不熟悉类型参数,可能需要阅读本教程:http://thinkdast.com/types。
类型参数也出现在Node
的定义中,嵌套在MyLinkedList
里面:
private class Node {public E data;public Node next;public Node(E data, Node next) {this.data = data;this.next = next;}
}
除了这个,Node
类似于上面的ListNode
。
最后,这是我的add
的实现:
public boolean add(E element) {if (head == null) {head = new Node(element);} else {Node node = head;// loop until the last nodefor ( ; node.next != null; node = node.next) {}node.next = new Node(element);}size++;return true;
}
此示例演示了你需要的两种解决方案:
对于许多方法,作为特殊情况,我们必须处理列表的第一个元素。在这个例子中,如果我们向列表添加列表第一个元素,我们必须修改head
。否则,我们遍历列表,找到末尾,并添加新节点。
此方法展示了,如何使用for
循环遍历列表中的节点。在你的解决方案中,你可能会在此循环中写出几个变体。注意,我们必须在循环之前声明node
,以便我们可以在循环之后访问它。
现在轮到你了。填充indexOf
的主体。像往常一样,你应该阅读文档,位于 http://thinkdast.com/listindof,所以你知道应该做什么。特别要注意它应该如何处理null
。
与上一个练习一样,我提供了一个辅助方法equals
,它将数组中的一个元素与目标值进行比较,并检查它们是否相等,并正确处理null
。这个方法是私有的,因为它在这个类中使用,但它不是List
接口的一部分。
完成后,再次运行测试;testIndexOf
,以及依赖于它的其他测试现在应该通过。
接下来,你应该填充双参数版本的add,它使用索引并将新值存储在给定索引处。再次阅读 http://thinkdast.com/listadd 上的文档,编写一个实现,并运行测试进行确认。
最后一个:填写remove
的主体。文档在这里:http://thinkdast.com/listrem。当你完成它时,所有的测试都应该通过。
一旦你的实现能够工作,将它与仓库solution
目录中的版本比较。
3.6 垃圾回收的注解
在MyArrayList
以前的练习中,如果需要,数字会增长,但它不会缩小。该数组从不收集垃圾,并且在列表本身被销毁之前,元素不会收集垃圾。
链表实现的一个优点是,当元素被删除时它会缩小,并且未使用的节点可以立即被垃圾回收。
这是我的实现的clear
方法:
public void clear() {head = null;size = 0;
}
当我们将head
设为null
时,我们删除第一个Node
的引用。如果没有其他Node
的引用(不应该有),它将被垃圾收集。这个时候,第二个Node
引用被删除,所以它也被垃圾收集。此过程一直持续到所有节点都被收集。
那么我们应该如何划分clear
?该方法本身包含两个常数时间的操作,所以它看起来像是常数时间。但是当你调用它时,你将使垃圾收集器做一些工作,它与元素数成正比。所以也许我们应该将其认为是线性的!
这是一个有时被称为性能 bug 的例子:一个程序做了正确的事情,在这种意义上它是正确的,但它不属于我们预期的增长级别。在像 Java 这样的语言中,它在背后做了大量工作的,例如垃圾收集,这种 bug 可能很难找到。
数据结构思维 第三章 `ArrayList`相关推荐
- 栈和队列数据结构严第三章小结
总算把第三章给弄完了..下面是我在mooc中所学所得的大致总结,过几天会把相关代码单独出一个推文 文章目录 栈 个人认为通俗的理解: 实现方法: 关于堆栈的应用 队列 你真的要我解释队列??? 实现方 ...
- 数据结构思维 第十一章 `HashMap`
第十一章 HashMap 原文:Chapter 11 HashMap 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 上一章中,我们写了一个使用哈希的Map接口的实现.我们期望这 ...
- 数据结构思维 第六章 树的遍历
第六章 树的遍历 原文:Chapter 6 Tree traversal 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章将介绍一个 Web 搜索引擎,我们将在本书其余部分开 ...
- 数据结构思维 第十七章 排序
第十七章 排序 原文:Chapter 17 Sorting 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 计算机科学领域过度痴迷于排序算法.根据 CS 学生在这个主题上花费的时 ...
- 数据结构思维 第七章 到达哲学
第七章 到达哲学 原文:Chapter 7 Getting to Philosophy 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章的目标是开发一个 Web 爬虫,它测试 ...
- 数据结构思维 第五章 双链表
第五章 双链表 原文:Chapter 5 Doubly-linked list 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章回顾了上一个练习的结果,并介绍了List接口的 ...
- 【算法基础】数据结构导论第三章-栈、队列和数组.pptx
上课的课件分享,适合教学用. 文末提供下载 已发布: 数据结构导论第一章-绪论 数据结构导论第二章-线性表 本文参考百度文库的多篇文章. 如需下载ppt文件,请回复"sjjg3" ...
- 数据结构思维 第十三章 二叉搜索树
第十三章 二叉搜索树 原文:Chapter 13 Binary search tree 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章介绍了上一个练习的解决方案,然后测试树 ...
- 数据结构思维 第四章 `LinkedList`
第四章 LinkedList 原文:Chapter 4 LinkedList 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 这一章展示了上一个练习的解法,并继续讨论算法分析. ...
最新文章
- wxml 点击图片下载_微信小程序通过ipfs-api 实现图片文件在私有ipfs网络的上传与下载显示...
- 在 Java 项目中打印错误日志的正确姿势,排查问题更方便,非常实用!
- Ookla speedtest网速测试算法实现
- ide快捷键_新买的固态硬盘用AHCI不能装系统,而用IDE却可以?问题就在这里
- php删除菜单栏,如何删除WordPress站点健康状态面板和菜单项
- 部编版是什么版本_部编版是人教版吗
- medoo update mysql_Medoo Update的使用:修改更新数据
- 13.程序员的自我修养---运行库实现
- 如何查询远程计算机的名称,如何解析远程计算机名称以获取它在java中的IP地址...
- 网络安全系列之四十九 IIS6.0权限设置
- Springboot封装的好的发送post请求的工具类
- CCNA上机实验_19-PPP
- Android 模块化总结
- Scrapy学习记录
- 网页禁用crtl +s按钮和禁用右键
- 安卓修改电池容量教程_Android 使用adb查看和修改电池信息
- 服务器做系统怎么规划,如何做系统容量规划 | 知行天下
- 围绕开放标准改进WSO2 API Manager密钥管理体系结构
- 实现输入【汉字】自动识别出对应的【拼音】
- 去哪儿网2014笔试算法题汇总
热门文章
- (37)Verilog HDL拼接运算:拼接操作与重复操作
- (20)System Verilog接口interface设计示例
- boost 获取日期时间
- unity三维向量变化为角度_三维旋转
- 上网课的心得体会1000字_网络学习心得体会 (1000字)
- python中pip不是内部或外部命令_‘pip’不被识别为内部或外部命令。
- python在物联网中的应用_在物联网中应用机器学习
- 【Keil】Keil5无法更改背景色和字体解决方案
- 交换机知识--生成树协议
- android sd media rw,Android 外部SD卡/U盤無法寫入解決方法(需要root)