JDK 7的算法和数据结构
在定期检查JDK中是否存在一种或另一种标准算法时,我决定进行这种索引。 有趣的是,为什么其中包含一些著名的数据结构或算法,而另一些却没有? 此调查的格式仅涉及JDK的算法和数据结构的关键特性和功能,所有详细信息和完整描述-您可以在javadoc或jdk源代码中轻松找到。 让我们从简单开始到复杂!
JDK的数据结构
堆
jdk中有一个堆栈 ,它是从堆栈中出现的-类Stack ,但不建议使用它,它很复杂又很奇怪:它继承自Vector ,因此基于Dynamic Array并已同步。 为什么一个简单的栈需要这一切,为什么它不只是一个接口-目前尚不清楚(讨论过很多次: 1 , 2 ),但似乎只是一个架构的错误,同样与载体本身。 顺便说一句,JDK作者自己建议使用Deque 。
Deque – 双端队列的接口(api)(O中的LIFO + FIFO(1)),其中包括堆栈操作(push,pop,isEmpty,size),并且到目前为止在jdk中可用(1.6+) 。 当然,将这些堆栈操作放在接口Stack中会更合乎逻辑,例如让Deque继承它,但是由于Stack已经存在,并且向后兼容性是Java的“圣杯” –他们不得不牺牲常规设计。 Deque的实现是ArrayDeque和LinkedList ,它们也是常规队列的实现者–因此我们将在后面讨论。
队列
接下来,让我们看一下队列数据类型 。 这里的一切都很好,设计得很好。 队列 – FIFO队列的接口(api),以恒定时间O(1)添加到开头并从结尾删除。
主要实现有: ArrayDeque ,基于动态可扩展数组的循环缓冲区 (填充时加倍)和LinkedList ( 经典的双向链接列表) (大小不受限制)。 令人惊讶的是,第一个不支持随机访问 (使用索引添加/删除/获取),第二个却支持O(n)时间并通过链表进行迭代。 这些类还实现了上述Deque,因此它们支持从末尾移除并在恒定时间内添加到顶部。
接下来,从jdk 1.5+开始,添加了PriorityQueue ,这实际上违反了合同,因为队列元素不是从末尾检索的(并且也不添加到头部),而是根据优先级检索的。 PriorityQueue基于可扩展的二进制堆 ,其顶部最小(根据其比较器),并且在填充时提高了1.5倍。 关键特征分别是:元素的添加/删除在O(log N)中,而对最小值(标头)的引用在O(1)中。
其他类型的队列是为多线程使用而设计的,它们是: BlockingQueue , TransferQueue , ConcurrentLinkedQueue和ConcurrentLinkedDeque 。
BlockingQueue ( ArrayBlockingQueue , LinkedBlockingQueue , PriorityBlockingQueue )的实现是其原始版本的一种同步版本,即几乎每个操作都是串行执行的(具有独占锁定)。 对于DelayQueue也是如此:也是同步的,并且在内部使用PriorityQueue 。
其他实现: SynchronousQueue , TransferQueue ( LinkedTransferQueue ), ConcurrentLinkedQueue , ConcurrentLinkedDeque –基于不同的方法:它们使用基于链表和CAS指令的非阻塞队列算法,这些算法在多处理器环境中可以很好地并行化。 详细描述在源代码中。
这类算法的理论是一个非常庞大且现代的话题,因此还没有很好的标准化和结构化,它们超出了本文的讨论范围,也不属于另一篇文章的主题。
优先队列
就像从jdk 1.5+开始所说的那样,有一个通用的PriorityQueue根据元素比较器工作。 而且,jdk中还有堆的另一种实现。 这是很好的旧Timer ,它是内部类– TaskQueue(顶部的延迟最小的任务)。 当然,这是一个私有类,除了在Timer内部,不能使用。
清单
如您所知,有顺序和/或随机访问类型列表。 在Java中,它是List ,主要有2种实现:首先-是ArrayList ,支持随机访问 ,基于动态可扩展数组 (填充时增加一半),但是在删除所有元素后不会缩小,您需要调用a特殊方法( trimToSize )。
第二个-再次是LinkedList,它是一个双链表顺序访问大小,仅受jvm的内存限制。 尽管也存在随机访问(索引)的方法–如前所述,它们需要O(n)时间。
因此,java集合中没有最简单的链表实现,尽管这是一个好主意(链接的开销减少了2倍),并且没有简单的堆栈。
要在多线程环境中使用列表,有几个选项: CopyOnWriteArrayList (更改操作– O(n)),包装器( synchonizedList )以及过时的Vector 。
符号表
它们在JDK中显示为二进制树和哈希表。 二叉树 –它是TreeMap (或TreeSet ), SortedMap (也是SortedSet)的实现,它基于经典的红黑树 ,即是平衡的,并且对于O(log N)保证了其基本操作,并且不限大小。 jdk中不存在其他类型的树。
哈希表是HashMap (也是HashSet ),它可能是Java中最常用的结构,它基于可动态扩展的哈希表,具有与链表的单独链接 ,具有所有功能:性能取决于哈希函数的质量,因此最坏的情况是O(N)。 当大小达到预定的loadFactor时, HashMap的大小将增加一倍。 值得注意的是,为了保护错误的哈希函数,使用了双哈希,并且对调用hashCode()的结果应用了棘手的位算法。
在JDK中,也有带有开放地址(线性探测)的哈希表实现。 其中之一是IdentityHashMap ,当键和值都存储在彼此相邻的同一数组中时,它会使用经典线性探测的优化版本,以实现更好的数据缓存(javadoc:«大型表的局部性比使用单独的数组»)
第二种开放寻址实现是非常特定的:它仅用于存储ThreadLocal元素( ThreadLocalMap中的内部隐藏类),当然不可用。
还有多线程版本: ConcurrentHashMap中 ,包装synchronizedMap , 哈希表和ConcurrentSkipListMap 。 包装器-自然只是阻止了常规HashMap Hashtable的版本-同一件事(并且是旧的,不建议使用), ConcurrentHashMap-锁条版本,减少了关键的锁部分(最好阅读JCiP ,这里是( 摘录 ) ConcurrentSkipListMap –是哈希表的非阻塞命名算法的改编版本(有关详细信息,请参见源代码)。
集合(不包含重复项)–在Java中设置 ,并通过HashMap实现,因此所有被称为哈希表的对象–对HashSet有效。
图表
图结构和算法未在jdk中表示。 因此,您只能为此使用第三方库。
弦乐
java中通常有一个字符串实现:基于unicode字符数组。 值得一提的是,从1.7_17版本开始,由于已复制子字符串,因此子字符串的性能为O(n)。
有趣的是, 此实现使用了一种简单的(强力)子字符串搜索算法,该算法在最坏的情况下以O(N * M)运行,并且没有一些有效的算法(在有限状态机上构建:Knuth-Morris-Pratt等) 。
原因有几个:字母UTF字符大(〜65K),因此存储状态机的开销很大,而就采用了蛮力算法(不使用额外的内存)。 其次,在平均输入字符串上–根据统计数据,该算法与其他算法相比并没有很多。
与排序相同:有有效的基数排序字符串algs(LSD,MSD等),但是在jdk中,有一个用于字符串的标准对象排序 ,如果运行,则以O(M * N * log N)运行大部分线相差不大(M –线长)。 原因是相同的:快速计数字符串算法需要额外的UTF字母大小的数组,这使得它们在平均输入上非常无效。
JDK算法
排序
由于jdk7发生了许多有关各种选项的更改,因此讨论了很多次,关于此主题的信息和文章很多,您可以轻松地将其搜索出来。
简而言之,这是jdk中排序实现的实际列表: TimSort –默认情况下对对象进行排序; mergesort –还用于对象;旧版本(通过系统属性启用); Dual-Pivot Quick sort –用于基元;然后按计数排序用于字节/字符数组,最后插入排序用于任何情况下使用的小数组。
集合内容使用Collections.sort(List…)进行排序,仍然可以通过将集合复制到数组中,对其进行排序,然后相应地覆盖集合内容来完成。 因此,尽管没有开销,对集合进行排序仍然是不可能的,尽管我认为拥有就地排序的链表是一个好主意。 Java中的字符串排序也使用对象版本完成,原因已经提到。
正在搜寻
对于原语和对象的所有数组以及随机访问列表实现(例如ArrayList等),都存在传统的二进制搜索 。 此外,JDK中还有一个二进制搜索链接列表的版本! 令人惊讶的是:JDK没有对链表进行排序,但是对它们进行二进制搜索! 尽管没有太大意义,因为这种版本的性能为O(N)。
常用表达
为此提供了Pattern和Matcher类。 Java使用基于带回溯的非确定性有限状态机( NFA )的传统实现。 因此,在退化的输入上,在最坏的情况下它给出了指数复杂度 O(m ^ N),例如,在Java中运行此regexp并尝试添加/删除“ a”符号:“ aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa.aa )* b”)
此外,还有所谓的有序交替-此功能可在找到第一个匹配项后停止搜索,但不会显示最具体(最长)的搜索结果( 例如 )。
哈希函数,校验和
jdk中有hashCode实现的六个版本,并且Park-Miller_random_number_generator是默认版本,其他很简单,例如常量或对象内存地址,并且不使用算法,您可以在c ++ jdk源代码中找到它们。 MessageDigest类中还有行业标准的哈希算法(SHA-*,MD5和变体)。
对于校验和,有Adler-32 ( javadoc )和CRC32 ( javadoc )算法的实现。
压缩
jdk中有一个标准的压缩deflate( Deflater )算法的实现,并且zip / gzip jdk utils使用它。 它们都在java.util.zip包中 。
摘要
如您所见,经典数据结构并未完全用Java呈现,但与此同时,几乎所有jdk中的所有数据结构都可以使用很多线程安全版本。 缺少的是一个悬而未决的问题。 例如,您可以争辩jdk是否需要一些Union-Find,但是在社交网络时代完全缺少该语言的图形结构和算法非常令人惊讶,并且实际上会产生许多错误和自行车。
翻译自: https://www.javacodegeeks.com/2013/07/algorithms-and-data-structures-of-jdk-7.html
JDK 7的算法和数据结构相关推荐
- jdk7默认gc算法_JDK 7的算法和数据结构
jdk7默认gc算法 在定期检查JDK中是否存在一种或另一种标准算法时,我决定进行这种索引. 有趣的是,为什么其中包含一些著名的数据结构或算法,而其他却没有? 此调查的格式仅涉及JDK的算法和数据结构 ...
- 算法与数据结构(面向对象思想)
算法与数据结构和编程之间关系 计算机就是算法与数据结构, 当你选择搜索这类的文章的时候,你已经在翻大山了 编程就是当你翻过一座山的时候,你发现前面还有一座更高的山. LZ从事java工作一年了,最近听 ...
- 【算法和数据结构学习笔记】整合版
文章目录 算法 前缀和 双指针法 四数之和 分治算法 Offer 58 II 左旋转字符串 回溯算法 动态规划 数据结构 数组 & String & 双指针 字符串 反转字符串 T54 ...
- 算法与数据结构基础<一>----线性查找法
开篇: 对于数据结构及算法的学习在17年时就已经在博客中开了专栏: 但是!!!感觉学得有点零散,有c版本的,也有java版本的,没成体系,当然其效果也并没达到自己满意的效果,基于此,这里准备重新开个专 ...
- 如何写出高性能代码(一)善用算法和数据结构
同一份逻辑,不同人的实现的代码性能会出现数量级的差异: 同一份代码,你可能微调几个字符或者某行代码的顺序,就会有数倍的性能提升:同一份代码,也可能在不同处理器上运行也会有几倍的性能差异:十倍程序员不是 ...
- GitHub上分享的常用算法和数据结构实现原理可视化系统
一门编程语言入门之后,要想进阶,必须学习算法和数据结构,但是对于初学者来讲算法和数据结构和数据结构的实现原理和机制过于枯涩.抽象难懂. 这里为小伙伴们分享一个名为Algorithm Visualize ...
- 维基百科上的算法和数据结构链接很强大
突然发现维基百科上的算法和数据结构比百度百科强多啦,图文并茂. 其实这个网站不错:http://www.sorting-algorithms.com 冒泡排序: bubble冒泡的意思 http:// ...
- GitHub标星3w+的项目,全面了解算法和数据结构知识
作者 | 程序员小吴 来源 | 五分钟学算法(ID: CXYxiaowu) 导语:今天分享一个开源项目,里面汇总了程序员技术面试时需要了解的算法和数据结构知识,并且还提供了相应的代码,目前 GitHu ...
- noj数据结构稀疏矩阵的加法十字链表_一个算法毁了一款好游戏?算法和数据结构到底有多重要?...
来源 | 异步 | 文末赠书 前段时间大火的国产游戏--<太吾绘卷>,由于创新的玩法和精良的制作一度广受好评,然而随着玩家游戏的深入和时长的积累,发现该游戏在玩的过程中游戏外的问题很多很多 ...
最新文章
- PDF编辑工具——PDF Desktop Converter 4 Professional
- vue2.0实现底部导航切换效果
- 如何在查询分析器中执行dos命令
- python源码多平台编译_ubuntu编译python源码的坑
- Python档案袋( 面向对象 )
- 通过一个Thinkphp完成多个项目
- CSS 3 动画 实现图片动态切换
- 微信小程序(八 配置和请求)
- java 图书馆系统_JAVA 图书馆管理系统
- x11-forwarding disabled解决办法
- MapReduce案例之天气分析
- 为什么Word字间距异常的大?怎么修正排版?
- 用JS通过新浪天气API接口获取天气
- Tungsten Replicator学习总结
- Git 进阶 —— 时光穿梭机
- 股市心理学中的精神分析
- 2022元宇宙十大 “闪光时刻”
- #程序员的办公桌面是怎么样的?网友晒的真是逼格满满啊
- Specification 参数的用法
- 剖析RS-485原理以及与其他总线的区别
热门文章
- sql server 2008安装_性能不够?基于时序数据库的Zabbix 5.2安装指南
- 转: 深入浅出-网络七层模型
- spring boot 入门荔枝
- lambda :: -_无需再忙了:Lambda-S3缩略图,由SLAppForge Sigma钉牢!
- smpp客户端_SMPP Java示例(客户端)
- json api_JSON模式在构建和部署API中的作用
- kie-api_7.0上的新KIE持久性API
- java 函数式编程_Java函数式编程:Javaslang入门
- lombok 生成代码_使用Project Lombok减少Java应用程序中的样板代码
- 函数指针使用场景和选择_在N + 1场景中使用@NamedEntityGraph更有选择地加载JPA实体...