感谢同事【kevinlynx】在本站发表此文

无锁有序链表可以保证元素的唯一性,使其可用于哈希表的桶,甚至直接作为一个效率不那么高的map。普通链表的无锁实现相对简单点,因为插入元素可以在表头插,而有序链表的插入则是任意位置。

主要问题

链表的主要操作包含insert和remove,先简单实现一个版本,就会看到问题所在,以下代码只用作示例:

struct node_t {

key_t key;

value_t val;

node_t *next;

};

int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {

node_t *pred = head;

node_t *item = head->next;

while (item) {

int d = KEY_CMP(item->key, key);

if (d >= 0) {

*pred_ptr = pred;

*item_ptr = item;

return d == 0 ? TRUE : FALSE;

}

pred = item;

item = item->next;

}

*pred_ptr = pred;

*item_ptr = NULL;

return FALSE;

}

int l_insert(node_t *head, key_t key, value_t val) {

node_t *pred, *item, *new_item;

while (TRUE) {

if (l_find(&pred, &item, head, key)) {

return FALSE;

}

new_item = (node_t*) malloc(sizeof(node_t));

new_item->key = key;

new_item->val = val;

new_item->next = item;

// A. 如果pred本身被移除了

if (CAS(&pred->next, item, new_item)) {

return TRUE;

}

free(new_item);

}

}

int l_remove(node_t *head, key_t key) {

node_t *pred, *item;

while (TRUE) {

if (!l_find(&pred, &item, head, key)) {

return TRUE;

}

// B. 如果pred被移除;如果item也被移除

if (CAS(&pred->next, item, item->next)) {

haz_free(item);

return TRUE;

}

}

}

l_find函数返回查找到的前序元素和元素本身,代码A和B虽然拿到了pred和item,但在CAS的时候,其可能被其他线程移除。甚至,在l_find过程中,其每一个元素都可能被移除。问题在于,任何时候拿到一个元素时,都不确定其是否还有效。元素的有效性包括其是否还在链表中,其指向的内存是否还有效。

解决方案

通过为元素指针增加一个有效性标志位,配合CAS操作的互斥性,就可以解决元素有效性判定问题。

因为node_t放在内存中是会对齐的,所以指向node_t的指针值低几位是不会用到的,从而可以在低几位里设置标志,这样在做CAS的时候,就实现了DCAS的效果,相当于将两个逻辑上的操作变成了一个原子操作。想象下引用计数对象的线程安全性,其内包装的指针是线程安全的,但对象本身不是。

CAS的互斥性,在若干个线程CAS相同的对象时,只有一个线程会成功,失败的线程就可以以此判定目标对象发生了变更。改进后的代码(代码仅做示例用,不保证正确):

typedef size_t markable_t;

// 最低位置1,表示元素被删除

#define HAS_MARK(p) ((markable_t)p & 0x01)

#define MARK(p) ((markable_t)p | 0x01)

#define STRIP_MARK(p) ((markable_t)p & ~0x01)

int l_insert(node_t *head, key_t key, value_t val) {

node_t *pred, *item, *new_item;

while (TRUE) {

if (l_find(&pred, &item, head, key)) {

return FALSE;

}

new_item = (node_t*) malloc(sizeof(node_t));

new_item->key = key;

new_item->val = val;

new_item->next = item;

// A. 虽然find拿到了合法的pred,但是在以下代码之前pred可能被删除,此时pred->next被标记

// pred->next != item,该CAS会失败,失败后重试

if (CAS(&pred->next, item, new_item)) {

return TRUE;

}

free(new_item);

}

return FALSE;

}

int l_remove(node_t *head, key_t key) {

node_t *pred, *item;

while (TRUE) {

if (!l_find(&pred, &item, head, key)) {

return FALSE;

}

node_t *inext = item->next;

// B. 删除item前先标记item->next,如果CAS失败,那么情况同insert一样,有其他线程在find之后

// 删除了item,失败后重试

if (!CAS(&item->next, inext, MARK(inext))) {

continue;

}

// C. 对同一个元素item删除时,只会有一个线程成功走到这里

if (CAS(&pred->next, item, STRIP_MARK(item->next))) {

haz_defer_free(item);

return TRUE;

}

}

return FALSE;

}

int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {

node_t *pred = head;

node_t *item = head->next;

hazard_t *hp1 = haz_get(0);

hazard_t *hp2 = haz_get(1);

while (item) {

haz_set_ptr(hp1, pred);

haz_set_ptr(hp2, item);

/*

如果已被标记,那么紧接着item可能被移除链表甚至释放,所以需要重头查找

*/

if (HAS_MARK(item->next)) {

return l_find(pred_ptr, item_ptr, head, key);

}

int d = KEY_CMP(item->key, key);

if (d >= 0) {

*pred_ptr = pred;

*item_ptr = item;

return d == 0 ? TRUE : FALSE;

}

pred = item;

item = item->next;

}

*pred_ptr = pred;

*item_ptr = NULL;

return FALSE;

}

haz_get、haz_set_ptr之类的函数是一个hazard pointer实现,用于支持多线程下内存的GC。上面的代码中,要删除一个元素item时,会标记item->next,从而使得insert时中那个CAS不需要做任何调整。总结下这里的线程竞争情况:

insert中find到正常的pred及item,pred->next == item,然后在CAS前有线程删除了pred,此时pred->next == MARK(item),CAS失败,重试;删除分为2种情况:a) 从链表移除,得到标记,pred可继续访问;b)pred可能被释放内存,此时再使用pred会错误。为了处理情况b,所以引入了类似hazard pointer的机制,可以有效保障任意一个指针p只要还有线程在使用它,它的内存就不会被真正释放

insert中有多个线程在pred后插入元素,此时同样由insert中的CAS保证,这个不多说

remove中情况同insert,find拿到了有效的pred和next,但在CAS的时候pred被其他线程删除,此时情况同insert,CAS失败,重试

任何时候改变链表结构时,无论是remove还是insert,都需要重试该操作

find中遍历时,可能会遇到被标记删除的item,此时item根据remove的实现很可能被删除,所以需要重头开始遍历

ABA问题

ABA问题还是存在的,insert中:

if (CAS(&pred->next, item, new_item)) {

return TRUE;

}

如果CAS之前,pred后的item被移除,又以相同的地址值加进来,但其value变了,此时CAS会成功,但链表可能就不是有序的了。pred->val < new_item->val > item->val

为了解决这个问题,可以利用指针值地址对齐的其他位来存储一个计数,用于表示pred->next的改变次数。当insert拿到pred时,pred->next中存储的计数假设是0,CAS之前其他线程移除了pred->next又新增回了item,此时pred->next中的计数增加,从而导致insert中CAS失败。

// 最低位留作删除标志

#define MASK ((sizeof(node_t) - 1) & ~0x01)

#define GET_TAG(p) ((markable_t)p & MASK)

#define TAG(p, tag) ((markable_t)p | (tag))

#define MARK(p) ((markable_t)p | 0x01)

#define HAS_MARK(p) ((markable_t)p & 0x01)

#define STRIP_MARK(p) ((node_t*)((markable_t)p & ~(MASK | 0x01)))

remove的实现:

/* 先标记再删除 */

if (!CAS(&sitem->next, inext, MARK(inext))) {

continue;

}

int tag = GET_TAG(pred->next) + 1;

if (CAS(&pred->next, item, TAG(STRIP_MARK(sitem->next), tag))) {

haz_defer_free(sitem);

return TRUE;

}

insert中也可以更新pred->next的计数。

总结

无锁的实现,本质上都会依赖于CAS的互斥性。从头实现一个lock free的数据结构,可以深刻感受到lock free实现的tricky。最终代码可以从这里github获取。代码中为了简单,实现了一个不是很强大的hazard pointer,可以参考之前的博文。

java无锁数据结构,无锁有序链表的实现相关推荐

  1. Java中的数据结构:数组与链表的区别

    数组的定义 数组(Array)是有序的元素序列. 若将有限个类型相同的变量的集合命名,那么这个名称为数组名.组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量.用于区分数组的各个元 ...

  2. Java集合常见数据结构-栈/队列/数组/链表/红黑树

    数组 链表 红黑树

  3. 【Java实现】合并两个有序链表

  4. 无锁数据结构三:无锁数据结构的两大问题

    实现无锁数据结构最困难的两个问题是ABA问题和内存回收问题.它们之间存在着一定的关联:一般内存回收问题的解决方案,可以作为解决ABA问题的一种只需很少开销或者根本不需额外开销的方法,但也存在一些情况并 ...

  5. 无锁数据结构--理解CAS、ABA、环形数组

    在分布式系统中经常会使用到共享内存,然后多个进程并行读写同一块共享内存,这样就会造成并发冲突的问题, 一般的常规做法是加锁,但是锁对性能的影响非常大. 无锁队列是一个非常经典的并行计算数据结构,它极大 ...

  6. c/c++多线程编程与无锁数据结构漫谈

    本文主要针对c/c++,系统主要针对linux.本文引述别人的资料均在引述段落加以声明. 场景: thread...1...2...3...:多线程遍历 thread...a...b...c...:多 ...

  7. Java并发编程,无锁CAS与Unsafe类及其并发包Atomic

    为什么80%的码农都做不了架构师?>>>    我们曾经详谈过有锁并发的典型代表synchronized关键字,通过该关键字可以控制并发执行过程中有且只有一个线程可以访问共享资源,其 ...

  8. 【Java 并发编程】线程锁机制 ( 锁的四种状态 | 无锁状态 | 偏向锁 | 轻量级锁 | 重量级锁 | 锁竞争 | 锁升级 )

    文章目录 一.悲观锁示例 ( ReentrantLock ) 二.重量级锁弊端 三.锁的四种状态 ( 无锁状态 | 偏向锁 | 轻量级锁 | 重量级锁 ) 四.锁的四种状态之间的转换 ( 无锁状态 - ...

  9. 无锁数据结构二-乱序控制(栅栏)

    内存栅栏 由于优化会导致对代码的乱序执行,在并发执行时可能带来问题.因此为了并行代码的正确执行,我们需提示处理器对代码优化做一些限制.而这些提示就是内存栅栏(memory barriers),用来对内 ...

最新文章

  1. 「微服务系列 13」熔断限流隔离降级
  2. python软件安装步骤-初学者python详细安装步骤_编程工具
  3. 【PC工具】更新最全最好的编程手册管理软件Zeal,arduino学习、python学习编程语法查阅必备工具...
  4. hiberante 二级缓存设置
  5. 超级实用!用Python写股票分析工具
  6. 放肆地使用UIBezierPath和CAShapeLayer画各种图形
  7. Tensorflow安装问题解决(Anoconda)
  8. bzoj 1645: [Usaco2007 Open]City Horizon 城市地平线【线段树+hash】
  9. java tcp 线程_java 网络协议(一)Tcp多线程服务器端编程
  10. 校园云盘-育网云盘本地部署
  11. 开源免费cms---十大主流建站的CMS系统介绍
  12. MacOSx打包dmg文件(带背景图片)
  13. LJX的校园:社会实践的任务
  14. 终于去看了麦兜响当当
  15. 每个人都应该具有创业精神 ——《穿布鞋的马云》读后感
  16. office 文档 在线查看
  17. html超酷图片墙特效代码,超酷超绚精美图片展示效果代码(一)
  18. php route,FastRoute
  19. 区块链教程(1)——区块链原理
  20. 机器人总动员片尾曲歌词_机器人总动员中的所有歌曲叫什么名?

热门文章

  1. spring security技术分享
  2. Python-霍兰德人格分析图实例
  3. Android N BlockedNumberContract原生黑名单(一)
  4. 从二进制到逻辑门——哲学中诞生的计算理论
  5. 教你使用Python从零开始搭建一个区块链项目!
  6. LaTeX 制作(跨页)长表格
  7. CocosCreater 发布微信小游戏 真机调试 找不到json 以及4930错误
  8. 【综合应用】基础PLS-SEM模型STATA实战
  9. 【论文笔记】Deep Reinforcement Learning Control of Hand-Eye Coordination with a Software Retina
  10. 项目管理(项目经理)与规划