【并发编程十三】c++原子操作(1)

  • 一、改动序列
    • 1、改动序列
    • 2、预测执行
  • 二、原子操作及其类别
    • 1、原子操作
    • 2、非原子操作
    • 3、原子类型
  • 三、标准原子类型
    • 1、标准原子类型的两种实现方式
    • 2、原子操作的用途
    • 3、原子操作的宏
  • 四、操作std:atomic_flag
    • 1、简介
    • 2、使用说明
    • 3、使用std:atomic_flag实现自旋锁
    • 3、缺点
  • 五、操作std:atomic\<bool>
    • 1、简介
    • 2、操作
    • 3、“比较-交换”操作:依据原子对象当前的值决定是否保存新值。
      • 3.1、比较-交换
      • 3.2、compare_exchange_weak()
      • 3.3、compare_exchange_strong()
      • 3.4、compare_exchange_weak()和compare_exchange_strong()使用场景对比
  • 五、操作std:atomic\<T*>
    • 1、简介
    • 2、原子操作、原子运算
    • 3、demo
  • 六、标准整数原子类型
  • 七、泛化的std::\<>类模板
  • 八、原子操作的内存次序
  • 九、c++原子操作实现自旋锁

一、改动序列

1、改动序列

  • 在一个c++程序中,每个对象都有一个改动序列(可以参考原子操作的内存理解std::memory_order)。它由所有线程在对象上的全部写操作构成,其中第一个写操作即为对象的初始化。大部分情况下,这个序列会随程序的多次运行而发生变化,但是在程序的任意一次运行过程中,所含的全部线程都必须形成相同的改动序列。
  • 若多个线程共同操作某一对象,但它却不属于原子类型,我们就要自己负责充分实行同步操作,进而确保对于同一个变量,所有线程就其达成一致的改动序列。变量的值会随时间推移形成一个序列。
  • 在不同的线程上观察属于同一个变量的序列,如果所见各异,就说明出现了数据竞争和未定义行为。
  • 若我们采用了原子操作,那么编译器由责任保证必要的同步操作有效、到位。

2、预测执行

预测执行又称推测执行、投机执行,是一类底层优化技术,包括分支预测、数值预测、预读内存和预读文件等,目的是在多级流水cpu上提高指令的并发度。做法是提前执行指令而不考虑师傅必要,若完成后发现没必要,则抛弃或修正预执行的结果

  • 为了实现上述改动序列的保障,要求禁止某些预测执行(speculative execution),原因是该改动序列中,只要某些线程看过过某个对象,则该线程的后续读操作必须获得相对新进的值,并且,该线程就同一对象的后续写操作,必然出现在改动序列的后方。
  • 另外,如果某线程先向一个对象写数据,过后再读取它,那么必须读取前面写的值。
  • 若在改动序列中,上述读写操作之间还有别的写操作,则必须读取最后写的值。
  • 在程序内部,对于同一对象,全部线程都必须就其形成相同的改动序列,并且在多有对象上都要求如此,而多个对象上的改动序列知识相对关系,线程之间不必达成一致。

二、原子操作及其类别

1、原子操作

  • 原子操作是不可分割的操作(indivisible operation)。在系统的任一线程内,我们都不会观察到这种操作处于半完成状态;它或者完全好,或者完全没做。
  • 考虑读取某对象的过程,假如其内存加载行为属于原子操作,并且该对象的全部修改行为也都是原子操作,那么通过内存加载行为就可以得到该对象的初始值,或得到某次修改而完整存入的值。

2、非原子操作

  • 与之相反,非原子操作(non-atomic operation)在完成到一半的时候,有可能为另一线程所见。
  • 假定由原子操作组合出非原子操作,例如向结构体的原子数据成员赋值,那么别的线程有可能观察到其中的某些原子操作已完成,而某些还没开始,若多个线程同时赋值,而底层操作相交执行,本来意图完整存入的数据就会彼此错杂。因此,我们有可能观察到,也有可能得出一个“混合体"的结构体。
  • 在任何情况下访问非原子变量却欠缺同步保护,会照成简单的条件竞争,进而引发问题。具体而言,这种级别的访问可能构成数据竞争,并导致未定义行为。

3、原子类型

在c++环境中,多数情况下,我们需要通过原子类型实现原子操作。

三、标准原子类型

标准原子类型的别名,和他们对应的std::atomic<>特化。

类型别名 定义
std::atomic_bool std::atomic<bool>
std::atomic_char std::atomic<char>
std::atomic_schar std::atomic<signed char>
std::atomic_uchar std::atomic<unsigned char>
std::atomic_short std::atomic<short>
std::atomic_ushort std::atomic<unsigned short>
std::atomic_int std::atomic<int>
std::atomic_uint std::atomic<unsigned int>
std::atomic_long std::atomic<long>
std::atomic_ulong std::atomic<unsigned long>
std::atomic_llong std::atomic<long long>
std::atomic_ullong std::atomic<unsigned long long>
std::atomic_char8_t (C++20) std::atomic<char8_t>
std::atomic_char16_t std::atomic<char16_t>
std::atomic_char32_t std::atomic<char32_t>
std::atomic_wchar_t std::atomic<wchar_t>

还有一些其他的类型别名,可以参见std::atomic

1、标准原子类型的两种实现方式

  • 标准原子类型的定义位于头文件<atomic>内。这些类型的操作全是原子化的,并且,根据语言的定义,c++内建的原子操作也仅仅支持这些类型。
  • 尽管通过采用互斥,我们能够令其他操作实现原子化。
  • 他们全部具备成员函数is_lock_free(),准许使用者判定某一给定的类型上的操作是由原子指令(atomic instruction)直接实现(x.is_lock_free()返回true),还是要借助编译器和程序库的内部锁来实现(x.is_lock_free()返回false)。

原子指令用于在多个CPU之间维护同步关系。在一些科学计算问题中,通过并行算法把子问题分配到多个cpu上执行,但是各个子问题之间存在合作关系,因此需要硬件机制来实现多个cpu之间同步。

原子指令可以实现一个CPU独占执行时间。使用原子指令把连续多条指令包含起来,计算机保证只有一个cpu处于执行状态,其他cpu必须等待原子指令结束才能继续执行。(b)展示的就是实现“原子加1”的正确方法。

原子指令的实现机制一般是在cpu的互联网络中实现一个全局的原子寄存器,所有cpu对这个原子寄存器的访问是互斥的。cpu使用原子指令申请访问原子寄存器时,互联网络会对所有CPU进行仲裁,确保只有一个cpu可以获得对原子寄存器的访问权;如果有cpu获得了原子寄存器访问权,其他cpu必须等待该cpu释放权限才能继续执行。

原子指令详细介绍参见什么是原子指令

#include <iostream>
#include <atomic>using namespace std;int main()
{atomic<int> x;bool flag = x.is_lock_free();cout << flag << endl;return 0;
}

输出

1

2、原子操作的用途

  • 原子操作的关键用途是取代需要互斥的同步方式。但是,假如原子操作本身也在内部使用了互斥,就很可能无法达到所期望的性能提升,而更好的做法是采用基于互斥的方式,该方式更加直观且不易出错。无锁数据结构属于这种情况。

3、原子操作的宏

c++程序库专门为此提供了一组宏。他们的作用是,针对不同整数类型特化而成的各种原子类型,在编译期判定其是否属于无锁数据结构。

#if defined ATOMIC_BOOL_LOCK_FREE
#if defined ATOMIC_CHAR_LOCK_FREE
#if defined ATOMIC_CHAR16_T_LOCK_FREE
#if defined ATOMIC_CHAR32_T_LOCK_FREE
#if defined ATOMIC_WCHAR_T_LOCK_FREE
#if defined ATOMIC_SHORT_LOCK_FREE
#if defined ATOMIC_INT_LOCK_FREE
#if defined ATOMIC_LONG_LOCK_FREE
#if defined ATOMIC_LLONG_LOCK_FREE
#if defined ATOMIC_POINTER_LOCK_FREE
#include <iostream>
//#include <atomic>using namespace std;int main()
{#if defined ATOMIC_BOOL_LOCK_FREEint a = 2;
#elseint a = 3;
#endifcout << a << endl;return 0;
}

输出

2

四、操作std:atomic_flag

1、简介

std::atomic_flag是最简单的标准原子类型,表示一个布尔标志。
该类型的对象只有两种状态:成立或置零。二者必居其一。

经过刻意设计,它相当简单,唯一用途是充当构建单元,因此我们认为普通开发者一般不会直接使用它。尽管这样,我们从std:atomic_flag切入,仍能借以说明原子类型的一些通用原则,方便进一步讨论其他原子类型。

2、使用说明

1、atomic_flag类型的对象必须由宏 ATOMIC_FLAG_INIT 初始化,它把标志初始化为置零状态。
2、完成std::atomic_flag对象的初始化后,我们只能执行3种操作:销毁、置零、读取原有的值并设置标志成立。这分别对应于析构函数、成员函数clear()、成员函数test_and_set();
3、我们可以为clear()、test_and_set()指定内存次序。clear()是存储操作,而test_and_set()是”读-改-写“,因此能采用任何内存次序。对于上面两个原子操作,默认内存次序都是std::memory_order_seq_cst。

3、使用std:atomic_flag实现自旋锁

这个互斥非常简单,但已经能够配合lock_guard<>使用

  • 最开始令原子标志置零,表示没有互斥加锁。
  • 我们反复调用test_and_set()尝试锁住互斥,一旦读取的值变为false,则说明线程已经将标志设置成立(新值为true),则循环终止。
  • 而简单的将标志置零既可解锁互斥。
class spinlock_mutex
{public:spinlock_mutex()     {}//spinlock_mutex(const spinlock_mutex& origin); // add this line~spinlock_mutex() {};void lock(){while (flag.test_and_set(memory_order_acquire));}void unlock(){flag.clear(memory_order_release);}
private:atomic_flag flag = ATOMIC_FLAG_INIT;
};

3、缺点

由于atomic_flag严格受限,甚至不支持单纯的无修改查值操作,无法用作普通的布尔标志,因此最好还是使用atomic<bool>

五、操作std:atomic<bool>

1、简介

  • std:atomic是基于整数类型的最基本的原子类型。
  • 相比std:atomic_flag,它是一个功能更加齐全的布尔标志。
  • 尽管std:atomic也无法拷贝构造和拷贝赋值,但是我们还是能依据非原子布尔量创建其对象,初始值是true或false皆可。(该类型的实例还能接收非原子布尔量的赋值)
std::atomic<bool> b(true);
b=false;

2、操作

  • store()是写操作,true和false皆可;(相当于std:atomic_flag的成员函数clear())
  • load()是读取操作;
  • exchange()是”读-改-写“,(替代test_and_set())
  1. 原子地以 desr 的值替换 obj 所指向的值,并返回 obj 先前保有的值,如同以 obj->exchange(desr) 。
  2. 原子地以 desr 的值替换 obj 所指向的值,并返回 obj 先前保有的值,如同以 obj->exchange(desr, order) 。
    参数
    obj - 指向要修改的原子对象的指针
    desr - 要存储于原子对象的值
    order - 此操作所用的内存同步顺序:容许所有值。
#include <iostream>
#include <atomic>using namespace std;int main()
{atomic<bool> b;bool x = b.load(std::memory_order_acquire);b.store(true);x = b.exchange(false, std::memory_order_acq_rel);cout << "b=" << b << endl;cout << "x=" << x << endl;return 0;
}

输出
b=0
x=1

3、“比较-交换”操作:依据原子对象当前的值决定是否保存新值。

std::atomic还引入了一种操作,若原子对象当前的值符合预期,就赋予新值。它与exchage()一样,同为”读-改-写“操作。

3.1、比较-交换

  • 这一操作被称为”比较-交换“(compare-exchange),实现形式是成员函数compare_exchange_weak()和compare_exchange_strong()。

比较交换操作是原子类型的编程基石。使用者给定一个期望值,原子变量将它和自身的值做比较,如果相等,就传入另一个既定的值;否则,更新期望值所属的变量,向它赋予原子变量的值。
比较交换函数返回布尔类型,如果完成了保存动作(前提是两值相等),则操作成功,函数返回ture,反之操作失败,函数返回false.

3.2、compare_exchange_weak()

  • 对于compare_exchange_weak(),即使原子变量的值等于期望值,保存动作还是有可能失败,在这种情形下,原子变量维持不变,compare_exchange_weak()返回false;

原子化的比较-交换必须由一条指令单独完成,而某些处理器没有这种指令,无法保证该操作按原子化方式完成。
要实现比较-交换,负责的线程则必须改为连续运行一些列指令,但在这些计算机上,只要出现线程数量多于处理器数量的情形,线程就有可能执行到中途因系统调度而切出,导致操作失败。
这种计算机最有可能引发上述的保存失败,我们称之为佯败(spurious failure)。其因败因不算变量值本身存在问题,而是函数执行时机不对。

因为compare_exchange_weak()可能佯败,所以它必须配合循环使用。

#include <iostream>
#include <atomic>using namespace std;int main()
{bool expected = false;extern atomic<bool> b; //由其他源文件的代码设定变量的值while(!b.compare_exchange_weak(expected, true) && !expected);{cout << "b=" << b << endl;}return 0;
}atomic<bool> b;

输出

b=1

3.3、compare_exchange_strong()

  • 只有当原子变量的值不符合预期时,compare_exchange_strong()才返回false.

这让我们得以明确知悉变量是否成功修改,或者是否存在另一线程抢先切入而导致佯败,从而能够摆脱上例所示的循环。

3.4、compare_exchange_weak()和compare_exchange_strong()使用场景对比

  • 在某些平台上,虽然使用compare_exchange_weak()可能导致佯败,但改用compare_exchange_strong()却会形成双重循环(因为compare_exchange_strong()自身内部含有一个循环),那么采用compare_exchange_weak()比较有利于性能。
  • 反之,如果存入的值需要耗时的计算,选择compare_exchange_strong()则更加合理。因为只要预期值没有变化,就可避免重复计算。

另外比较-交换函数中,关于内存次序这个参数我们就不再说了,感兴趣的可以看书籍。

五、操作std:atomic<T*>

1、简介

  • 指向类型T的指针,其原子化形式为 std::atomic<T*> 类似于原子化的布尔类型std::atomic。
  • 两者的接口相同,但操作目标从布尔类型变成相应的指针类型。
  • 它与std::atomic相似,同样不能拷贝复制或拷贝赋值。

2、原子操作、原子运算

  • 原子操作
    根据类模板的定义,std:atomic<T*>也具备成员函数:is_lock_free()、load()、store()、exchange()、compare_exchange_weak()和compare_exchange_strong(),它们与std::atomic<bool>中的对应函数有着相同的语义,但接收的参数和返回值不再是布尔类型,而是T*类型。
  • 原子运算
    std:atomic<T*>提供的新操作是算术形式的指针运算。成员函数
    fetch_add():就对象中存储的地址进行原子化加;
    fetch_sub():就对象中存储的地址进行原子化减;

3、demo

#include <iostream>
#include <atomic>
#include<cassert>using namespace std;class foo {};int main()
{foo foo_array[5];// 可以和boo类型类比,定义一个foo*指针,初始值是数组的第一个对象。atomic<foo*> p(foo_array);foo* x = p.fetch_add(2); // 令p+2,返回旧址。assert(x==foo_array);assert(p.load() == &foo_array[2]);x = (p -= 1);     //令p-1,返回新值assert(x == &foo_array[1]);assert(p.load() == &foo_array[1]);return 0;
}

六、标准整数原子类型

在std::atomic<int>或std::atomic<unsigned long long>这样的整数类型上,我们可以指向的操作颇为齐全。包括:

  • 常用原子操作:is_lock_free()、load()、store()、exchange()、compare_exchange_weak()、compare_exchange_strong();
  • 原子运算:fetch_add()、fetch_sub()、fetch_and()、fetch_or()、fetch_xor();
  • 这些运算的符合赋值形式:+=、-=、&=、|=、^=;
  • 前后缀形式的自增、自减:++x、x++、–x、x–;

七、泛化的std::<>类模板

  • 主模板的存在,在除了标准原子类型之外,允许用户使用自定义类型创建一个原子变量。不 是任何自定义类型都可以使用std::atomic<> 的:需要满足一定的标准才行。为了使用 std::atomic (UDT是用户定义类型),这个类型必须有拷贝赋值运算符。这就意味着这个类型不能有任何虚函数或虚基类,以及必须使用编译器创建的拷贝赋值操作。不仅仅是这 些,自定义类型中所有的基类和非静态数据成员也都需要支持拷贝赋值操作。这(基本上)就允 许编译器使用memcpy(),或赋值操作的等价操作,因为它们的实现中没有用户代码。

  • 最后,这个类型必须是“位可比的”(bitwise equality comparable)。这与对赋值的要求差不多; 你不仅需要确定,一个UDT类型对象可以使用memcpy()进行拷贝,还要确定其对象可以使用 memcmp()对位进行比较。之所以要求这么多,是为了保证“比较/交换”操作能正常的工作。

八、原子操作的内存次序

内存次序共6种,分3种模式:

  • 先后一致次序 :memory_order_seq_cst;
  • 宽松次序 :memory_order_relaxed;
  • 获取释放次序 :memory_order_consume、memory_order_acquire、memory_order_release、memory_order_acq_rel;

库中所有原子操作的默认行为提供先后一致次序(也叫序列一致顺序)。

至于每个的区别我们在这里就不讨论了,感兴趣的可以通过文后的参考链接和书籍,自行研究。

九、c++原子操作实现自旋锁

参见【并发编程十四】c++原子操作实现自旋锁

参考:
1、https://www.apiref.com/cpp-zh/cpp/thread.html
2、《c++并发编程实战(第二版)》安东尼.威廉姆斯 著;吴天明 译;

【并发编程十三】c++原子操作(1)相关推荐

  1. 并发编程-concurrent指南-原子操作类-AtomicInteger

    在java并发编程中,会出现++,--等操作,但是这些不是原子性操作,这在线程安全上面就会出现相应的问题.因此java提供了相应类的原子性操作类. 1.AtomicInteger 可以用原子方式更新的 ...

  2. 并发编程-concurrent指南-原子操作类-AtomicBoolean

    类AtomicBoolean 可以用原子方式更新的 boolean 值.有关原子变量属性的描述,请参阅 java.util.concurrent.atomic 包规范.AtomicBoolean 可用 ...

  3. Java Review - 并发编程_原子操作类LongAdder LongAccumulator剖析

    文章目录 概述 小Demo 源码分析 重要的方法 long sum() reset sumThenReset longValue() add(long x) longAccumulate(long x ...

  4. 第十三章:python中的并发编程详细讲解

    文章目录 第十三章:并发编程 一.操作系统的基本介绍 (一) 多道技术 一.空间上的复用 二.时间上的复用 (二) 操作系统的作用 (三) 多道技术总结 二.并发编程之进程 (一) 基本概念 一.什么 ...

  5. 并发编程(十三):阻塞队列之ArrayBlockingQueue

    一,关联源码链接 * 并发编程(四):AbstractQueuedSynchronizer源码分析 * 并发编程(五):AQS之重入锁ReentrantLock * 并发编程(七):AQS之Condi ...

  6. 这些年,为保住阿里饭碗学习的并发编程

    一.synchronized 一.原子性.有序性.可见性 1.1 原子性 数据库的事务:ACID A:原子性-事务是一个最小的执行的单位,一次事务的多次操作要么都成功,要么都失败. 并发编程的原子性: ...

  7. Java 并发编程 常见面试总结

    目录 一. Socket流阻塞 二.  wait和notify 三. 线程实现的两种方式 四. synchronized同步代码块示例 五. ReentrantLock的方法示例 六. Lock和sy ...

  8. 纯干货 | 大佬总结的 20 个高并发编程知识点!

    点击蓝色"架构文摘"关注我哟 加个"星标",每天上午 09:25,干货推送! 转载自并发编程网 – ifeve.com 一.前言 借用Java并发编程实践中的话 ...

  9. java虚拟机线程调优与底层原理分析_Java并发编程——多线程的底层原理

    " Java代码在编译后会变成Java字节码,字节码被类加载器加载到JVM里,JVM执行字节码,最终需要转化为汇编指令在CPU上执行,Java中所使用的并发机制依赖于JVM的实现和 CPU的 ...

最新文章

  1. AR的平面检测和利用SceneKit构建几何体
  2. 谨慎使用Hibernate中的本机SQL
  3. 重写RadGrid及其注意事项
  4. 正则表达式---重复
  5. 轻量级性能测试工具之Apache Benchmark
  6. 高德地图,百度地图坐标系GPS的转化
  7. abaqus算出来的转角单位是什么_abaqus单位等等
  8. 联想 M7600d 激光一体机清零方法
  9. EasyAR(一)——显示模型
  10. 易语言 html做ui,易语言皮冯 易语言DirectUI界面库你的硬件也可美化超漂亮!
  11. Android - View 和 ViewGroup
  12. 智能客服搭建(5) - FreeSWITCH + mod_unimrcp + ESL 开发对接
  13. mysql中with...as用法
  14. 专家修炼-学习的方法
  15. linux 中的 ln 命令,Linux中ln命令的用法以及分析
  16. 第四章第四题(几何:六边形面积)(Geometry: area of a hexagon)
  17. Codeforces 1610C Keshi Is Throwing a Party
  18. Android反编译工具与实践
  19. 考研逻辑整理 - 类比推理和归纳推理
  20. Docker 部署ElasticSearch + Kibana

热门文章

  1. 014 Python语法之类与对象
  2. 小米android7.1机型,心目中最牛逼的小米旗舰机:支持安卓7.1+骁龙801
  3. Aphelion 報[LDAP:error code 53 - Datebase is in ReadOnly mode]錯誤
  4. java mix audio_audio_mix-master
  5. 庭审智能语音识别系统及数字审委会系统
  6. 关于手机游戏的个人谈
  7. Mac启动Openfire时提示“系统偏好设置错误”
  8. java计算机毕业设计住房公积金筹集子系统的网站系统源码+mysql数据库+系统+部署+lw文档
  9. ShaderToy(二)画笑脸
  10. 2020年京喜无货源横空出世,京喜店群好做吗?该怎么去做?