CSP(Communicating sequential processes)

这东西我一开始以为很简单,后面差了资料发现它独树一帜,自己是一门语言,也是一套理论。这边我不深入的对它做过多的见解,我怕耽误大家=_=,大家可以看看wiki。

wiki:https://en.wikipedia.org/wiki/Communicating_sequential_processes

我们从Go的角度对它进行一些分析,摘抄一段概要:

“用于描述两个独立的并发实体通过共享的通讯 channel(管道)进行通信的并发模型。 CSP中channel是第一类对象,它不关注发送消息的实体,而关注与发送消息时使用的channel。”

好了,单独写出 CSP 是为了让大家了解这是一套独立于语言的东西,大家有兴趣可以查看wiki和搜索一些其它资料。

在Go中的CSP

Channel(通道)

Goroutine(不知道怎么翻译,大家可以理解成一个“工作者”,不是工作者线程。本质是实现了协程。)

协程(提升并发的利器)

大家都很明白线程能做什么,但协程是个什么东西?比起线程又如何呢?

线程

我们重新思考一些东西。

CPU:核心、超线程

OS:线程

编程语言:线程池

这边不做细讲,只是大概点到一下。

我们所做的任何计算都要经由CPU计算,而CPU的核数直接决定了我们能给CPU执行几件事情。

我们现在所常用的OS内部都有一个轮询,用时间片的形式来分配任何轮流使用CPU执行计算,线程就是这些任务的载体。

这块的概念非常庞大(还有牵扯到,什么是并发,什么事并行),本文的重点不是这些,大家有兴趣后面可以单独开一篇文章来解释这块的内容。

回归本文,现在我们知道线程是操作系统级别用来共享CPU的一种技术实现,多线程编程早在各大语言遍地开花,被用的惟妙惟肖,百花齐放。

那么为什么需要协程呢?

线程的开销

这块又是一个大知识点,这边也不多做介绍。

大家只要明白,线程并不是廉价的,一个线程的创立有至少两点的开销

  1. 内存

  2. 调度器压力(线程上下文切换等)

线程是可以持有逻辑数据的(比如,HttpContext.Current,等对象)所以必定是占用内存的(至于占用了多少内存不同的语言和OS不一样)

如果一个CPU是4核的,同时就只能处理4件任务,一个OS的线程越多他们轮训一整圈所耗的时间就更长。而每次调度线程时都需要复制当前线程上下文的状态,再去读取准备调度线程上下文的状态。

这边可以看到最后一点,有时候多线程反而会比单线程更加的慢,所以多线程提升性能本质上其实是假的。多线程并不会提升程序性能。

我知道这边肯定有人会心存疑问,绝大数的人都说用多线程来提升性能,为什么这边说多线程会比单线程慢?

我们这边想一下:PHP 和 NodeJS,PHP默认不支持多线程,NodeJS采用单线程事件轮询,他们的效率比拥有多线程的语言低吗?并不会。

多线程之所以快是因为作弊,别人一个人干的事情你叫两个人去干当然会比单线程快。这也有非常大的限制,多线程所执行的东西尽可能避免共享,不然你的效率还是可能不如单线程。

这边说的有点跑题,这块的内容实在太大,大家只要知道,线程即使不昂贵也绝不廉价。

针对这个问题,各大语言都推出了一个叫做线程池的技术,我申请一批线程,持有他,等到有任务的时候直接使用,这样我就不会频繁的创建和销毁线程了。这样大大提升了效率。

在.NET中,很早就提倡任何需要线程的时刻都使用 ThreadPool。

ps:现在觉大多数(我还没见过)的语言(runtime)中,线程与操作系统的线程是一一对应的。

回归协程

协程与线程是一对多的关系,有多个协程会对应到一根线程上。跟线程和CPU是一样的关系。

线程是为了共享CPU,而协程是为了共享线程。

协程是应用层面的自有“线程”实现。也就是说在不改变OS的线程逻辑下,自己构建了一套 “线程”系统。

为什么不直接改动OS的线程,让其更轻?我个人觉得 1是历史兼容性问题,2是必要性问题,线程是一个很好的抽象逻辑。实现协程完全可以通过线程来完成。

协程的目的

我们来思考一个场景

抓取百度、google、bing的html。

多线程的做法是

启动三个线程,分别对百度、google、bing发起HTTP GET请求。这时候使用了三个线程。

协程的做法是(极端)

启动一个线程对百度发起HTTP GET请求,将任务放入队列,在对google发起HTTP GET请求,将任务放入队列,在对bingHTTP GET请求将任务放入队列。

这时候只需要使用一个线程(极端情况下,其实大多数实现来说至少需要两个线程,因为需要有一个后台线程去监听任务队列,当任务完成后再分配一个可用线程去处理下面的逻辑)

为什么说极端情况下?因为协程有时候也可能会与线程一一对应,比如你的CPU有8个核心,同时跑4个协程也有可能会分配4根线程单独去处理这4个任务,这主要取决于调度算法。

总结:协程是为了提升线程利用率,减少线程的无用功(大多数是IO堵塞),协程也更适合IO密集型的场景。

回到目录

C#中的协程

可以看到,3个任务是异步执行的,但都由线程4来处理,也就是说三个异步任务只用了一根线程。

C#中的CSP

讲了这么大篇幅的协程,终于回归了今天的主题。

其实单单实现CSP来说根本不用理清线程和协程。但今天主要对比的是Go中的CSP,所以如果没有协程基本是没有意义的。

C#如何对应,CSP中最重要的Channel呢?

答案就是:BlockingCollection<T>

我们来看一个例子

抓取一批网站并输出网站的title

发起 HTTP GET 请求 和分析Title的代码逻辑如下:

主程序的代码如下:

执行逻辑

  1. 启用一个生产者协程来根据url生产对应的html、同时使用主线程消费队列内的内容(异步)

  2. 每个url单独起一个协程来发起HTTP GET请求

  3. 生产者协程等待所有url的html全部加载完成

  4. 标志队列完成

  5. 主线程退出

执行结果如下:

Go协程与.NET协程的区别?

去除实现上的一些逻辑,本质上没太多区别。

但Go有一个天生优势就是它是新时代的语言,抛弃了线程。也就是说Go层面没有线程的东西,它只有协程。

但.NET中线程已经拥有了好多年,大量的类库、驱动使用线程来完成。

所以你在上一层就算使用了协程,执行到底部不一定只有一根线程来完成,底部可以自己创建线程来运行逻辑,今天篇幅关系不做过多说明。后面我们在介绍这块的内容。

写在最后

最后总结一个要点,多线程、协程并不能提升性能,它们所达到的目的只是提高CPU利用率。

今天本来想详细写BlockingCollection<T>的使用说明,但协程等概念占了大量的篇幅,后面我们再来详细介绍.NET中的异步编程。

.NET技术栈QQ群:384413261(点击加入 .NET Group)

相关文章:

  • 解析Visual C# 7.2中的private protected访问修饰符

  • C# - Span 全面介绍:探索 .NET 新增的重要组成部分

  • C#中的原子操作Interlocked,你真的了解吗?

  • C# 7.1、7.2特性追踪

  • SIMD via C#

  • C#中的两把双刃剑:抽象类和接口

原文:https://www.cnblogs.com/ants/p/8601947.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com 

Golang的CSP很酷?其实.NET也可以轻松完成相关推荐

  1. 上周热点回顾(3.19-3.25)

    热点随笔: · 不谈面试题,谈谈招聘时我喜欢见到的特质(dino.c) · ASP.NET Core 2.0 : 七.一张图看透启动背后的秘密(FlyLolo) · 用Node.js写爬虫,撸羞羞的图 ...

  2. 并发机制:CSP vs Actor模型以及Golang实现

    作者:花与火山石 原文链接:https://blog.csdn.net/qq_32702033/article/details/104415434 CSP & Actor Model 本文将简 ...

  3. golang游戏服务器项目,基于Golang的游戏服务器框架cellnet开发日记(一)

    启程的故事 使用Golang写服务器是一件非常幸福的事情. 不用长时间的等待编译, 零依赖部署. 开发效率高, 多出的时间陪陪家人, 看书充充电多好. 所以Golang就像是手机界的苹果, 从发布后, ...

  4. Go 语言编程 — GPM 与 CSP 高并发模型

    目录 文章目录 目录 GPM 调度模型 基本概念 G(Goroutine) P(Processor) M(Machine) Golang Runtime Scheduler M:N 两级线程调度模型 ...

  5. golang 面试题(从基础到高级)

    Golang面试问题汇总: 1.Golang中除了加Mutex锁以外还有哪些方式安全读写共享变量? Golang中Goroutine 可以通过 Channel 进行安全读写共享变量. 2.无缓冲 Ch ...

  6. GOlang后端面经(2022.03.11,周五,天气晴)

    1.Golang中除了加Mutex锁以外还有哪些方式安全读写共享变量. Golang中Goroutine 可以通过 Channel 进行安全读写共享变量,还可以通过原子性操作进行. 2.无缓冲Chan ...

  7. 用golang重写SS帐号获取脚本

    Golang有个很酷的特性可以跨平台编译生成该平台的二进制可执行文件,虽然python也能通过其他工具生成相应平台的二进制文件,但是还是觉得太别扭了,通过golang写一次,然后生成相应平台的二进制文 ...

  8. Go 语言编程 — Profiling 性能分析

    目录 文章目录 目录 Profiling runtime MemStat GC pprof trace Profiling Golang 提供了友好的工程化支持,其中之一就是 Profiling(分析 ...

  9. fmt打印不显示 go_程序猿学Go: 日志系统

    一:log日志包 Golang的log包短小精悍,可以非常轻松的实现日志打印转存功能.不用多说,log支持并发操作(即协程安全-相对于JAVA中的线程安全而言),其结构定义如下: type Logge ...

最新文章

  1. 学习Java编程培训的书籍有哪些
  2. 数据库收缩:NOTRUNCATE与TRUNCATEONLY
  3. pandas 删除数据
  4. npm的一些常用命令(在国内,建议使用cnpm,在淘宝镜像里面下载就行)
  5. mysql2阶段提交具体实现_ShardingSphere 4.x 分布式事务之实现原理
  6. Cowboy 源码分析(十八)
  7. 什么是掼蛋游戏呼叫中心
  8. 【ES11(2020)】Dynamic Import 动态引入
  9. OpenSUSE下支持托盘的邮件客户端Sylpheed
  10. (03)FPGA与CPLD区别
  11. python制表符_关于ROS运行python的一些问题
  12. Linux SHELL 学习随笔--for 循环
  13. 删除python读取的txt每一行尾部的\n
  14. 生日快乐编程代码_「世界上最好的编程语言」,刚刚度过了25周岁生日
  15. 凸优化第七章统计估计 7.1参数分布估计
  16. JavaScript基础功能代码实现
  17. CAD绘图教程之CAD中怎么进行消防计算?
  18. 51单片机学习7-最小系统protel原理图的绘制
  19. C语言基础之类型定义
  20. 临沂大学 计算机学院,2018临沂大学首届计算机文化节组织动员大会

热门文章

  1. vue-cli 3.0配置webpack目录别名alias
  2. nginx源码学习Unix - Unix域协议
  3. c/c++ code JSON
  4. 使用Mutex實現單一程式執行個體的注意事項(转)
  5. Java基础---变量(三)
  6. Akka2使用探索3(Duration 和 Deadline)
  7. [文摘]标准的软件开发过程
  8. 面向.NET开发人员的Dapr——前言
  9. VS2019 调试技巧之附加进程
  10. C#中形态各异的class