corutine rust_corutine rust_rust 异步 IO：从 mio 到 coroutine

辣鸡知乎连目录都不能打。推荐阅读原文rust asynchronous io - 李晨曦的博客 | Hexi Bloghexilee.me

引言

2018 年接近尾声，rust 团队勉强立住了异步 IO 的 flag，async 成为了关键字，Pin, Future, Poll 和 await! 也进入了标准库。不过一直以来实际项目中用不到这套东西，所以也没有主动去了解过。

最近心血来潮想用 rust 写点东西，但并找不到比较能看的文档(可能是因为 rust 发展太快了，很多都过时了)，最后参考这篇文章和 "new tokio"( romio ) 写了几个 demo，并基于 mio 在 coroutine 中实现了简陋的异步 IO。

最终效果如下：

// examples/async-echo.rs#![feature(async_await)]#![feature(await_macro)]#[macro_use]externcratelog;useasyncio::executor::{block_on,spawn,TcpListener};usefailure::Error;fn main()-> Result{env_logger::init();block_on(async{letmutlistener=TcpListener::bind(&"127.0.0.1:7878".parse().unwrap()).expect("TcpListener bind fail");info!("Listening on 127.0.0.1:7878");whileletOk((mutstream,addr))=await!(listener.accept()){info!("connection from {}",addr);spawn(asyncmove{letclient_hello=await!(stream.read()).expect("read from stream fail");letread_length=client_hello.len();letwrite_length=await!(stream.write(client_hello)).expect("write to stream fail");assert_eq!(read_length,write_length);stream.close();},).expect("spawn stream fail");}},)}

写这篇文章的主要目的是梳理和总结，同时也希望能给对这方面有兴趣的 Rustacean 作为参考。本文代码以易于理解为主要编码原则，某些地方并没有太考虑性能，还请见谅；但如果文章和代码中有明显错误，欢迎指正。

本文代码仓库在 Github (部分代码较长，建议 clone 下来用编辑器看)，所有 examples 在 nightly-x86_64-apple-darwin 2018 Edition 上均能正常运行。运行 example/async-echo 时设置 RUST_LOG 为 info 可以在 terminal 看到基本的运行信息，debug 则可见事件循环中的事件触发顺序。

异步 IO 的基石 - mio

mio 是一个极简的底层异步 IO 库，如今 rust 生态中几乎所有的异步 IO 程序都基于它。

随着 channel, timer 等 sub module 在 0.6.5 版本被标为 deprecated，如今的 mio 提供的唯二两个核心功能分别是：对操作系统异步网络 IO 的封装

用户自定义事件队列

第一个核心功能对应到不同操作系统分别是Linux(Android) => epoll

Windows => iocp

MacOS(iOS), FreeBSD => kqueue

Fuchsia =>

mio 把这些不同平台上的 API 封装出了一套 epoll like 的异步网络 API，支持 udp 和 tcp。除此之外还封装了一些不同平台的拓展 API，比如 uds，本文不对这些 API 做介绍。

异步网络 IO

下面是一个 tcp 的 demo

// examples/tcp.rsusemio::*;usemio::net::{TcpListener,TcpStream};usestd::io::{Read,Write,self};usefailure::Error;usestd::time::{Duration,Instant};constSERVER_ACCEPT: Token=Token(0);constSERVER: Token=Token(1);constCLIENT: Token=Token(2);constSERVER_HELLO: &[u8]=b"PING";constCLIENT_HELLO: &[u8]=b"PONG";fn main()-> Result{letaddr="127.0.0.1:13265".parse()?;// Setup the server socketletserver=TcpListener::bind(&addr)?;// Create a poll instanceletpoll=Poll::new()?;// Start listening for incoming connectionspoll.register(&server,SERVER_ACCEPT,Ready::readable(),PollOpt::edge())?;// Setup the client socketletmutclient=TcpStream::connect(&addr)?;letmutserver_handler=None;// Register the clientpoll.register(&client,CLIENT,Ready::readable()|Ready::writable(),PollOpt::edge())?;// Create storage for eventsletmutevents=Events::with_capacity(1024);letstart=Instant::now();lettimeout=Duration::from_millis(10);'top: loop{poll.poll(&mutevents,None)?;foreventinevents.iter(){ifstart.elapsed()>=timeout{break'top}matchevent.token(){SERVER_ACCEPT=>{let(handler,addr)=server.accept()?;println!("accept from addr: {}",&addr);poll.register(&handler,SERVER,Ready::readable()|Ready::writable(),PollOpt::edge())?;server_handler=Some(handler);}SERVER=>{ifevent.readiness().is_writable(){ifletSome(refmuthandler)=&mutserver_handler{matchhandler.write(SERVER_HELLO){Ok(_)=>{println!("server wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}ifevent.readiness().is_readable(){letmuthello=[0;4];ifletSome(refmuthandler)=&mutserver_handler{matchhandler.read_exact(&muthello){Ok(_)=>{assert_eq!(CLIENT_HELLO,&hello);println!("server received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}}CLIENT=>{ifevent.readiness().is_writable(){matchclient.write(CLIENT_HELLO){Ok(_)=>{println!("client wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}ifevent.readiness().is_readable(){letmuthello=[0;4];matchclient.read_exact(&muthello){Ok(_)=>{assert_eq!(SERVER_HELLO,&hello);println!("client received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}_=>unreachable!(),}}};Ok(())}

这个 demo 稍微有点长，接下来我们把它一步步分解。

直接看主循环

fn main(){// ...loop{poll.poll(&mutevents,None).unwrap();// ...}}

每次循环都得执行 poll.poll，第一个参数是用来存 events 的 Events，容量是 1024；

letmutevents=Events::with_capacity(1024);

第二个参数是 timeout，即一个 Option，超时会直接返回。返回类型是 io::Result。其中的 usize 代表 events 的数量，这个返回值是 deprecated 并且会在之后的版本移除，仅供参考

这里我们设置了 timeout = None，所以当这个函数返回时，必然是某些事件被触发了。让我们遍历 events：

matchevent.token(){SERVER_ACCEPT=>{let(handler,addr)=server.accept()?;println!("accept from addr: {}",&addr);poll.register(&handler,SERVER,Ready::readable()|Ready::writable(),PollOpt::edge())?;server_handler=Some(handler);}SERVER=>{ifevent.readiness().is_writable(){ifletSome(refmuthandler)=&mutserver_handler{matchhandler.write(SERVER_HELLO){Ok(_)=>{println!("server wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}ifevent.readiness().is_readable(){letmuthello=[0;4];ifletSome(refmuthandler)=&mutserver_handler{matchhandler.read_exact(&muthello){Ok(_)=>{assert_eq!(CLIENT_HELLO,&hello);println!("server received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}}CLIENT=>{ifevent.readiness().is_writable(){matchclient.write(CLIENT_HELLO){Ok(_)=>{println!("client wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}ifevent.readiness().is_readable(){letmuthello=[0;4];matchclient.read_exact(&muthello){Ok(_)=>{assert_eq!(SERVER_HELLO,&hello);println!("client received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}_=>unreachable!(),}

我们匹配每一个 event 的 token，这里的 token 就是我用来注册的那些 token。比如我在上面注册了 server

// Start listening for incoming connectionspoll.register(&server,SERVER_ACCEPT,Ready::readable(),PollOpt::edge()).unwrap();

第二个参数就是 token

constSERVER_ACCEPT: Token=Token(0);

这样当 event.token() == SERVER_ACCEPT 时，就说明这个事件跟我们注册的 server 有关，于是我们试图 accept 一个新的连接并把它注册进 poll，使用的 token 是 SERVER。

let(handler,addr)=server.accept().unwrap();println!("accept from addr: {}",&addr);poll.register(&handler,SERVER,Ready::readable()|Ready::writable(),PollOpt::edge())??;server_handler=Some(handler);

这样我们之后如果发现 event.token() == SERVER，我们就认为它和注册的 handler 有关：

ifevent.readiness().is_writable(){ifletSome(refmuthandler)=&mutserver_handler{matchhandler.write(SERVER_HELLO){Ok(_)=>{println!("server wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}ifevent.readiness().is_readable(){letmuthello=[0;4];ifletSome(refmuthandler)=&mutserver_handler{matchhandler.read_exact(&muthello){Ok(_)=>{assert_eq!(CLIENT_HELLO,&hello);println!("server received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}}

这时候我们还需要判断 event.readiness()，这就是 register 函数的第三个参数，叫做 interest，顾名思义，就是“感兴趣的事”。它的类型是 Ready，一共四种，readable, writable, error 和 hup，可进行并运算。

在上面我们给 handler 注册了 Ready::readable() | Ready::writable()，所以 event 可能是 readable 也可能是 writable，所以我们要经过判断来执行相应的逻辑。注意这里的判断是

if...{...}if...{...}

而非

if...{...}elseif...{...}

因为一个事件可能同时是 readable 和 writable。

容错性原则

大概逻辑先讲到这儿，这里先讲一下 mio 的“容错性原则”，即不能完全相信 event。

可以看到我上面有一段代码是这么写的

server.accept() 返回的是 io::Result。如果我们选择完全相信 event 的话，在这里 unwrap() 并没有太大问题 —— 如果真的有一个新的连接就绪，accept() 产生的 io::Result 是我们无法预料且无法处理的，我们应该抛给调用者或者直接 panic。

但问题就是，我们可以认为 event 的伪消息是可预料的，可能并没有一个新的连接准备就绪，这时候我们 accept() 会引发 WouldBlock Error。但我们不应该认为 WouldBlock 是一种错误 —— 这是一种友善的提醒。server 告诉我们：“并没有新的连接，请下次再来吧。”，所以在这里我们应该忽略(可以打个 log)它并重新进入循环。

像我后面写的那样：

matchclient.write(CLIENT_HELLO){Ok(_)=>{println!("client wrote");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}

Poll Option

好了，现在我们可以运行：

[async-io-demo] cargo run --example tcp

terminal 里打印出了

client wrote

accept from addr: 127.0.0.1:53205

client wrote

server wrote

server received

...

我们可以发现，在短短的 10 millis 内(let timeout = Duration::from_millis(10);)，server 和 client 分别进行了数十次的读写！

如果我们不想进行这么多次读写呢？比如，我们只想让 server 写一次。在网络比较通畅的情况下，client 和 server 几乎一直是可写的，所以 Poll::poll 在数微秒内就返回了。

这时候就要看 register 的第四个参数了。

poll.register(&server,SERVER_ACCEPT,Ready::readable(),PollOpt::edge()).unwrap();

PollOpt::edge() 的类型是 PollOpt，一共有 level, edge, oneshot 三种，他们有什么区别呢？

比如在我上面的代码里，

ifevent.readiness().is_readable(){letmuthello=[0;4];matchclient.read_exact(&muthello){Ok(_)=>{assert_eq!(SERVER_HELLO,&hello);println!("client received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>continue,err=>{err?;}}}

我在收到一个 readable readiness 时，只读了四个字节。如果这时候缓冲区里有八字节的数据，那么：如果我注册时使用 PollOpt::level()，我在下次 poll 时一定还能收到一次 readable readiness event (只要我没有主动执行 set_readiness(Read::empty()))；

如果我注册时使用 PollOpt::edge()，我在下次 poll 时不一定还能收到一次 readable readiness event；

所以，使用 PollOpt::edge() 时有一个“排尽原则(Draining readiness)”，即每次触发 event 时一定要操作到资源耗尽返回 WouldBlock，即上面的代码要改成：

ifevent.readiness().is_readable(){letmuthello=[0;4];loop{matchclient.read_exact(&muthello){Ok(_)=>{assert_eq!(SERVER_HELLO,&hello);println!("client received");}Err(referr)iferr.kind()==io::ErrorKind::WouldBlock=>break,err=>{err?;}}}}

那么，oneshot 又是怎样的行为呢？让我们回到上面的问题，如果我们只想让 handler 写一次，怎么办 —— 注册时使用 PollOpt::oneshot()，即

let(handler,addr)=server.accept()?;println!("accept from addr: {}",&addr);poll.register(&handler,SERVER,Ready::readable()|Ready::writable(),PollOpt::oneshot())?;server_handler=Some(handler);

这样的话，你只能收到一次 SERVER 事件，除非你使用 Poll::reregister 重新注册 handler。Poll::reregister 可以更改 PollOpt 和 interest

Still Block

其实上面这个 demo 还存在一个问题，即我们在回调代码块中使用了同步的 IO 操作 println!。我们要尽可能避免在回调的代码块里使用耗时的 IO 操作。

考虑到文件 IO (包括 Stdin, Stdout, Stderr) 速度很慢，我们只需要把所有的文件 IO 交给一个线程进行即可。

usestd::sync::mpsc::{Sender,Receiver,channel,SendError};#[derive(Clone)]pubstruct Fs{task_sender: Sender,}implFs{pubfn new()-> Self{let(sender,receiver)=channel();std::thread::spawn(move||{loop{matchreceiver.recv(){Ok(task)=>{matchtask{Task::Println(refstring)=>println!("{}",string),Task::Exit=>return}},Err(_)=>{return;}}}});Fs{task_sender: sender}}pubfn println(&self,string: String){self.task_sender.send(Task::Println(string)).unwrap()}}pubenum Task{Exit,Println(String),}

之后，可以使用 Fs::println 替换所有的 println!。

自定义事件

上面我们实现异步 println 比较简单，这是因为 println 并没有返回值，不需要进行后续操作。设想一下，如果要我们实现 open 和 ready_to_string，先异步地 open 一个文件，然后异步地 read_to_string，最后再异步地 println, 我们要怎么做？

最简单的写法是回调，像这样：

// src/fs.rsusecrossbeam_channel::{unbounded,Sender};usestd::fs::File;usestd::io::Read;usestd::boxed::FnBox;usestd::thread;usefailure::Error;#[derive(Clone)]pubstruct Fs{task_sender: Sender,}pubstruct FsHandler{io_worker: thread::JoinHandle>,executor: thread::JoinHandle>,}pubfn fs_async()-> (Fs,FsHandler){let(task_sender,task_receiver)=unbounded();let(result_sender,result_receiver)=unbounded();letio_worker=std::thread::spawn(move||{loop{matchtask_receiver.recv(){Ok(task)=>{matchtask{Task::Println(refstring)=>println!("{}",string),Task::Open(path,callback,fs)=>{result_sender.send(TaskResult::Open(File::open(path)?,callback,fs))?}Task::ReadToString(mutfile,callback,fs)=>{letmutvalue=String::new();file.read_to_string(&mutvalue)?;result_sender.send(TaskResult::ReadToString(value,callback,fs))?}Task::Exit=>{result_sender.send(TaskResult::Exit)?;break;}}}Err(_)=>{break;}}}Ok(())});letexecutor=std::thread::spawn(move||{loop{letresult=result_receiver.recv()?;matchresult{TaskResult::ReadToString(value,callback,fs)=>callback.call_box((value,fs))?,TaskResult::Open(file,callback,fs)=>callback.call_box((file,fs))?,TaskResult::Exit=>break};};Ok(())});(Fs{task_sender},FsHandler{io_worker,executor})}implFs{pubfn println(&self,string: String)-> Result{Ok(self.task_sender.send(Task::Println(string))?)}pubfn open(&self,path: &str,callback: F)-> ResultwhereF: FnOnce(File,Fs)-> Result+Sync+Send+'static{Ok(self.task_sender.send(Task::Open(path.to_string(),Box::new(callback),self.clone()))?)}pubfn read_to_string(&self,file: File,callback: F)-> ResultwhereF: FnOnce(String,Fs)-> Result+Sync+Send+'static{Ok(self.task_sender.send(Task::ReadToString(file,Box::new(callback),self.clone()))?)}pubfn close(&self)-> Result{Ok(self.task_sender.send(Task::Exit)?)}}implFsHandler{pubfn join(self)-> Result{self.io_worker.join().unwrap()?;self.executor.join().unwrap()}}type FileCallback=Box Result+Sync+Send>;type StringCallback=Box Result+Sync+Send>;pubenum Task{Exit,Println(String),Open(String,FileCallback,Fs),ReadToString(File,StringCallback,Fs),}pubenum TaskResult{Exit,Open(File,FileCallback,Fs),ReadToString(String,StringCallback,Fs),}// examples/fs.rsuseasyncio::fs::fs_async;usefailure::Error;constTEST_FILE_VALUE: &str ="Hello, World!";fn main()-> Result{let(fs,fs_handler)=fs_async();fs.open("./examples/test.txt",|file,fs|{fs.read_to_string(file,|value,fs|{assert_eq!(TEST_FILE_VALUE,&value);fs.println(value)?;fs.close()})})?;fs_handler.join()?;Ok(())}

测试

[async-io-demo] cargo run --example fs

这样写在逻辑上的确是对的，但是负责跑 callback 的 executor 线程其实被负责 io 的线程阻塞住了(result_receiver.recv())。那我们能不能在 executor 线程里跑一个事件循环，以达到不被 io 线程阻塞的目的呢？(即确定 result_receiver 中有 result 时，executor 才会进行 result_receiver.recv()).

这就到了体现 mio 强大可拓展性的时候：注册用户态的事件队列。

把上面的代码稍加修改，就成了这样：

// src/fs_mio.rsusecrossbeam_channel::{unbounded,Sender,TryRecvError};usestd::fs::File;usestd::io::{Read};usestd::boxed::FnBox;usestd::thread;usefailure::Error;usestd::time::Duration;usemio::*;#[derive(Clone)]pubstruct Fs{task_sender: Sender,}pubstruct FsHandler{io_worker: thread::JoinHandle>,executor: thread::JoinHandle>,}constFS_TOKEN: Token=Token(0);pubfn fs_async()-> (Fs,FsHandler){let(task_sender,task_receiver)=unbounded();let(result_sender,result_receiver)=unbounded();letpoll=Poll::new().unwrap();let(registration,set_readiness)=Registration::new2();poll.register(&registration,FS_TOKEN,Ready::readable(),PollOpt::oneshot()).unwrap();letio_worker=std::thread::spawn(move||{loop{matchtask_receiver.recv(){Ok(task)=>{matchtask{Task::Println(refstring)=>println!("{}",string),Task::Open(path,callback,fs)=>{result_sender.send(TaskResult::Open(File::open(path)?,callback,fs))?;set_readiness.set_readiness(Ready::readable())?;}Task::ReadToString(mutfile,callback,fs)=>{letmutvalue=String::new();file.read_to_string(&mutvalue)?;result_sender.send(TaskResult::ReadToString(value,callback,fs))?;set_readiness.set_readiness(Ready::readable())?;}Task::Exit=>{result_sender.send(TaskResult::Exit)?;set_readiness.set_readiness(Ready::readable())?;break;}}}Err(_)=>{break;}}}Ok(())});letexecutor=thread::spawn(move||{letmutevents=Events::with_capacity(1024);'outer: loop{poll.poll(&mutevents,Some(Duration::from_secs(1)))?;foreventinevents.iter(){matchevent.token(){FS_TOKEN=>{loop{matchresult_receiver.try_recv(){Ok(result)=>{matchresult{TaskResult::ReadToString(value,callback,fs)=>callback.call_box((value,fs))?,TaskResult::Open(file,callback,fs)=>callback.call_box((file,fs))?,TaskResult::Exit=>break'outer}}Err(e)=>{matche{TryRecvError::Empty=>break,TryRecvError::Disconnected=>Err(e)?}}}}poll.reregister(&registration,FS_TOKEN,Ready::readable(),PollOpt::oneshot())?;}_=>unreachable!()}}};Ok(())});(Fs{task_sender},FsHandler{io_worker,executor})}implFs{pubfn println(&self,string: String)-> Result{Ok(self.task_sender.send(Task::Println(string))?)}pubfn open(&self,path: &str,callback: F)-> ResultwhereF: FnOnce(File,Fs)-> Result+Sync+Send+'static{Ok(self.task_sender.send(Task::Open(path.to_string(),Box::new(callback),self.clone()))?)}pubfn read_to_string(&self,file: File,callback: F)-> ResultwhereF: FnOnce(String,Fs)-> Result+Sync+Send+'static{Ok(self.task_sender.send(Task::ReadToString(file,Box::new(callback),self.clone()))?)}pubfn close(&self)-> Result{Ok(self.task_sender.send(Task::Exit)?)}}implFsHandler{pubfn join(self)-> Result{self.io_worker.join().unwrap()?;self.executor.join().unwrap()}}type FileCallback=Box Result+Sync+Send>;type StringCallback=Box Result+Sync+Send>;pubenum Task{Exit,Println(String),Open(String,FileCallback,Fs),ReadToString(File,StringCallback,Fs),}pubenum TaskResult{Exit,Open(File,FileCallback,Fs),ReadToString(String,StringCallback,Fs),}// examples/fs-mio.rsuseasyncio::fs_mio::fs_async;usefailure::Error;constTEST_FILE_VALUE: &str ="Hello, World!";fn main()-> Result{let(fs,fs_handler)=fs_async();fs.open("./examples/test.txt",|file,fs|{fs.read_to_string(file,|value,fs|{assert_eq!(TEST_FILE_VALUE,&value);fs.println(value)?;fs.close()})})?;fs_handler.join()?;Ok(())}

可以注意到，上面的代码发生的改变就是，executor 不再被 result_receiver.recv 阻塞，而变成了注册事件(registration)后等待 Poll::poll 返回事件；只有等到了新的事件，才会进行 result_receiver.try_recv。同时，io_worker 线程在 send result 之后会执行 set_readiness.set_readiness(Ready::readable())?;，以通知 executor 线程对相应结果做处理。

这样的话，executor 就不会被 io worker 阻塞了，因为我们可以把所有的事件都注册到 executor 上，mio::Poll 会同时监听多个事件(比如把 fs 和 tcp 结合起来)。

测试

[async-io-demo] cargo run --example fs-mio

Callback is evil

既然文件 IO 的 executor 不再会被 io worker 线程阻塞了，那我们来试试让 fs 和 tcp 共用一个 poll 然后建立一个简单的文件服务器吧。

但可以先等等，因为我已经开始觉得写 callback 有点难受了 —— 如果我们还想处理错误的话，会觉得更难受，像这样

useasyncio::fs_mio::fs_async;usefailure::Error;constTEST_FILE_VALUE: &str ="Hello, World!";fn main()-> Result{let(fs,fs_handler)=fs_async();fs.open("./examples/test.txt",|file,fs|{fs.read_to_string(file,|value,fs|{assert_eq!(TEST_FILE_VALUE,&value);fs.println(value,|err|{...});fs.close()},|err|{...})},|err|{...})?;fs_handler.join()?;Ok(())}

而且对 rust 来说，更加艰难的是闭包中的生命周期问题(闭包几乎不能通过捕获来借用环境变量)。这就意味着，如果我要借用环境中的某个变量，我要么 clone 它(如果它实现了 Clone 的话)，要么把它作为闭包参数传入(意味着你要根据需要改每一层回调函数的签名，这太屎了)。

考虑到各种原因，rust 最终选择用 coroutine 作为异步 IO 的 API 抽象。

coroutine

这里所说的 coroutine 是指基于 rust generator 的 stackless coroutine 而非早期被 rust 抛弃的 green thread(stackful coroutine)。

generator

rust 大概在今年五月份引入了 generator，但到现在还是 unstable 的 —— 虽说也没多少人用 stable(误

一个典型的斐波那契 generator 如下

// examples/fab.rs#![feature(generators, generator_trait)]usestd::ops::{Generator,GeneratorState};fn main(){letmutgen=fab(5);loop{matchunsafe{gen.resume()}{GeneratorState::Yielded(value)=>println!("yield {}",value),GeneratorState::Complete(ret)=>{println!("return {}",ret);break;}}}}fn fab(mutn: u64)-> implGenerator{move||{letmutlast=0u64;letmutcurrent=1;yieldlast;whilen>0{yieldcurrent;lettmp=last;last=current;current=tmp+last;n-=1;}returnlast;}}

由于 generator 的“中断特性”，我们很自然的可以想到，如果用 generator 搭配 mio，给每个 generator 分配一个 token，然后 poll mio 的事件循环，收到一个唤醒事件就 resume 相应的 generator；每个 generator 在要阻塞的时候拿自己的 token 注册一个唤醒事件然后 yield，不就实现了“同步代码”的异步 IO 吗？

这样看来原理上来说已经稳了，但 rust 异步 IO 的天空依旧漂浮着两朵乌云。

自引用

第一朵乌云和 rust 自身的内存管理机制有关。

如果你写出这样的 generator

fn self_ref_generator()-> implGenerator{||{letx: u64 =1;letref_x: &u64 =&x;yield0;yield*ref_x;}}

rust 一定会给你抛个错然后告诉你 "borrow may still be in use when generator yields"。编译器没有教你怎么修正可能会让你有些恐慌，去不存在的搜索引擎上查了查，你发现这和 generator 的实现有关。

前文中提到，rust generator 是 stackless 的，即它并不会保留一个完整的栈，而是根据不同的状态保留需要的变量。如果你把上面的代码改成

fn no_ref_generator()-> implGenerator{||{letx: u64 =1;letref_x: &u64 =&x;yield*ref_x;yield0;}}

在第一次 yield 结束之后，编译器会发现 generator 唯一需要保留的是字面量 0，所以这段代码可以顺利编译通过。但是，对于前面的 generator，第一次 yield 过后，编译器发现你需要同时保留 x 和它的引用 ref_x，这样的话 generator 就会变成类似这样的结构(仅供参考)：

enum SomeGenerator{...SomeState{_yield: u64,x: u64

ref_x: &'au64}...}

这就是 rust 中“臭名昭著” 的自引用，下面这段代码会发生什么呢

struct A{b: u64,ref_b: Option}implA{fn new()-> Self{letmuta=A{b: 1,ref_b: None};a.ref_b=Some(&a.b);a}}

你会发现它编译不过，当然这是很合理的，栈上的 a 变量拷贝出去之后其成员 b 的引用会失效，rust的生命周期机制帮你规避了这个问题。但即使你改成这样

usestd::borrow::{BorrowMut};struct A{b: u64,ref_b: Option}implA{fn boxed()-> Box{letmuta=Box::new(A{b: 1,ref_b: None});letmut_ref: &mutA=a.borrow_mut();mut_ref.ref_b=Some(&mut_ref.b);a}}

这样按道理来说是没问题的，因为 a 的实体已经在堆上了，即使你拷贝它在栈上的引用，也不会改变其成员 b 的地址，引用一直是有效的 —— 但问题是，你没法跟编译器解释这事，编译器认为函数里面的 &mut_ref.b只能活到函数结束，这样含有这个引用的 a 自然也不能 move 出来。

那你可能会想，那我就在外面再取引用就好了

struct A{b: u64,ref_b: Option}implA{fn new()-> Self{A{b: 1,ref_b: None}}}fn main(){letmuta=A::new();a.ref_b=Some(&a.b);}

这样的确没啥毛病，但是，你会发现自引用不仅阻止了 move，还阻止了你对 A 可变引用。。比如这样就编译不过

struct A{b: u64,ref_b: Option}implA{fn new()-> Self{A{b: 1,ref_b: None}}fn mute(&mutself){}}fn main(){letmuta=A::new();a.ref_b=Some(&a.b);a.mute();}

但远古的 Future::poll 签名就长这样

fn poll(&mutself)-> Poll<:item>;

而直到现在 Generator::resume 的签名还是这样

unsafefn resume(&mutself)-> GeneratorState<:yield>;

这样的话自引用会导致 generator 无法实现 Generator 和 Future

在这种情况下，我们可以使用 NonNull来避过编译器的检查

usestd::ptr::NonNull;struct A{b: u64,ref_b: NonNull}implA{fn new()-> Self{A{b: 1,ref_b: NonNull::dangling()}}}fn main(){letmuta=A::new();a.ref_b=NonNull::from(&a.b);}

这样的确没有了烦人的生命周期约束，但也意味着你要自己保证内存安全 —— 绝对不能 move，也不能对其可变引用使用 mem::replace 或 mem::swap ，这样非常不妙。

那有没有办法通过其它方式来保证能保证它不能被 move 或者取可变引用呢？这就是 pin的应用场景了。pin具体的内容可以看这篇 RFC，本文只是简要说明一下。

rust 默认给大部分类型实现了 trait std::marker::Unpin，这只是一个标记，表示这个类型 move 是安全的，这时候，Pin 跟 &'a mut T 没有区别，你也可以安全地通过 Pin::new(&mut T) 和 Pin::as_mut(self: &mut Pin)相互转换。

但对于不能安全 move 的类型，比如上面的 A，我们得先把它标记为 !Unpin，安全的标记方法是给它一个 !Unpin的成员，比如 Pinned。

#![feature(pin)]usestd::marker::{Pinned};usestd::ptr::NonNull;struct A{b: u64,ref_b: NonNull,_pin: Pinned,}implA{fn new()-> Self{A{b: 1,ref_b: NonNull::dangling(),_pin: Pinned,}}}fn main(){letmuta=A::new();letmutpinned=unsafe{Pin::new_unchecked(&muta)};letref_b=NonNull::from(&pinned.b);letmut_ref: Pin=pinned.as_mut();unsafe{Pin::get_mut_unchecked(mut_ref).ref_b=ref_b};letunmoved=pinned;assert_eq!(unmoved.ref_b,NonNull::from(&unmoved.b));}

从 !Unpin 的类型构建 Pin 总是 unsafe 的，它们通过 Pin::new_unchecked 和 Pin::get_mut_unchecked 相互转换。当然，我们在构建时是可以保证它是 safe ，我们只要完成这两个 unsafe的操作，就可以保证：永远不能 safe 地获得可变引用： Pin::get_mut_unchecked 是 unsafe 的

永远不能 safe 地 move：因为 Pin 只拥有可变引用，且由于Pin::get_mut_unchecked 是 unsafe 的，你不能 safe 地对其可变引用使用 mem::replace 或 mem::swap

当然，如果你不想在构建时使用 unsafe或者想获得 a 的所有权以便在函数间传递，你可以使用 Box::pinned从而把它分配在堆上

struct A{b: u64,ref_b: NonNull,_pin: Pinned,}implA{fn boxed()-> Pin>{letmutboxed=Box::pinned(A{b: 1,ref_b: NonNull::dangling(),_pin: Pinned,});letref_b=NonNull::from(&boxed.b);letmut_ref: Pin=boxed.as_mut();unsafe{Pin::get_mut_unchecked(mut_ref).ref_b=ref_b};boxed}}fn main(){letboxed=A::boxed();letunmoved=boxed;assert_eq!(unmoved.ref_b,NonNull::from(&unmoved.b));}

有了 Pin 之后，新版 Future 的定义就是这样的了

pubtraitFuture{type Output;fn poll(self: Pin,lw: &LocalWaker)-> Poll<:output>;}

合理的抽象

既然已经打算钦定了 coroutine 作为异步 IO 的 API 抽象，那应该把哪些东西加入标准库、哪些东西加入语法支持、哪些东西交给第三方实现呢？让开发者手动调用 unsafe 的 Generator::resume 终归不是很妙，也不好把 mio 作为唯一的底层异步 IO 实现(如果这样的话不如把 mio 也并入标准库)。

现在的 rust 提供了 async 的语法支持(以前是用过程宏的实现的)、await!的标准库宏支持，标准库 std::future 的 trait Future 和 struct GenFuture ，标准库 std::task 的 enum Poll, struct LocalWaker, struct Waker 和 trait UnsafeWaker。

你需要给你的 MyWaker 实现 trait UnsafeWaker，用 mio 的话就用 SetReadiness，unsafe fn wake(&self) 用 SetReadiness::set_readiness 实现。然后把 MyWaker 包在 Waker, LocalWaker 里面。

Poll

Poll 的定义为

pubenum Poll{Ready(T),Pending,}

await!

await! 宏只能在 async 函数或者块里面用，传入一个 Future

await!(future)会被展开成

loop{ifletPoll::Ready(x)=::future::poll_with_tls(unsafe{Pin::new_unchecked(&mutfuture)}){breakx;}yield}

::future::poll_with_tls 即 thread-local waker，就是你传给这个 GenFuture::poll 的 LocalWaker，

async

async则会把 Generator 包装成 Future(GenFuture) 。

GenFuture 的相关定义如下

struct GenFuture>(T);impl>!UnpinforGenFuture{}impl>FutureforGenFuture{type Output=T::Return;fn poll(self: Pin,lw: &LocalWaker)-> Poll<:output>{set_task_waker(lw,||matchunsafe{Pin::get_mut_unchecked(self).0.resume()}{GeneratorState::Yielded(())=>Poll::Pending,GeneratorState::Complete(x)=>Poll::Ready(x),})}}pubfn from_generator>(x: T)-> implFuture{GenFuture(x)}

这里可以看到，GenFuture 在每次调用 self.0.resume 之前会 set_task_waker，通过一个 thread_local 的变量中转，从而 generator 里面的 future::poll 能通过 poll_with_tls 拿到这个 LocalWaker。

所以，下面的代码

asyncfn async_recv(string_channel: Receiver)-> String {await!(string_channel.recv_future())}

会被类似地展开为这样

fn async_recv(string_channel: Receiver)-> implFuture{from_generator(move||{letrecv_future=string_channel.recv_future();loop{ifletPoll::Ready(x)=::future::poll_with_tls(unsafe{Pin::new_unchecked(&mutrecv_future)}){breakx;}yield}})}

asynchronous coroutine

掌握了上文的基础知识后，我们就可以开始实践了。

coroutine 本身并不意味着“异步”，你完全可以在两次 yield 之间调用同步 IO 的 API 从而导致 IO 阻塞。异步的关键在于，在将要阻塞的时候(比如某个 API 返回了 io::ErrorKind::WouldBlock)，GenFuture::poll中用底层异步接口注册一个事件和唤醒回调(waker)然后自身休眠(yield)，底层异步调度在特定事件发生的时候回调唤醒这个 Future。

下面我参照 romio 的异步调度实现了 Executor block_on, spawn, TcpListener 和 TcpStream，代码较长，建议 clone 后用编辑器看。(请注意区分 Poll(mio::Poll) 与 task::Poll 以及 net::{TcpListener, TcpStream}(mio::net::{TcpListener, TcpStream}) 与 TcpListener, TcpStream)

Executor

Executor 中包含 mio::Poll，main task waker 及用来管理 task 和 source 的 Slab 各一个。其本身并没有实现什么特别的方法，主要是初始化为 thread_local 的 EXECUTOR 供其它函数借用。

block_on

block_on 函数会阻塞当前线程，传入参数是一个 future: Future，被称为 main task；返回值类型是 T。该函数一般在最外层被调用。

block_on 会引用 thread_local EXECUTOR，主要逻辑是调用 mio::Poll::poll 来响应事件。block_on 把 0 - MAX_RESOURCE_NUM(1 << 31) 个 Token 分为三类。main task token

收到 Token 为 MAIN_TASK_TOKEN 的事件即表示需要唤醒 main task，执行 main_task.poll，返回 task::Poll::Ready(T) 则 block_on 函数返回。task token

奇数 token 表示由 spawn 函数分发的其它任务需要被唤醒，执行相应的 task.poll，token 和该事件在 EXECUTOR.tasks 中的 index 一一映射。source token

偶数 token 表示由 register_source 函数注册的 source需要被分发，执行相应 source 的 waker() 以唤醒分发它们的 task。

spawn

分发任务

TcpListener

包装了 mio::net::TcpListener，accept 方法返回一个 Future。

TcpStream

包装了 mio::net::TcpStream, read和 write 方法均返回 Future。

后记

实现了 executor 之后，我们就可以运行文章开头给的 example 了，

RUST_LOG=info cargo run --example async-echo

可以用 telnet 连连试试看。

当然最后还留了一个问题，就是把文件 IO 也封装为 coroutine 的异步 IO，当然我还没有写，读者有兴趣可以试着实现一下，我们接下来再谈谈现在 coroutine API 的不足。

我目前发现的主要问题就是不能在 Future::poll 或者 async 中使用 try，导致出现 Result 的地方只能 match，希望之后会有比较好的解决方案。

第二个问题是 Waker 最里面装的是 UnsafeWaker的 Non)?ull 指针，当然我能理解 rust 团队有性能等其它方面的考虑，但如果用 mio 的 set_readiness 封装出 MyWaker 的话，clone 完全不需要 NonNull，而且我在实际编码时因为这个出过空指针错误。。希望以后能提供一个更安全的选择。?let (handler, addr) = server.accept()?; println!("accept from addr: {}", &addr); poll.register(&handler, SERVER_WRITE, Ready::readable() | Ready::writable(), PollOpt::oneshot())?; server_handler = Some(handler);let (handler, addr) = server.accept()?; println!("accept from addr: {}", &addr); poll.register(&handler, SERVER_WRITE, Ready::readable() | Ready::writable(), PollOpt::oneshot())?; server_handler = Some(handler);

corutine rust_corutine rust_rust 异步 IO：从 mio 到 coroutine相关推荐

协程和任务异步IO 重点
20210815 https://mp.weixin.qq.com/s/XeHaWhKztnCOIXb_2GSitQ https://mp.weixin.qq.com/s/lnox3pbpzJ2kWl ...
2021年大数据Flink（四十六）：扩展阅读异步IO
目录扩展阅读异步IO 介绍异步IO操作的需求使用Aysnc I/O的前提条件 Async I/O API 案例演示扩展阅读原理深入 AsyncDataStream 消息的顺序性扩展阅读 ...
Node的异步与java的异步_node中异步IO的理解
解释性语言和编译型语言的区别: 计算器不能直接的理解高级语言,只能理解机器语言,所以必须把高级语言翻译为机器语言,翻译的方式有两种,一个是编译,一个是解释. 解释性语言的程序不需要编译,它是在运行程序 ...
【网络编程】同步IO、异步IO、阻塞IO、非阻塞IO
IO分两阶段: 1.数据准备阶段:在该阶段,根据是否等待数据准备,将IO分成阻塞和非阻塞: 2.内核空间复制回用户进程缓冲区阶段:在该阶段,只要程序需要等待复制完成,才能往下运行(尽管这个时间很短), ...
异步IO一定更好吗？
http://cnodejs.org/blog/?p=1015 续:异步IO一定更好吗? 我之前的一篇文章<异步IO一定更好吗?>中举了一个很变态的例子,用以说明在单碟机械式硬盘上异步IO ...
Python之路-python(Queue队列、进程、Gevent协程、Select\Poll\Epoll异步IO与事件驱动)
一.进程: 1.语法 2.进程间通讯 3.进程池二.Gevent协程三.Select\Poll\Epoll异步IO与事件驱动一.进程: 1.语法 1 简单的启动线程语法 2 def run(na ...
python asyncio教程_python中使用asyncio实现异步IO实例分析
1.说明 Python实现异步IO非常简单,asyncio是Python 3.4版本引入的标准库,直接内置了对异步IO的支持. asyncio的编程模型就是一个消息循环.我们从asyncio模块中直接 ...
操作系统学习：Linux0.12文件异步IO
本文参考书籍 1.操作系统真相还原 2.Linux内核完全剖析:基于0.12内核 3.x86汇编语言从实模式到保护模式 4.Linux内核设计的艺术 ps:基于x86硬件的pc系统 Linux0.1 ...
服务端异步IO配合协程浅析
服务端异步IO配合协程浅析代码如下 #coding:utf-8 import socket from selectors import DefaultSelector, EVENT_READ, EV ...
异步IO（协程，消息循环队列）
同步是CPU自己主动查看IO操作是否完成,异步是IO操作完成后发出信号通知CPU(CPU是被通知的) 阻塞与非阻塞的区别在于发起IO操作之后,CPU是等待IO操作完成再进行下一步操作,还是不等待去做其 ...

corutine rust_corutine rust_rust 异步 IO：从 mio 到 coroutine

corutine rust_corutine rust_rust 异步 IO：从 mio 到 coroutine相关推荐

最新文章

热门文章