在今年欧洲的JSConf上Emil Bay进行了一场题为《Hand-Crafting WebAssembly》的演讲。Emil表示:“现在已经有很多关于WebAssembly(WASM)的演讲。遗憾的是,大多数演讲是关于如何把高级语言编译成wasm的,他们把wasm当成一个半透明的盒子。WebAssembly是一门有趣的语言,你可以用它写出性能低于C的代码”。在这此的演讲中,Emil向我们演示了如何写WAT(WebAssembly的文本格式)以及当拥有大内存时,如何推理算法,如何将高级结构(如循环)转换为基础指令,同时获得乐趣!Emil演示了如何把一些难度逐渐递增的算法转换成基础指令,在没有抽象的情况下每一个算法的实现都充满着挑战。即时你在工作中并没有使用WASM,学习计算机的最低级指令可以拨开抽象的迷雾,揭示计算机的神奇。在开始正文之前让我们先一睹大佬风采 ?

什么是WebAssembly

“WebAssembly(缩写Wasm)是运行在一个基于栈的虚拟机上的二进制指令格式。Wasm是为了把像C/C++/Rust等高级语言编译成便携式的目标而设计的,可以被部署到Web端和服务端应用”。 这是WebAssembly官网的解释,听起来不错,但是今天我们可以忘记这些,因为我们今天用不到这些高深的技术术语。通过“WebAssembly”这个单词你可能猜想它运行在浏览器端的汇编语言。实际上,它既不是很Web,也不是很Assembly(Not very Web, not very Assembly)。

为什么这么说WebAssembly “Not very Web, not very Assembly”呢?

  • 它不能直接使用Web API。
  • WebAssembly代码不是直接运行在物理机上的,虽然它很接近物理机,但它仍然是一个抽象出来的运行环境。
  • 不能系统调用,除非你通过JavaScript给它调用通道。
  • 不能使用新的硬件设备。例如:蓝牙。
  • 没什么魔法,只是计算。

吐槽了那么多,到底WebAssembly是什么呢?

  • 64位整型(i64) WebAssembly最让我兴奋的的是它可以使用64位的整型数字,这让我们可以精确的描述那些需要数字计算的事物。由于我的工作是关于密码学的,我们经常需要处理256位或者512位长度的二进制数字,64位整型数字的支持对性能提升确实很有效。

  • 性能提升(Performance Boost) 人们通常通过把代码转换成WebAssembly来获得性能的提升,但是根据我的经验通常收益不像想象的那么大。我通过以前一些实验得出WebAssembly相对JavaScript性能大约提升了20%至30%。因为JavaScript在一些新的JavaScript引擎(v8、SipderMonkey等)上已经运行的很快了!

  • 精度/可预测性(Precision/Predictable) 使用JavaScript写代码的时候,你通常不知道写出来的代码性能怎么样,除非你研究过底层的虚拟机。使用WebAssembly你更接近代码的底层运行,所以代码的表现或性能将更加可预测。

  • Run anywhere 另一件,让人感到兴奋的的事是WebAssembly可能在不久以后成为唯一一个可以跨平台、跨端运行的语言。我已经看到有人在使用WebAssembly写Linux内核的项目,还有人在浏览器里加载WebAssembly模块。

WebAssembly不是什么未来的黑科技,现在丹麦已经有超过77%的浏览器支持,而全球也已经有超过73%的浏览器支持,而且Node.js 8.0以上也支持WebAssembly,所以你现在就可以使用它。

WebAssembly Text-format

下面我们要手撸WebAssembly,而不是通过高级程序语言编译成WebAssembly。 WebAssembly是一种二进制格式的低级(low level)类汇编语言,官方为了让人类能够阅读和编辑它,还提供了相应的文本格式(wat)。

1. 平方运算

从一个简单的平方计算的函数开始我们的第一个WebAssembly模块:

(module (func $square(export "square")(param $x i32)(result i32)(return (i32.mul (get_local $x)(get_local $x)))))
复制代码

这里我们定义了一个平方运算的函数square,它接受一个你i32类型的参数,返回结果也是i32。通过这个模块我们应该注意到以下几点:

  • wat文本采用的是S-expressions的语法(类似LISP)。
  • 模块是WebAssembly的基本单位,这点和ES6的模块很像。
  • 标签(参数名、变量名和函数名)使用 $ 前缀声明。
  • 明确的类型,参数、变量、函数返回都有类型声明。
  • 运算操作是通过type.op形式的指令调用,type代表运算结果的类型,op是要做的运算操作。如:i32.mul表示要做乘法运算(mul),运算操作的结果的类型是i32(32位整型数字)。
  • 显示访问,当要使用一个变量时,我们需要显示访问。如:get_local $x,我们使用get_local显示访问了本地变量x

我们来看下这个模块是如何使用的?

  1. 将上面的“First module”保存到square.wat文件。你也可以从handcrafting-webassembly这个仓库直接克隆获取源码。

  2. 安装编译工具wabt和wat2js。

    $ git clone --recursive https://github.com/WebAssembly/wabt
    $ cd wabt
    $ make  #cmake, git, make required
    $ npm i -g wat2js
    复制代码
    • 安装完成后将 /wabt/bin目录添加到系统的环境。mac是添加到*/etc/paths*文件。
  3. 生成wasm模块和JavaScript胶水代码文件

    $ wat2wasm square.wat  #生成square.wasm文件
    $ wat2js square.wat -o square.js  #生成加载wasm模块的CommonJS模块
    复制代码
  4. 使用wasm模块。新建example.js,添加如下代码:

    var wasm = require('./square.js');
    console.log(wasm.exports.square(2));  // 4
    复制代码

通过这个简单的WebAssembly小模块,我们应该已经掌握了WebAssembly文本格式一些基本语法以及如何使用它。接下来我们来看下Emil在实际工作中写的代码。

2. 计算两点之间距离

下面的这段代码定义并导出了一个f64.distance的函数,它接受四个参数分别是x1、y1、x2、y2,返回一个64位浮点型数字。这段代码还是比较好理解的,有了之前的“First Module”的经验你应该已经知道如何使用它。同样,你可以在handcrafting-webassembly找到它的源码。

(module (func $square(export "square")(param $x i32)(result i32)(return (i32.mul (get_local $x)(get_local $x))))(func $f64.distance(export "f64.distance")(param $x1 i32) (param $y1 i32)(param $x2 i32) (param $y2 i32)(result f64)(local $x.dist i32)(local $y.dist i32)(set_local $x.dist (i32.sub (get_local $x1)(get_local $x2)))(set_local $y.dist (i32.sub (get_local $y1)(get_local $y2)))(return (f64.sqrt (f64.convert_u/i32 (i32.add (call $square (get_local $x.dist))(call $square (get_local $y.dist))))))))
复制代码

让我们把难度再提升一个等级。

3. 计算矢量间的距离

矢量间距离计算,其实相当于两个数组间距离的计算。这段代码的难度就增加了很多!这里用到了WebAssembly的线性内存(Linear memory)和loop指令。

  • memory是WebAssembly的一个重要的概念,它是用来实现JavaScript和WebAssebly模块间通信的,本质上就是一个大的共享数组。下面的模块中,我们创建并导出了一页(64KiB)大小的momery实例。导出的memory实例是提供给JavaScript使用。通过JavaScript把外部数组的数据存到memory,然后我们可以WebAssebly模块里访问它。
  • loop指令用来定义循环代码块。紧跟在loop指令后面需要定义一个标签,在这里我们定义的是“continue”。WebAssembly的循环和JavaScript有些不同。在JavaScript的循环里有continue和break两个分支。WebAssembly的循环比较像do-while循环,但它只有一个条件分支,当br_if条件为真的时候,继续执行指定标签的循环。
(module (memory (export "memory") 1)(func $i8.distance(export "i8.distance")(param $v.ptr i32)(param $w.ptr i32)(param $len i32)(result f64)(local $distance.sq i32)(local $elm i32)(local $offset i32)(set_local $distance.sq (i32.const 0))(loop $continue;; $elm = $w[$offset] - $v[$offset](set_local $elm (i32.sub (i32.load8_u (i32.add (get_local $w.ptr)(get_local $offset)))(i32.load8_u (i32.add (get_local $v.ptr)(get_local $offset)))));; $distance.sq += $elm ** 2(set_local $distance.sq (i32.add (get_local $distance.sq)(i32.mul (get_local $elm)(get_local $elm))));; $offset++ < $len ? continue : break(br_if $continue (i32.lt_u (tee_local $offset (i32.add (get_local $offset)(i32.const 4))) ;; bytewidth of i32(get_local $len))))(return (f64.sqrt (f64.convert_u/i32 (get_local $distance.sq))))))
复制代码

通过这个例子,我们来看下数字在memory里面是如何存储的。如下图,我们可以看到i8类型表示的是八个比特位(bit)整型数字,也就是一个字节(byte)。i32表示的是四个字节长度的整型数字,f64表示的是八个字节的浮点型数字。所以说memory其实就是一个字节数组。在JavaScript里面数字只有Number类型,我们也不需要关心数字在内存中是如何存储的,但是在WebAssembly里,你必须知道如何为一个数字分配合适它的内存(定义合适的类型)。

那我们是如何解析数组的呢?答案是通过指针(pointer)和数组的长度(length)。在这里指针也就相当于数组的下标(index),长度也就是数组分配的内存大小。

总结

通过手撸三个难度递增的的WebAssembly模块,对于理解WebAssembly在内存使用和运行机制应该有所收益。但是还是要提醒大家手撸WebAssembly并不符合它的设计初衷。演讲的最后阶段,Emil还介绍了自己加密算法库sodium-native和sodium-universal(广告时间 啊哈~),如果你感兴趣的话可以移步到他的gayhub。(完

【JSConf EU 2018】WebAssembly 的手工艺术相关推荐

  1. 【JSConf EU 2018】Ryan Dahl: Node.js 的设计错误

    在稍早前的 JS Conf Berlin 上,被称为 Nodejs 之父的 Ryan Dahl 发表了<10 Things I Regret About Node.js>演讲,并且发布了新 ...

  2. [JSConf EU 2018] 大脑控制 Javascript

    先解释,本人为前端菜鸟,之前也未参加过类似的活动,没有翻译过什么文章,此次是好奇心使然,也是想尝试下,学习学习,英文很烂,全靠有道,但是视频整个看下来,还是很有收获的,现在来分享一下! 主题:Expl ...

  3. 【JSConf EU 2018】有关浏览器弹出式窗口的相关探讨

    在前端大爆发的今天,随着层出不穷的新技术和新框架的不断推出和W3C标准的不断更新,前端开发已经不局限于展示服务端返回的信息,而更多的去关注功能,这也带给了我们更多思考. 本次JSCONF2018大会上 ...

  4. 2018京东方数字艺术论坛掠影:用科技对“画”未来

    11月7日下午,对"画"未来·2018京东方数字艺术论坛在北京雁栖湖国际会展中心隆重召开.会上,京东方科技集团股份有限公司(以下简称"BOE")正式发布两款最新 ...

  5. 阿里云参加ONS EU 2018,飞天洛神亮相网络顶会

    9月25日,荷兰阿姆斯特丹,为期3天的网络科技界盛会Open Networking Summit拉开序幕.来自世界各地的网络技术领域专家齐聚一堂,参与并分享各自分支领域的经验和成果.阿里云在会上展示了 ...

  6. Node.js:它是什么,何时以及如何使用它,以及为什么要使用它

    by Pablo Regen 通过帕勃罗·雷根(Pablo Regen) You've probably read these sentences before- 您可能已经读过这些句子了-- Nod ...

  7. 关于JavaScript并发、竞态场景下的一些思考和解决方案

    前言 时间是程序里最复杂的因素 编写 Web 应用的时候,一般来说,我们大多时候处理的都是同步的.线性的业务逻辑.但是正如开篇所说的"时间是程序里最复杂的因素",应用一旦复杂,往往 ...

  8. Deno 意味着什么?

    如果你一直关注 Web 开发领域,那么最近可能已经听到了很多关于 Deno 的信息--一种新的 JavaScript 运行时,它可能也会被认为是 Node.js 的继承者.但是这意味着什么,我们需要& ...

  9. AI的艺术创造力超越人类?绝不是痴人说梦

    全文共6066字,预计学习时长12分钟 VR欧泊蝴蝶/Pamela Davis Kivelson 人类的艺术体验(绘画.音乐.雕塑.诗歌)往往融入了各种感官.联想.记忆和情感,并涉及人们所谓的&quo ...

最新文章

  1. JDBC,JdbcTemplate,JPA傻傻分不清楚
  2. #define list_entry(ptr, type, member) \   container_of(ptr, type, member)
  3. 深入理解 Java G1 垃圾收集器--转
  4. zwpython_零起点Python大数据与量化交易
  5. 轻松理解—继承成员访问控制机制
  6. 王思聪5亿投资神话破灭?旗下普思资本股权遭冻结,冻结期3年
  7. 计算机网络技术应用和发展,计算机网络技术的应用和发展研究
  8. 不染用计算机数字,2013年计算机等级考试一级B知识预测题(6)
  9. 现在做网络推广,哪种方式最好?
  10. Web前端页面的浏览器兼容性测试心得(三)总结一些IE8兼容问题的解决方案
  11. ASP.NETMVC Model验证(五)
  12. 非常好的关于android安全的博客
  13. 程序员必备的网站推荐
  14. 什么是 GPL GNU,自由软件
  15. 3dmax中slice plane切割平面的作用
  16. R绘图| Kaplan-Meier曲线及美化
  17. Google IO 2018开发者大会:Android P
  18. qt中去除首尾空格的操作simplified()和trimmed()的对比操作
  19. 两个均匀分布的随机变量求和的分布
  20. 掌上智维技术支持 App Tech Support

热门文章

  1. POJ1185:火炮(减少国家)
  2. 主从数据库之互为主备
  3. 深入浅出--梯度下降法及其实现
  4. 在项目中使用react
  5. 现在有T1、T2、T3三个线程,你怎样保证T2在T1执行完后执行,T3在T2执行完后执行?...
  6. CentOS安装EMACS文件夹树型图插件与颜色插件
  7. 大型网站架构系列:缓存在分布式系统中的应用(一)
  8. cocos2dx 自学记录(4)-- 写一个自己的界面
  9. Sharepoint 2007 定制Feature和卸载Feature
  10. 设计模式(四)简单工厂模式