matrix_multiply代码解析

关于matrix_multiply

程序执行代码里两个矩阵的乘法,并将相乘结果打印在屏幕上。

示例的主要目的是展现怎么实现一个自定义CPU计算任务。

参考:https://github.com/sogou/workflow

示例代码

https://github.com/sogou/workflow/blob/master/tutorial/tutorial-08-matrix_multiply.cc

定义计算任务

定义计算任务需要提供3个基本信息,分别为INPUT,OUTPUT,和routine。

INPUT和OUTPUT是两个模板参数,可以是任何类型。routine表示从INPUT到OUTPUT的过程,定义如下:

template <class INPUT, class OUTPUT>

class __WFThreadTask

{

std::function<void (INPUT *,
OUTPUT *)> routine;

};

可以看出routine是一个简单的从INPUT到OUTPUT的计算过程。INPUT指针不要求是const,但用户也可以传const INPUT *的函数。

比如一个加法任务,就可这么做:

struct add_input

{

int x;

int y;

};

struct add_ouput

{

int res;

};

void add_routine(const add_input
*input, add_output *output)

{

output->res = input->x + input->y;

}

typedef
WFThreadTask<add_input, add_output> add_task;

在矩阵乘法的示例里,输入是两个矩阵,输出为一个矩阵。其定义如下:

namespace algorithm

{

using Matrix =
std::vector<std::vector>;

struct MMInput

{

Matrix a;

Matrix b;

};

struct MMOutput

{

int error;

size_t m, n, k;

Matrix c;

};

void matrix_multiply(const MMInput *in,
MMOutput *out)

{

}

}

矩阵乘法存在有输入矩阵不合法的问题,所以output里多了一个error域,用来表示错误。

生成计算任务

定义好输入输出的类型,以及算法的过程之后,就可以通过WFThreadTaskFactory工厂来产生计算任务了。

在WFTaskFactory.h里,计算工厂类的定义如下:

template <class INPUT, class OUTPUT>

class WFThreadTaskFactory

{

private:

using T =
WFThreadTask<INPUT, OUTPUT>;

public:

static T *create_thread_task(const
std::string& queue_name,

std::function<void (INPUT *,
OUTPUT *)> routine,

std::function<void (T *)> callback);

};

与之前的网络工厂类或算法工厂类略有不同,这个类需要INPUT和OUTPUT两个模板参数。

queue_name相关的知识在上一个示例里已经有介绍。routine就是你的计算过程,callback是回调。

在示例里,看到了这个调用的使用:

using MMTask =
WFThreadTask<algorithm::MMInput,

algorithm::MMOutput>;

using namespace algorithm;

int main()

{

typedef
WFThreadTaskFactory<MMInput, MMOutput> MMFactory;

MMTask *task = MMFactory::create_thread_task(“matrix_multiply_task”,

matrix_multiply,

callback);

MMInput *input = task->get_input();

input->a = {{1, 2, 3}, {4, 5, 6}};

input->b = {{7, 8}, {9, 10}, {11, 12}};

}

产生了task之后,通过get_input()接口得到输入数据的指针。这个可以类比网络任务的get_req()。

任务的发起和结束什么,与网络任务并没有什么区别。同样,回调也很简单:

void callback(MMTask
*task)     // MMtask =
WFThreadTask<MMInput, MMOutput>

{

MMInput *input = task->get_input();

MMOutput *output = task->get_output();

assert(task->get_state() ==
WFT_STATE_SUCCESS);

if (output->error)

printf(“Error: %d
%s\n”, output->error, strerror(output->error));

else

{

printf(“Matrix A\n”);

print_matrix(input->a,
output->m, output->k);

printf(“Matrix B\n”);

print_matrix(input->b,
output->k, output->n);

printf(“Matrix A *
Matrix B =>\n”);

print_matrix(output->c,
output->m, output->n);

}

}

普通的计算任务可以忽略失败的可能性,结束状态肯定是SUCCESS。

callback里简单打印了输入输出。如果输入数据不合法,则打印错误。

算法与协议的对称性

在体系里,算法与协议在一个非常抽象的层面上是具有高度对称性的。

有自定义算法的线程任务,那显然也存在自定义协议的网络任务。

自定义算法要求提供算法的过程,而自定义协议则需要用户提供序列化和反序列化的过程。

无论是自定义算法还是自定义协议,都必须强调算法和协议都是非常纯粹的。

例如算法就是一个从INPUT到OUPUT的转换过程,算法并不知道task,series等的存在。

HTTP协议的实现上,也只关心序列化反序列化,无需要关心什么是task。而是在http task里去引用HTTP协议。

线程任务与网络任务的复合性

在这个示例里,通过WFThreadTaskFactory构建了一个线程任务。可以说这是一种最简单的计算任务构建,大多数情况下也够用了。

同样,用户可以非常简单的定义一个自有协议的server和client。

但在上一个示例里看到,可以通过算法工厂产生一个并行排序任务,这显然不是通过一个routine就能做到的。

对于网络任务,比如一个kafka任务,可能要经过与多台机器的交互才能得到结果,但对用户来讲是完全透明的。

所以,任务都是具有复合性的,如果你熟练使用框架,可以设计出很多复杂的组件出来。

matrix_multiply代码解析相关推荐

  1. CornerNet代码解析——损失函数

    CornerNet代码解析--损失函数 文章目录 CornerNet代码解析--损失函数 前言 总体损失 1.Heatmap的损失 2.Embedding的损失 3.Offset的损失 前言 今天要解 ...

  2. 视觉SLAM开源算法ORB-SLAM3 原理与代码解析

    来源:深蓝学院,文稿整理者:何常鑫,审核&修改:刘国庆 本文总结于上交感知与导航研究所科研助理--刘国庆关于[视觉SLAM开源算法ORB-SLAM3 原理与代码解析]的公开课. ORB-SLA ...

  3. java获取object属性值_java反射获取一个object属性值代码解析

    有些时候你明明知道这个object里面是什么,但是因为种种原因,你不能将它转化成一个对象,只是想单纯地提取出这个object里的一些东西,这个时候就需要用反射了. 假如你这个类是这样的: privat ...

  4. python中的doc_基于Python获取docx/doc文件内容代码解析

    这篇文章主要介绍了基于Python获取docx/doc文件内容代码解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 整体思路: 下载文件并修改后缀 ...

  5. mongoose框架示例代码解析(一)

    mongoose框架示例代码解析(一) 参考: Mongoose Networking Library Documentation(Server) Mongoose Networking Librar ...

  6. ViBe算法原理和代码解析

    ViBe - a powerful technique for background detection and subtraction in video sequences 算法官网:http:// ...

  7. 【Android 逆向】使用 Python 代码解析 ELF 文件 ( PyCharm 中进行断点调试 | ELFFile 实例对象分析 )

    文章目录 一.PyCharm 中进行断点调试 二.ELFFile 实例对象分析 一.PyCharm 中进行断点调试 在上一篇博客 [Android 逆向]使用 Python 代码解析 ELF 文件 ( ...

  8. 密码算法中iv值是什么_?标检测中的?极?值抑制算法(nms):python代码解析

    ⾮极⼤值抑制(Non-Maximum Suppression)原理 ⾮极⼤值抑制,顾名思义,找出极⼤值,抑制⾮极⼤值.这种思路和算法在各个领域中应⽤⼴泛,⽐如边缘检测算法canny算⼦中就使⽤了该⽅法 ...

  9. python批量处理csv_Python批量处理csv并保存过程代码解析

    本篇文章小编给大家分享一下Python批量处理csv并保存过程代码解析,代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 需求: 1.大量csv文件,以数字命 ...

最新文章

  1. ubuntu装java环境_Ubuntu安装Java环境
  2. php 表单变量,PHP学习笔记——访问表单变量
  3. 嵌入式小白到大神学习全攻略(学习路线+课程+学习书籍+练习项目)
  4. easyui datagrid 后台分页,前端如何处理
  5. shell日期处理函数
  6. vs2013编译osg缺少mfc120d.lib
  7. 观察者模式Observer
  8. 【微软黑科技一周概览】
  9. leetcode18.4Sum
  10. 一个正则替换:一段文本中有若干a img标记,替换文本中的某些词,不包含除了a img标记 中的文字、属性...
  11. 【渝粤题库】陕西师范大学165101社会学 作业(高起专)
  12. 腾讯云:服务器资源池化技术发展趋势
  13. 洛谷【P1195】口袋的天空
  14. 是时候让《武林外传》教你反内卷了
  15. 华为服务器故障灯不开机_华为手机开不了机指示灯亮怎么办?
  16. 二叉平衡树的算法复杂度笔记
  17. 炒菜机器人的弊端_家用炒菜机器人好用吗?都说买了全自动炒菜机后悔了。。...
  18. qq邮箱服务器在哪里设置密码,手把手教程 邮箱这样设置,就对了
  19. Chrome、Edge等最新版浏览器中继续使用Flash Player方案
  20. android 双导航组件,高级功能-导航组件-开发指南-Android 导航SDK | 高德地图API

热门文章

  1. 2021-2027年中国室内定位市场研究及前瞻分析报告
  2. docker 常用命令集合
  3. 自己动手实现20G中文预训练语言模型示例
  4. 先验概率,后验概率,条件概率,贝叶斯
  5. CUDA Pro:通过向量化内存访问提高性能
  6. CodeGen处理Synergy方法目录
  7. 深度学习数据特征提取:ICCV2019论文解析
  8. android 生成随机不相同的数
  9. webview Java与JS互调
  10. django文件上传