8天玩转并行开发——第三天 plinq的使用
原文 8天玩转并行开发——第三天 plinq的使用
相信在.net平台下,我们都玩过linq,是的,linq让我们的程序简洁优美,简直玩的是爱不释手,但是传统的linq只是串行代码,在并行的
年代如果linq不支持并行计算那该是多么遗憾的事情啊。
当然linq有很多种方式,比如linq to sql ,xml,object 等等,如果要将linq做成并行还是很简单的,这里我就举一个比较实际一点的例子,
我们知道为了更快的响应用户操作,码农们想尽了各种办法,绞尽了脑汁,其中有一个办法就是将数据库数据预加载到内存中,然后通过各种
数据结构的手段来加速CURD,是的,比如一个排序地球人只能做到N(lgN),那么如果我还想再快一点的话该怎么办呢?那么现在的并行就能发
挥巨大的优势,尤其是现在的服务器配置都是在8个硬件线程的情况下,你简直会狂笑好几天啊,好,不乱扯了。
1:AsParallel(并行化)
下面我们模拟给ConcurrentDictionary灌入1500w条记录,看看串行和并行效率上的差异,注意我的老爷机是2个硬件线程。
1 using System; 2 using System.Threading; 3 using System.Threading.Tasks; 4 using System.Diagnostics; 5 using System.Collections.Concurrent; 6 using System.Collections.Generic; 7 8 using System.Linq; 9 10 class Program11 {12 static void Main(string[] args)13 {14 var dic = LoadData();15 16 Stopwatch watch = new Stopwatch();17 18 watch.Start();19 20 //串行执行21 var query1 = (from n in dic.Values22 where n.Age > 20 && n.Age < 2523 select n).ToList();24 25 watch.Stop();26 27 Console.WriteLine("串行计算耗费时间:{0}", watch.ElapsedMilliseconds);28 29 watch.Restart();30 31 var query2 = (from n in dic.Values.AsParallel()32 where n.Age > 20 && n.Age < 2533 select n).ToList();34 35 watch.Stop();36 37 Console.WriteLine("并行计算耗费时间:{0}", watch.ElapsedMilliseconds);38 39 Console.Read();40 }41 42 public static ConcurrentDictionary<int, Student> LoadData()43 {44 ConcurrentDictionary<int, Student> dic = new ConcurrentDictionary<int, Student>();45 46 //预加载1500w条记录47 Parallel.For(0, 15000000, (i) =>48 {49 var single = new Student()50 {51 ID = i,52 Name = "hxc" + i,53 Age = i % 151,54 CreateTime = DateTime.Now.AddSeconds(i)55 };56 dic.TryAdd(i, single);57 });58 59 return dic;60 }61 62 public class Student63 {64 public int ID { get; set; }65 66 public string Name { get; set; }67 68 public int Age { get; set; }69 70 public DateTime CreateTime { get; set; }71 }72 }
执行的结果还是比较震撼的,将近7倍,这是因为plinq的查询引擎会尽量利用cpu的所有硬件线程。
2:常用方法的使用
<1> orderby
有时候我们并不是简单的select一下就ok了,可能需要将结果进行orderby操作,并行化引擎会把要遍历的数据分区,然后在每个区上进行
orderby操作,最后来一个总的orderby,这里很像算法中的“归并排序”。
1 using System; 2 using System.Threading; 3 using System.Threading.Tasks; 4 using System.Diagnostics; 5 using System.Collections.Concurrent; 6 using System.Collections.Generic; 7 8 using System.Linq; 9 10 class Program11 {12 static void Main(string[] args)13 {14 var dic = LoadData();15 16 var query1 = (from n in dic.Values.AsParallel()17 where n.Age > 20 && n.Age < 2518 select n).ToList();19 20 21 Console.WriteLine("默认的时间排序如下:");22 query1.Take(10).ToList().ForEach((i) =>23 {24 Console.WriteLine(i.CreateTime);25 });26 27 var query2 = (from n in dic.Values.AsParallel()28 where n.Age > 20 && n.Age < 2529 orderby n.CreateTime descending30 select n).ToList();31 32 Console.WriteLine("排序后的时间排序如下:");33 query2.Take(10).ToList().ForEach((i) =>34 {35 Console.WriteLine(i.CreateTime);36 });37 38 Console.Read();39 }40 41 public static ConcurrentDictionary<int, Student> LoadData()42 {43 ConcurrentDictionary<int, Student> dic = new ConcurrentDictionary<int, Student>();44 45 //预加载1500w条记录46 Parallel.For(0, 15000000, (i) =>47 {48 var single = new Student()49 {50 ID = i,51 Name = "hxc" + i,52 Age = i % 151,53 CreateTime = DateTime.Now.AddSeconds(i)54 };55 dic.TryAdd(i, single);56 });57 58 return dic;59 }60 61 public class Student62 {63 public int ID { get; set; }64 65 public string Name { get; set; }66 67 public int Age { get; set; }68 69 public DateTime CreateTime { get; set; }70 }71 }
<2> sum(),average()等等这些聚合函数的效果跟orderby类型一样,都是实现了类型归并排序的效果,这里就不举例子了。
3:指定并行度,这个我在前面文章也说过,为了不让并行计算占用全部的硬件线程,或许可能要留一个线程做其他事情。
1 var query2 = (from n in dic.Values.AsParallel()2 .WithDegreeOfParallelism(Environment.ProcessorCount - 1)3 where n.Age > 20 && n.Age < 254 orderby n.CreateTime descending5 select n).ToList();
4: 了解ParallelEnumerable类
首先这个类是Enumerable的并行版本,提供了很多用于查询实现的一组方法,截个图,大家看看是不是很熟悉,要记住,他们都是并行的。
下面列举几个简单的例子。
1 class Program 2 { 3 static void Main(string[] args) 4 { 5 ConcurrentBag<int> bag = new ConcurrentBag<int>(); 6 7 var list = ParallelEnumerable.Range(0, 10000); 8 9 list.ForAll((i) =>10 {11 bag.Add(i);12 });13 14 Console.WriteLine("bag集合中元素个数有:{0}", bag.Count);15 16 Console.WriteLine("list集合中元素个数总和为:{0}", list.Sum());17 18 Console.WriteLine("list集合中元素最大值为:{0}", list.Max());19 20 Console.WriteLine("list集合中元素第一个元素为:{0}", list.FirstOrDefault());21 22 Console.Read();23 }24 }
5: plinq实现MapReduce算法
mapReduce是一个非常流行的编程模型,用于大规模数据集的并行计算,非常的牛X啊,记得mongodb中就用到了这个玩意。
map: 也就是“映射”操作,可以为每一个数据项建立一个键值对,映射完后会形成一个键值对的集合。
reduce:“化简”操作,我们对这些巨大的“键值对集合“进行分组,统计等等。
具体大家可以看看百科:http://baike.baidu.com/view/2902.htm
下面我举个例子,用Mapreduce来实现一个对age的分组统计。
using System;using System.Threading;using System.Threading.Tasks;using System.Diagnostics;using System.Collections.Concurrent; using System.Collections.Generic; using System.Linq; class Program{static void Main(string[] args) { List<Student> list = new List<Student>() {new Student(){ ID=1, Name="jack", Age=20},new Student(){ ID=1, Name="mary", Age=25},new Student(){ ID=1, Name="joe", Age=29},new Student(){ ID=1, Name="Aaron", Age=25}, }; //这里我们会对age建立一组键值对 var map = list.AsParallel().ToLookup(i => i.Age, count => 1); //化简统计 var reduce = from IGrouping<int, int> singleMapin map.AsParallel()select new { Age = singleMap.Key, Count = singleMap.Count() }; ///最后遍历 reduce.ForAll(i => { Console.WriteLine("当前Age={0}的人数有:{1}人", i.Age, i.Count); }); } public class Student {public int ID { get; set; } public string Name { get; set; } public int Age { get; set; } public DateTime CreateTime { get; set; } }}
转载于:https://www.cnblogs.com/lonelyxmas/p/3543517.html
8天玩转并行开发——第三天 plinq的使用相关推荐
- 并行开发 —— 第三篇 plinq的使用
2019独角兽企业重金招聘Python工程师标准>>> 1:AsParallel(并行化) 下面我们模拟给ConcurrentDictionary灌入1500w条记录,看看串行和并行 ...
- 8天玩转并行开发——第八天 用VS性能向导解剖你的程序
8天玩转并行开发--第八天 用VS性能向导解剖你的程序 原文 8天玩转并行开发--第八天 用VS性能向导解剖你的程序 最后一篇,我们来说说vs的"性能向导",通常我们调试程序的性能 ...
- 8天玩转并行开发——第六天 异步编程模型
原文:8天玩转并行开发--第六天 异步编程模型 在.net里面异步编程模型由来已久,相信大家也知道Begin/End异步模式和事件异步模式,在task出现以后,这些东西都可以被task包装 起来,可能 ...
- 8天玩转并行开发——第四天 同步机制(上)
在并行计算中,不可避免的会碰到多个任务共享变量,实例,集合.虽然task自带了两个方法:task.ContinueWith()和Task.Factory .ContinueWhenAll()来实现任务 ...
- 8天玩转并行开发——第五天 同步机制(下)
承接上一篇,我们继续说下.net4.0中的同步机制,是的,当出现了并行计算的时候,轻量级别的同步机制应运而生,在信号量这一块 出现了一系列的轻量级,今天继续介绍下面的3个信号量 CountdownEv ...
- 并行开发 4.同步机制(上)
原文:8天玩转并行开发--第四天 同步机制(上) 在并行计算中,不可避免的会碰到多个任务共享变量,实例,集合.虽然task自带了两个方法:task.ContinueWith()和Task.Factor ...
- 玩转iOS开发:NSURLSession讲解(三)
文章分享至我的个人技术博客: https://cainluo.github.io/14986211698053.html 前言 虽然前面两讲都是说了NSURLSession的一些理论上的知识, 但我们 ...
- C#并行开发_Thread/ThreadPool, Task/TaskFactory, Parallel
大家好,本次讨论的是C#中的并行开发,给力吧,随着并行的概念深入,哥也赶上这个潮流了,其实之前讨论C#的异步调用或者C#中BeginInvoke或者Invoke都已经涉及了部分本篇的内容. 参考书目: ...
- bucket sort sample sort 并行_IBM布局AI硬件大杀器:硬软件并行开发、开源模拟AI工具包...
原标题:IBM布局AI硬件大杀器:硬软件并行开发.开源模拟AI工具包 智东西(公众号:zhidxcom) 编 | 子佩 智东西11月4日消息,为了解决AI对数据.能源和内存资源的巨大需求,IBM一直致 ...
最新文章
- 【Intellij IDEA】eclipse项目导入
- atomic原子类实现机制_JUC学习笔记--Atomic原子类
- React Native小白入门学习路径——五
- 一个专业处理字符串的IDEA插件
- mysql拆分字符串后行转列_mysql行转列(拆分字符串场景)
- [转载] 信息系统项目管理挂靠合同(协议)范例1
- 六. 异常处理9.finally块
- mysql 8.0.11-Windows (x86, 64-bit)下载地址与安装教程
- 巧用Linux 命令来拆分Windows下的大文件
- Python 操作快捷键
- html左边图片右边文字_有了这些网站,不用PS也可以做出文字云效果
- C++多线程编程(真实入门)
- 电力系统matlab仿真论文,基于MATLABSimulink的电力系统仿真 实验论文.doc
- OL6.5操作系统安装Mysql5.6
- 0X0000006B导致电脑蓝屏解决
- php获取openid 40163报错,微信支付授权获取 openId {\errcode\:40163,\errmsg\:\code been used, hints: [ req_id:...
- offline RL介绍
- 关于谷歌的一个简单工具以及chrome浏览器更新方法
- python输入三个值输出最大值_python输入十个数如何输出最大值
- PHP生成PDF库(TCPDF)参数说明
热门文章
- python的linux电脑上图标不见了怎么办_电脑桌面及桌面图标消失不见怎么找回?
- 如何防止通过url攻击_什么是XSS攻击?如何防御XSS攻击?
- c调用python第三方库_用 Python ctypes 来调用 C/C++ 编写的第三方库
- UE4学习-请求的操作需要提升
- 认知行为技术是计算机技术吗,基于认知行为模型的多Agent建模技术研究与应用_问答库...
- java 树 右键菜单_jQuery实现自定义右键菜单的树状菜单效果
- python逻辑运算符or的短路求值特性_[Python]计算闰年时候出现的and和or优先级的问题以及短路逻辑...
- c++图形中如何判断鼠标点击在一条直线上_中考数学常考题型精讲精练系列:函数图象上点的存在性问题中的距离与面积...
- 你买的元器件是原装还是翻新?这里有一份攻略。
- 两平面平行方向向量关系_一文读懂 GDT 中的平面度