一:背景

1. 讲故事

昨天群里有位朋友问:linq 查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用?

其实这个问题我觉得问的挺好,很多初学 C# 的朋友或多或少都有这样的疑问,甚至有 3,4 年工作经验的朋友可能都不是很清楚,这就导致在写代码的时候总是会畏手畏脚,还会莫名的揪心这样玩的话内存会不会暴涨暴跌,这一篇我就用 windbg 来帮助朋友彻底分析一下。

二:寻找答案

1. 一个小案例

这位老弟提到了是深拷贝还是浅拷贝,本意就是想问: linq 一个引用类型集合 到底会怎样? 这里我先模拟一个集合,代码如下:

    class Program{static void Main(string[] args){var personList = new List<Person>() {new Person() { Name="jack", Age=20 },new Person() { Name="elen",Age=25,  },new Person() {  Name="john", Age=22 }};var query = personList.Where(m => m.Age > 20).ToList();Console.WriteLine($"query.count={query.Count}");Console.ReadLine();}}class Person{public string Name { get; set; }public int Age { get; set; }}

2. 真的是深copy吗?

如果用 windbg 的话,就非常简单了,假设是深copy 的话,那么 query 之后,托管堆上就会有 5个 Person,那是不是这样呢? 用 !dumpheap -stat -type Person 到托管堆验证一下即可。

0:000> !dumpheap -stat -type Person
Statistics:MT    Count    TotalSize Class Name
00007ff7f27c3528        1           64 System.Func`2[[ConsoleApp5.Person, ConsoleApp5],[System.Boolean, System.Private.CoreLib]]
00007ff7f27c2b60        2           64 System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c9878        1           72 System.Linq.Enumerable+WhereListIterator`1[[ConsoleApp5.Person, ConsoleApp5]]
00007ff7f27c7a10        3          136 ConsoleApp5.Person[]
00007ff7f27c2ad0        3           96 ConsoleApp5.Person

从最后一行输出可以看到: ConsoleApp5.Person 的 Count=3,也就表明没有所谓的深copy,如果你还不信的话,可以在 query 中修改某一个Person的Age,看看原始的 personList 集合是不是同步更新,修改代码如下:

        static void Main(string[] args){var personList = new List<Person>() {new Person() { Name="jack", Age=20 },new Person() { Name="elen",Age=25,  },new Person() {  Name="john", Age=22 }};var query = personList.Where(m => m.Age > 20).ToList();//故意修改 Age=25 为  Age=100; query[0].Age = 100;Console.WriteLine($"query[0].Age={query[0].Age}, personList[2].Age={personList[1].Age}");Console.ReadLine();}

从截图来看更加验证了 并没有所谓的 深copy 一说。

3. 真的是 copy 引用吗?

要验证是不是 copy 引用,最粗暴的方法就是看看 query 这个数组在 托管堆上的存储行态就明白了,同样你也可以借助 windbg 去验证一下,先到线程栈去找 query 变量,然后用 da 命令 对 query 进行打印。

0:000> !clrstack -l
OS Thread Id: 0x809c (0)Child SP               IP Call Site
000000E143D7E9B0 00007ff7f26f18be ConsoleApp5.Program.Main(System.String[]) [E:net5ConsoleApp5ConsoleApp5Program.cs @ 20]LOCALS:0x000000E143D7EA38 = 0x00000218266aab700x000000E143D7EA30 = 0x00000218266aad980:000> !do 0x00000218266aad98
Name:        System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]
MethodTable: 00007ff7f27b2b60
EEClass:     00007ff7f27abad0
Size:        32(0x20) bytes
File:        C:Program FilesdotnetsharedMicrosoft.NETCore.App3.1.9System.Private.CoreLib.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
0000000000000000  4001c35        8              SZARRAY  0 instance 00000218266aadb8 _items
00007ff7f26bb1f0  4001c36       10         System.Int32  1 instance                2 _size
00007ff7f26bb1f0  4001c37       14         System.Int32  1 instance                2 _version
0000000000000000  4001c38        8              SZARRAY  0   static dynamic statics NYI                 s_emptyArray0:000> !da 00000218266aadb8
Name:        ConsoleApp5.Person[]
MethodTable: 00007ff7f27b7a10
EEClass:     00007ff7f26b6580
Size:        56(0x38) bytes
Array:       Rank 1, Number of elements 4, Type CLASS
Element Methodtable: 00007ff7f27b2ad0
[0] 00000218266aac00
[1] 00000218266aac20
[2] null
[3] null

从最后四行代码可以看出数组有 4 个格子,前2个格子放的是内存地址,后两个都是 null,可能有些朋友会问,query 不是 2 条记录吗? 怎么会有 4 个格子呢? 这是因为 query 是 List 结构,而 List 底层用的是数组,默认以 4 个格子起步,不信的话翻一下 List 原代码即可。

    public class List<T>{private void EnsureCapacity(int min){if (_items.Length < min){int num = (_items.Length == 0) ? 4 : (_items.Length * 2);   //默认 4 个大小if ((uint)num > 2146435071u){num = 2146435071;}if (num < min){num = min;}Capacity = num;}}}

如果你想进一步查看数组中前两个元素 00000218266aac00, 00000218266aac20 指向的是什么,可以用 !do 打印一下即可。

0:000> !do 00000218266aac00
Name:        ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass:     00007ff7f27c2a00
Size:        32(0x20) bytes
File:        E:net5ConsoleApp5ConsoleApp5binDebugnetcoreapp3.1ConsoleApp5.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
00007ff7f2771e18  4000001        8        System.String  0 instance 00000218266aab30 <Name>k__BackingField
00007ff7f26bb1f0  4000002       10         System.Int32  1 instance               25 <Age>k__BackingField
0:000> !do 00000218266aac20
Name:        ConsoleApp5.Person
MethodTable: 00007ff7f27b2ad0
EEClass:     00007ff7f27c2a00
Size:        32(0x20) bytes
File:        E:net5ConsoleApp5ConsoleApp5binDebugnetcoreapp3.1ConsoleApp5.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
00007ff7f2771e18  4000001        8        System.String  0 instance 00000218266aab50 <Name>k__BackingField
00007ff7f26bb1f0  4000002       10         System.Int32  1 instance               22 <Age>k__BackingField

到这里为止,我觉得回答这位朋友的疑问应该是没有问题了,不过这里既然说到了集合中的引用类型,不得不说一下集合中的值类型又会是怎么样的?

三:集合中的值类型是什么样的copy方式

1. 使用 windbg 验证

有了上面的基础,验证这个问题的答案就简单了,先上测试代码

        static void Main(string[] args){var list = new List<int>() { 1, 2, 3, 4, 5, 6, 7,8,9,10 };var query = list.Where(m => m > 5).ToList();Console.ReadLine();}

然后直接把整个数组内容打印出来

// list
0:000> !DumpArray /d 0000019687c8aba8
Name:        System.Int32[]
MethodTable: 00007ff7f279f090
EEClass:     00007ff7f279f010
Size:        88(0x58) bytes
Array:       Rank 1, Number of elements 16, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8abb8
[1] 0000019687c8abbc
[2] 0000019687c8abc0
[3] 0000019687c8abc4
[4] 0000019687c8abc8
[5] 0000019687c8abcc
[6] 0000019687c8abd0
[7] 0000019687c8abd4
[8] 0000019687c8abd8
[9] 0000019687c8abdc
[10] 0000019687c8abe0
[11] 0000019687c8abe4
[12] 0000019687c8abe8
[13] 0000019687c8abec
[14] 0000019687c8abf0
[15] 0000019687c8abf4// query
0:000> !DumpArray /d 0000019687c8ae68
Name:        System.Int32[]
MethodTable: 00007ff7f279f090
EEClass:     00007ff7f279f010
Size:        56(0x38) bytes
Array:       Rank 1, Number of elements 8, Type Int32
Element Methodtable: 00007ff7f26cb1f0
[0] 0000019687c8ae78
[1] 0000019687c8ae7c
[2] 0000019687c8ae80
[3] 0000019687c8ae84
[4] 0000019687c8ae88
[5] 0000019687c8ae8c
[6] 0000019687c8ae90
[7] 0000019687c8ae94

仔细对比 list 和 query 的数组呈现,发现有两点好玩的信息:

  • 值类型和引用类型一样,数组中都是存放地址的。
  • 值类型数组中的所有格子都被填满,不像引用类型数组中还有 null 的情况。

接下来的问题是,数组中每个元素的地址到底指向了谁,可以挑出每个数组的 0 号元素地址,用 dp 命令看一看:

//list
0:000> dp 0000019687c8abb8
00000196`87c8abb8  00000002`00000001 00000004`00000003
00000196`87c8abc8  00000006`00000005 00000008`00000007
00000196`87c8abd8  0000000a`00000009 00000000`00000000//query
0:000> dp 0000019687c8ae78
00000196`87c8ae78  00000007`00000006 00000009`00000008
00000196`87c8ae88  00000000`0000000a 00000000`00000000

看到没有,原来地址上面存放的都是数字值,深copy无疑哈。

四:总结

以上所有的分析可以得出:引用类型数组是引用copy,值类型数组是深copy,有时候背诵得来的东西总是容易忘记,只有实操验证才能真正的刻骨铭心!

更多高质量干货:参见我的 GitHub: dotnetfly

修改linq结果集_linq 查询的结果会开辟新的内存吗?相关推荐

  1. linq 查询的结果会开辟新的内存吗?

    一:背景 1. 讲故事 昨天群里有位朋友问:linq 查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用? 其实这个问题我觉得问的挺好,很多初学 C# 的朋友或多或 ...

  2. 修改linq结果集_UTXO集优化

    在这个系列文章的一开始,我们就提到了,区块链是一个分布式数据库.不过在之前的文章中,我们选择性地跳过了"分布式"这个部分,而是将注意力都放到了"数据库"部分.到 ...

  3. QueryBuilder : 打造优雅的Linq To SQL动态查询

    首先我们来看看日常比较典型的一种查询Form 这个场景很简单:就是根据客户名.订单日期.负责人来作筛选条件,然后找出符合要求的订单. 在那遥远的时代,可能避免不了要写这样的简单接口: public i ...

  4. datatable中使用linq的条件或_C# 10. LINQ 的三种查询语句写法

    前言: LINQ(语言集成查询)是 C#编程语言中的一部分.它在.NET Framework 3.5 和 C#3.0 被引入,在 System.Linq 命名空间中使用.LINQ 为我们提供了通用的查 ...

  5. JPA学习笔记---JPA数据的操作:增加,删除,修改,获取,使用JPQL进行查询

    JPA学习笔记---JPA数据的操作:增加,删除,修改,获取,使用JPOL进行查询 创梦技术交流平台:资源下载,技术交流,网络赚钱: 交流qq群:1群:248318056 2群:251572072 技 ...

  6. linq拼接where语句_C# 10. LINQ 的三种查询语句写法

    C# 10. LINQ 的三种查询语句写法 前言: LINQ(语言集成查询)是 C#编程语言中的一部分.它在.NET Framework 3.5 和 C#3.0 被引入,在 System.Linq 命 ...

  7. [LINQ2Dapper]最完整Dapper To Linq框架(二)---动态化查询

    目录 [LINQ2Dapper]最完整Dapper To Linq框架(一)---基础查询 [LINQ2Dapper]最完整Dapper To Linq框架(二)---动态化查询 [LINQ2Dapp ...

  8. mysql之把查询的结果保存到新表

    有时我们要把查询的结果保存到新表里,创建新表,查询,插入显得十分麻烦. 其实直接可以搞定.例如把表2的查询结果插入表1: 如果表存在: insert into tab1 select * from t ...

  9. python:自定义函数,通过姓名及电话查询人员信息及添加新人员信息表(列表+字典)

    python:自定义函数,通过姓名及电话查询人员信息及添加新人员信息表(列表+字典) def zmz(c):s=[{'姓名':'','电话':'','部门':'','小组':'','职务':''}] ...

最新文章

  1. 一文读懂机器学习、数据科学、人工智能、深度学习和统计学之间的区别!
  2. Windows Server基础架构云参考架构:硬件之上的设计
  3. python简介怎么写-python爬虫简历怎么写
  4. phpwind 8.7 发布主题 分析
  5. pythonwin32api拖动图标_Python使用win32api,模拟鼠标移动并复制/粘贴到diskfi中
  6. smarty5变量修改器
  7. mysql 查询分析器中使用if_查询分析器中开发代码测试检查_MySQL
  8. 从零开始实现ASP.NET Core MVC的插件式开发(二) - 如何创建项目模板
  9. linux命令 翻译,(翻译)Linux命令行(一)
  10. 说一下安卓的touch事件分发机制
  11. 面向对象10:多态性的使用、重载和重写的区别、多态性的实用意义
  12. python小游戏源码
  13. 解决docker下载安装速度慢的问题
  14. 四轴飞行器基本组成及其飞行原理详解
  15. 什么是IAST(交互式应用安全测试)?
  16. 网页flash遮挡问题
  17. 2022年漏洞事件盘点
  18. 写给需要面试经验的交互设计师(上)
  19. 鱼眼镜头/全景相机原理/全景相机标定
  20. 一个直播源码搭建教程,教你如何完成一个完整的直播

热门文章

  1. 判断相等_C语言判断字符串是否为回文
  2. Flutter尝鲜3——动画处理并行和串行
  3. 超越cookie - 使用DOM sessionStorage和localStorage来保存更多信
  4. 从0到1打造一款react-native App(二)Navigation+Redux
  5. TortoiseGit使用入门
  6. 穹顶之下 众信金融邀您共植树助环保
  7. apache2.4.7 make报错[exports.lo] Error 1 解决方法
  8. 使用HttpWebRequest方式访问外部接口
  9. 由a标签的onclick影出来的问题
  10. 供应链管理优化和革新八大关键因素