2020-12-01

linq 查询的结果会开辟新的内存吗?

一:背景

1. 讲故事

昨天群里有位朋友问:linq 查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用?

其实这个问题我觉得问的挺好,很多初学 C# 的朋友或多或少都有这样的疑问,甚至有 3,4 年工作经验的朋友可能都不是很清楚,这就导致在写代码的时候总是会畏手畏脚,还会莫名的揪心这样玩的话内存会不会暴涨暴跌,这一篇我就用 windbg 来帮助朋友彻底分析一下。

二:寻找答案

1. 一个小案例

这位老弟提到了是深拷贝还是浅拷贝,本意就是想问: linq 一个引用类型集合 到底会怎样? 这里我先模拟一个集合,代码如下:

 class Program {  static void Main(string[] args)  {   var personList = new List<Person>() {            new Person() { Name="jack", Age=20 },            new Person() { Name="elen",Age=25, },            new Person() { Name="john", Age=22 }           };   var query = personList.Where(m => m.Age > 20).ToList();   Console.WriteLine($"query.count={query.Count}");   Console.ReadLine();  } } class Person {  public string Name { get; set; }  public int Age { get; set; } }

2. 真的是深copy吗?

如果用 windbg 的话,就非常简单了,假设是深copy 的话,那么 query 之后,托管堆上就会有 5个 Person,那是不是这样呢? 用 !dumpheap -stat -type Person 到托管堆验证一下即可。

0:000> !dumpheap -stat -type PersonStatistics:    MT Count TotalSize Class Name00007ff7f27c3528  1   64 System.Func`2[[ConsoleApp5.Person, ConsoleApp5],[System.Boolean, System.Private.CoreLib]]00007ff7f27c2b60  2   64 System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]00007ff7f27c9878  1   72 System.Linq.Enumerable+WhereListIterator`1[[ConsoleApp5.Person, ConsoleApp5]]00007ff7f27c7a10  3   136 ConsoleApp5.Person[]00007ff7f27c2ad0  3   96 ConsoleApp5.Person

从最后一行输出可以看到: ConsoleApp5.Person 的 Count=3,也就表明没有所谓的深copy,如果你还不信的话,可以在 query 中修改某一个Person的Age,看看原始的 personList 集合是不是同步更新,修改代码如下:

  static void Main(string[] args)  {   var personList = new List<Person>() {            new Person() { Name="jack", Age=20 },            new Person() { Name="elen",Age=25, },            new Person() { Name="john", Age=22 }           };   var query = personList.Where(m => m.Age > 20).ToList();   //故意修改 Age=25 为 Age=100;    query[0].Age = 100;   Console.WriteLine($"query[0].Age={query[0].Age}, personList[2].Age={personList[1].Age}");   Console.ReadLine();  }

从截图来看更加验证了 并没有所谓的 深copy 一说。

3. 真的是 copy 引用吗?

要验证是不是 copy 引用,最粗暴的方法就是看看 query 这个数组在 托管堆上的存储行态就明白了,同样你也可以借助 windbg 去验证一下,先到线程栈去找 query 变量,然后用 da 命令 对 query 进行打印。

0:000> !clrstack -lOS Thread Id: 0x809c (0)  Child SP    IP Call Site000000E143D7E9B0 00007ff7f26f18be ConsoleApp5.Program.Main(System.String[]) [E:\net5\ConsoleApp5\ConsoleApp5\Program.cs @ 20] LOCALS:  0x000000E143D7EA38 = 0x00000218266aab70  0x000000E143D7EA30 = 0x00000218266aad980:000> !do 0x00000218266aad98Name:  System.Collections.Generic.List`1[[ConsoleApp5.Person, ConsoleApp5]]MethodTable: 00007ff7f27b2b60EEClass:  00007ff7f27abad0Size:  32(0x20) bytesFile:  C:\Program Files\dotnet\shared\Microsoft.NETCore.App\3.1.9\System.Private.CoreLib.dllFields:    MT Field Offset     Type VT  Attr   Value Name0000000000000000 4001c35  8    SZARRAY 0 instance 00000218266aadb8 _items00007ff7f26bb1f0 4001c36  10   System.Int32 1 instance    2 _size00007ff7f26bb1f0 4001c37  14   System.Int32 1 instance    2 _version0000000000000000 4001c38  8    SZARRAY 0 static dynamic statics NYI     s_emptyArray0:000> !da 00000218266aadb8Name:  ConsoleApp5.Person[]MethodTable: 00007ff7f27b7a10EEClass:  00007ff7f26b6580Size:  56(0x38) bytesArray:  Rank 1, Number of elements 4, Type CLASSElement Methodtable: 00007ff7f27b2ad0[0] 00000218266aac00[1] 00000218266aac20[2] null[3] null

从最后四行代码可以看出数组有 4 个格子,前2个格子放的是内存地址,后两个都是 null,可能有些朋友会问,query 不是 2 条记录吗? 怎么会有 4 个格子呢? 这是因为 query 是 List 结构,而 List 底层用的是数组,默认以 4 个格子起步,不信的话翻一下 List 原代码即可。

 public class List<T> {  private void EnsureCapacity(int min)  {   if (_items.Length < min)   {    int num = (_items.Length == 0) ? 4 : (_items.Length * 2); //默认 4 个大小    if ((uint)num > 2146435071u)    {     num = 2146435071;    }    if (num < min)    {     num = min;    }    Capacity = num;   }  } }

如果你想进一步查看数组中前两个元素 00000218266aac00, 00000218266aac20 指向的是什么,可以用 !do 打印一下即可。

0:000> !do 00000218266aac00Name:  ConsoleApp5.PersonMethodTable: 00007ff7f27b2ad0EEClass:  00007ff7f27c2a00Size:  32(0x20) bytesFile:  E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dllFields:    MT Field Offset     Type VT  Attr   Value Name00007ff7f2771e18 4000001  8  System.String 0 instance 00000218266aab30 <Name>k__BackingField00007ff7f26bb1f0 4000002  10   System.Int32 1 instance    25 <Age>k__BackingField0:000> !do 00000218266aac20Name:  ConsoleApp5.PersonMethodTable: 00007ff7f27b2ad0EEClass:  00007ff7f27c2a00Size:  32(0x20) bytesFile:  E:\net5\ConsoleApp5\ConsoleApp5\bin\Debug\netcoreapp3.1\ConsoleApp5.dllFields:    MT Field Offset     Type VT  Attr   Value Name00007ff7f2771e18 4000001  8  System.String 0 instance 00000218266aab50 <Name>k__BackingField00007ff7f26bb1f0 4000002  10   System.Int32 1 instance    22 <Age>k__BackingField

到这里为止,我觉得回答这位朋友的疑问应该是没有问题了,不过这里既然说到了集合中的引用类型,不得不说一下集合中的值类型又会是怎么样的?

三:集合中的值类型是什么样的copy方式

1. 使用 windbg 验证

有了上面的基础,验证这个问题的答案就简单了,先上测试代码

  static void Main(string[] args)  {   var list = new List<int>() { 1, 2, 3, 4, 5, 6, 7,8,9,10 };   var query = list.Where(m => m > 5).ToList();   Console.ReadLine();  }

然后直接把整个数组内容打印出来

// list0:000> !DumpArray /d 0000019687c8aba8Name:  System.Int32[]MethodTable: 00007ff7f279f090EEClass:  00007ff7f279f010Size:  88(0x58) bytesArray:  Rank 1, Number of elements 16, Type Int32Element Methodtable: 00007ff7f26cb1f0[0] 0000019687c8abb8[1] 0000019687c8abbc[2] 0000019687c8abc0[3] 0000019687c8abc4[4] 0000019687c8abc8[5] 0000019687c8abcc[6] 0000019687c8abd0[7] 0000019687c8abd4[8] 0000019687c8abd8[9] 0000019687c8abdc[10] 0000019687c8abe0[11] 0000019687c8abe4[12] 0000019687c8abe8[13] 0000019687c8abec[14] 0000019687c8abf0[15] 0000019687c8abf4// query0:000> !DumpArray /d 0000019687c8ae68Name:  System.Int32[]MethodTable: 00007ff7f279f090EEClass:  00007ff7f279f010Size:  56(0x38) bytesArray:  Rank 1, Number of elements 8, Type Int32Element Methodtable: 00007ff7f26cb1f0[0] 0000019687c8ae78[1] 0000019687c8ae7c[2] 0000019687c8ae80[3] 0000019687c8ae84[4] 0000019687c8ae88[5] 0000019687c8ae8c[6] 0000019687c8ae90[7] 0000019687c8ae94

仔细对比 list 和 query 的数组呈现,发现有两点好玩的信息:

  • 值类型和引用类型一样,数组中都是存放地址的。

  • 值类型数组中的所有格子都被填满,不像引用类型数组中还有 null 的情况。

接下来的问题是,数组中每个元素的地址到底指向了谁,可以挑出每个数组的 0 号元素地址,用 dp 命令看一看:

//list0:000> dp 0000019687c8abb800000196`87c8abb8 00000002`00000001 00000004`0000000300000196`87c8abc8 00000006`00000005 00000008`0000000700000196`87c8abd8 0000000a`00000009 00000000`00000000//query0:000> dp 0000019687c8ae7800000196`87c8ae78 00000007`00000006 00000009`0000000800000196`87c8ae88 00000000`0000000a 00000000`00000000

看到没有,原来地址上面存放的都是数字值,深copy无疑哈。

四:总结

以上所有的分析可以得出:引用类型数组是引用copy,值类型数组是深copy,有时候背诵得来的东西总是容易忘记,只有实操验证才能真正的刻骨铭心!🤭🤭🤭

更多高质量干货:参见我的 GitHub: dotnetfly

图片名称







原文转载:http://www.shaoqun.com/a/494491.html

联动优势电子商务:https://www.ikjzd.com/w/1921

淘粉吧首页:https://www.ikjzd.com/w/1725.html

sonar:https://www.ikjzd.com/w/215


一:背景1.讲故事昨天群里有位朋友问:linq查询的结果会开辟新的内存吗?如果开了,那是对原序列集里面元素的深拷贝还是仅仅拷贝其引用?其实这个问题我觉得问的挺好,很多初学C#的朋友或多或少都有这样的疑问,甚至有3,4年工作经验的朋友可能都不是很清楚,这就导致在写代码的时候总是会畏手畏脚,还会莫名的揪心这样玩的话内存会不会暴涨暴跌,这一篇我就用windbg来帮助朋友彻底分析一下。二:寻找答案1.一个
易佰:易佰
派代:派代
2018年prime day即将来临,亚马逊灯具类目却遭受重大变故!:2018年prime day即将来临,亚马逊灯具类目却遭受重大变故!
没钱也任性!疫情期间竟然有1.18亿人在使用Prime会员!:没钱也任性!疫情期间竟然有1.18亿人在使用Prime会员!
刚刚,中方宣布制裁美国!多国同时宣布去美元化!:刚刚,中方宣布制裁美国!多国同时宣布去美元化!

No comments:

Post a Comment