Linq实现快速Datatable列重复项提取
遍历方式的效率低
- 需要遍历所有行,每一行还需要向下比对。针对3万行的文本,比对前100行文本,耗时8秒左右。
- 需要新增标记字段,标注哪些已经比对
Linq分组效率
- 测试了3万行的文本,重复项提取只要2秒左右
- 可以获取重复次数
Linq实现代码
代码说明
- _dt1.AsEnumerable(): 使得datatable支持 IEnumerable
接口,Linq需要此接口支持 - orderby m.Count() descending: 按重复次数从大到小排序。
程序截图,