前些日子,爆出N篇說c#/.net太慢的,要求刪除c#/.net部分特性的文章。
撇開那些文章不說,c#/.net慢似乎是業界公認的鐵則,不論大家如何證明c#/.net其實不比c++慢多少,但應用程式層級的效能卻依然這麼慢。
那麼c#/.net慢在哪裡?
很不幸的是大部分c#程式是被大部分程式設計師拖慢的,也許這個結論不太容易被人接受,卻是一個廣泛存在的。
String的操作
幾乎所有的程式都有String操作,至少90%的程式需要忽略大小寫的比較,檢查一下程式碼,至少其中大半的應用程式有類似這樣的程式碼:
if (str1.ToUpper() == str2.ToUpper())
或是ToLower版的,甚至我還看過有Web的HttpModule裡面寫上了:
for (int i = 0; i < strs.Count; i++)
if (value.ToUpper() == strs[i].ToUpper())
//...
想一下,每個頁面請求過來,都要執行這樣一段程式碼,大片大片的創建string實例,更誇張的是還有人說這是用空間換時間。 。 。
性能測試
說這個方法慢,也許還有人不承認,認為這就是最好的方法,所以這裡要用具體測試來擺個事實。
首先準備一個測試性能的方法:
private static TResult MeasurePerformance<TArg, TResult>(Func<TArg, TResult> func, TArg arg, int loop)
{
GC.Collect();
int gc0 = GC.CollectionCount(0);
int gc1 = GC.CollectionCount(1);
int gc2 = GC.CollectionCount(2);
TResult result = default(TResult);
Stopwatch sw = Stopwatch.StartNew();
for (int i = 0; i < loop; i++)
{
result = func(arg);
}
Console.WriteLine(sw.ElapsedMilliseconds.ToString() + "ms");
Console.WriteLine("GC 0:" + (GC.CollectionCount(0) - gc0).ToString());
Console.WriteLine("GC 1:" + (GC.CollectionCount(1) - gc1).ToString());
Console.WriteLine("GC 2:" + (GC.CollectionCount(2) - gc2).ToString());
return result;
}
然後來準備一個堆string:
private static List<string> CreateStrings()
{
List<string> strs = new List<string>(10000);
char[] chs = new char[3];
for (int i = 0; i < 10000; i++)
{
int j = i;
for (int k = 0; k < chs.Length; k++)
{
chs[k] = (char)('a' + j % 26);
j = j / 26;
}
strs.Add(new string(chs));
}
return strs;
}
然後來看看ToUpper的實作:
private static bool ImplementByToUpper(List<string> strs, string value)
{
for (int i = 0; i < strs.Count; i++)
if (value.ToUpper() == strs[i].ToUpper())
return true;
return false;
}
最後準備好main方法:
List<string> strs = CreateStrings();
bool result;
Console.WriteLine("Use ImplementByToUpper");
result = MeasurePerformance(s => ImplementByToUpper(strs, s), "yZh", 1000);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();
來看看執行結果:
Use ImplementByToUpper
2192ms
GC 0:247
GC 1:0
GC 2:0
result is True
來個比較測試,用string.Equals來測試一下:
private static bool ImplementByStringEquals(List<string> strs, string value)
{
for (int i = 0; i < strs.Count; i++)
if (string.Equals(value, strs[i], StringComparison.CurrentCultureIgnoreCase))
return true;
return false;
}
來看看執行結果:
Use ImplementByStringEquals
1117ms
GC 0:0
GC 1:0
GC 2:0
result is True
對比一下,使用ToUpper的速度要慢一倍,並且有大量的0代垃圾物件。那些號稱是用空間換時間的人可以反思一下了,用空間換來了什麼?負時間嗎?
字典類別的使用
繼續說string的場景,有些人也許會想到用Hash表等類似結構來加速,不錯,這是個好主意,只不過,Hash表不一定總是最佳方案,什麼不相信?還是做個測試吧:
private static bool ImplementByHashSet(List<string> strs, string value)
{
HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
return set.Contains(value);
}
看看執行結果:
Use ImplementByHashSet
5114ms
GC 0:38
GC 1:38
GC 2:38
result is True
驚訝吧,速度比用ToUpper還慢了1倍多,2代垃圾也38次的回收(執行2代垃圾回收時,會強制執行1代和0代垃圾回收)。
不過使用Hash表等類似來加速這個想法本身是一個很正確的想法,不過前提是Hash表本身能夠緩存,例如:
private static Func<string, bool> ImplementByHashSet2(List<string> strs)
{
HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
return set.Contains;
}
然後把main的方法修改為:
Console.WriteLine("Use ImplementByHashSet2");
result = MeasurePerformance(s =>
{
var f = ImplementByHashSet2(strs);
bool ret = false;
for (int i = 0; i < 1000; i++)
{
ret = f(s);
}
return ret;
}, "yZh", 1);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();
再看看結果:
Use ImplementByHashSet2
6ms
GC 0:0
GC 1:0
GC 2:0
result is True
性能出現了飛躍性的增長。
更多
是什麼拖慢了c#/.net?簡單的說:不必要的創建對象,不必要的同步,循環執行低效的方法(例如被firelong重點批鬥的反射,不過ms並沒有讓你在循環裡面使用Invoke),使用低效的數據結構和演算法(看看快取情況下Hash表類似結構的驚人表現,就知道差異了)
c#/.net的低門檻確實在一定程度上有利於把更多的程式設計師拉入c#/.net,但是也確實把整個c#/.net程式的程式碼水平降低了不少,這一點確實很令人擔憂。
最後別忘了一點,一個系統能有多少效能,不是由這個系統中表現最好的部分決定的,而是由這個系統中表現最差的部分所決定的。配上一台有16g內存,100t硬碟,加上頂級的顯示卡,缺配上386的cpu,這台電腦的性能就是386的性能。同樣,c#/.net再好,寫程式的人程度差,寫出來的程式的效能自然也差了。