باستخدام System.Text.RegularExpressions;//تم تحديده
بواسطة // تم تحديده بواسطة System.Text.RegularExpressions"<"和">"之间的内容
سلسلة خاصة StripHT (سلسلة strHtml)
{
Regex regex=new Regex("<.+?>",RegexOptions.IgnoreCase);
string strOutput=regex.Replace(strHtml"");
إرجاع strOutput؛
}
// 方法二(不知为什么此方法占用CPU100%)
سلسلة ثابتة عامة DropHTML(string strHtml)
{
سلسلة [] aryReg = {
@"<script[^>]*?>.*?</script>",
@"<(/s*)؟!?((w+:)?w+)(w+(s*=?s*(([""''])( \["" ''tbnr]|[^7])*?7|w+)|.{0})|s)*?(/s *)?>"،
@"([r])[s]+"،
@"&(quot|#34);"،
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(سنت|#162);",
@"&(جنيه|#163);",
@"&(نسخة|#169);",
@"&#(d+);",
@"-->"،
@"<!--.*"
};
سلسلة [] aryRep = {
""،
""،
""،
"""،
"&"،
"<"،
">"،
" "،
"xa1"، // مركز حقوق الإنسان (161)،
"xa2"،//مركز حقوق الإنسان (162)،
"xa3"،//مركز حقوق الإنسان (163)،
"xa9"، // مركز حقوق الإنسان (169)،
""،
" ص"،
""
};
string newReg =aryReg[0];
string strOutput=strHtml;
ل(int i = 0;i<aryReg.Length;i++)
{
Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );
strOutput = regex.Replace(strOutput,aryRep[i]);
}
strOutput.Replace("<"،"");
strOutput.Replace(">"،"");
strOutput.Replace("r"،"");
إرجاع strOutput؛
}
http://www.cnblogs.com/wang123/archive/2006/09/16/505758.html