これは HTML を分析するための非常に優れたクラスです。
時間を大幅に節約できました。
プロジェクトアドレス
http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack
たとえば、HTML ファイル内のすべての href を修正する方法は次のとおりです。
HtmlDocument doc = new HtmlDocument();
doc.Load("ファイル.htm");
foreach(doc.DocumentElement.SelectNodes(" //a@href ") の HtmlNode リンク
{
HtmlAttribute att = リンク"href";
att.Value = FixLink(att);
}
doc.Save("file.htm");
プロジェクトに参加したい場合は、そこにソースを置くことが目的ですから、フォーラムを使用するか、私にメモを送ってください (hotmail dot com の simon underscore mourier) !
コーディング、スクレイピング、スキャン、HTML 化、XHTML 化などを楽しんでください :^)
サイモン・ムーリエ。