Hier ist eine sehr gute Klasse zum Analysieren von HTML.
Hat viel Zeit gespart.
Projektadresse
http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack
So würden Sie beispielsweise alle hrefs in einer HTML-Datei korrigieren:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode-Link in doc.DocumentElement.SelectNodes(" //a@href ")
{
HtmlAttribute att = link"href";
att.Value = FixLink(att);
}
doc.Save("file.htm");
Wenn Sie an dem Projekt teilnehmen möchten – denn das ist der eigentliche Zweck der Bereitstellung der Quelle –, nutzen Sie die Foren oder schreiben Sie mir eine Nachricht (Simon Underscore Mourier bei Hotmail Dot Com) !
Viel Spaß beim Codieren, Scrapen, Scannen, HTML-ing, xhtml-ing usw... :^)
Simon Mourier.