Aquí hay una muy buena clase para analizar HTML.
Ahorré mucho tiempo.
Dirección del proyecto
http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack
Por ejemplo, así es como arreglarías todos los hrefs en un archivo HTML:
HtmlDocument doc = new HtmlDocument();
doc.Load("archivo.htm");
foreach(enlace HtmlNode en doc.DocumentElement.SelectNodes(" //a@href ")
{
HtmlAttribute att = enlace"href";
att.Value = FixLink(att);
}
doc.Save("file.htm");
Si desea participar en el proyecto, porque ese es el propósito de poner la fuente allí, ¿verdad? Utilice los foros o envíeme una nota (simon underscore mourier en hotmail punto com) !
Feliz codificación, scraping, escaneo, html-ing, xhtml-ing, etc... :^)
Simón Mourier.