Вот очень хороший класс для анализа HTML.
Сэкономлено много времени.
Адрес проекта
http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack
Например, вот как можно исправить все ссылки в HTML-файле:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach (ссылка HtmlNode в doc.DocumentElement.SelectNodes(" //a@href ")
{
HtmlAttribute att = ссылка «href»;
att.Value = FixLink(att);
}
doc.Save("file.htm");
Если вы хотите принять участие в проекте - потому что именно в этом и состоит цель размещения исходного кода - воспользуйтесь форумом или напишите мне (Саймон подчеркнет Мурье на hotmail dot com) !
Приятного кодирования, очистки, сканирования, обработки HTML, xhtml и т. д. :^)
Саймон Мурье.