19
08/2014
HtmlAgilityPack解析html
1、下载库:http://htmlagilitypack.codeplex.com/
2、添加相应库到项目中。参考:vs2013中c#引用第三方库
3、引入包:using HtmlAgilityPack;
4、相关方法:
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(content);
string updateTime = doc.GetElementbyId("tabDays").SelectSingleNode("./p").InnerHtml.Replace("更新", "");
DateTime DT_updateTime = DateTime.Parse(updateTime);
HtmlNodeCollection dataNode = doc.DocumentNode.SelectNodes("//ul[@id='Hour3']/li"); //我们要爬取得数据都在这里
foreach (HtmlNode node in dataNode)
{
//抽取今天的天气预报
if (node.GetAttributeValue("data-dn","") == "7d1") {
。。。
}
//抽取明天的天气预报
else if (node.GetAttributeValue("data-dn", "") == "7d2")
{
。。。
}
}4、额外补充。
一直都期望找一个有像jquery一样选择器的html解析器,终于找到一个:jumony(http://jumony.codeplex.com/),但是它的解析速度不敢恭维,权衡了一下,还是用htmlagilitypack,其选择器xpath其实也挺方便的。
转载请注明:康瑞部落 » HtmlAgilityPack解析html

0 条评论