下载地址:http://nsoup.codeplex.com/
简单用法如下:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
处理网络上的页面:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect(\"http://www.phpstudy.net/\").Get();
但是遗憾的是NSoup默认的编码是UTF-8,处理中文有乱码(对于编码是UTF-8的自然不会有乱码,但是有些GB2312的就可能有乱码,谢谢 forhells的提醒)。
目前我找到两种解决办法:
1.下载网页源代码再处理
WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding(\"utf-8\").GetString(webClient.DownloadData(\"http://www.phpstudy.net\"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
2.获得网页的流
WebRequest webRequest=WebRequest.Create(\"http://www.phpstudy.net\");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),\"utf-8\");
第二种用着比较方便,但是我觉得第一种比较合适,毕竟NSoup是个Html解析类,下载网页代码这种事情本来不应该交给它。
本文地址:https://www.stayed.cn/item/1448
转载请注明出处。
本站部分内容来源于网络,如侵犯到您的权益,请 联系我