当前位置: 代码迷 >> ASP.NET >> webclient抓取数据乱码的有关问题
  详细解决方案

webclient抓取数据乱码的有关问题

热度:9516   发布时间:2013-02-25 00:00:00.0
webclient抓取数据乱码的问题
WebClient web = new WebClient();
Stream stream = web.OpenRead(url);
StreamReader sr = new StreamReader(stream, Encoding.Default);
string webData = sr.ReadToEnd();


这里抓取的大多数网站都不会乱码

但抓取一些的时候就会出现乱码,如何通过简洁的手段,能达到抓取的数据都不会乱码?

请教大虾~~

------解决方案--------------------------------------------------------
有的网站使用 GB2312 有的使用UTF8 

StreamReader sr = new StreamReader(stream, Encoding.UTF8);
------解决方案--------------------------------------------------------
StreamReader(stream, Encoding.Default); //和网站的编码方式有关系吧

------解决方案--------------------------------------------------------
英文会有乱码?你就先把头部的信息抓回来 就是<head></head>之间的,或者更简单的用个证则去匹配 charset=
------解决方案--------------------------------------------------------
没有头信息???什么情况没有头信息??
------解决方案--------------------------------------------------------
对阿,网页都应该有这个头部信息的