加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c# – HttpClient返回特殊字符但没有可读性

发布时间:2020-12-15 23:26:13 所属栏目:百科 来源:网络整理
导读:我正在尝试使用async和await和HttpClient下载一个网页,但我只得到一个充满特殊字符的字符串…代码就像.. static async void DownloadPageAsync(string url){ HttpClient client = new HttpClient(); client.DefaultRequestHeaders.TryAddWithoutValidation("
我正在尝试使用async和await和HttpClient下载一个网页,但我只得到一个充满特殊字符的字符串…代码就像..

static async void DownloadPageAsync(string url)
{
    HttpClient client = new HttpClient();
    client.DefaultRequestHeaders.TryAddWithoutValidation("Accept","text/html,application/xhtml+xml,application/xml");
    client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Encoding","gzip,deflate");
    client.DefaultRequestHeaders.TryAddWithoutValidation("User-Agent","Mozilla/5.0 (Windows NT 6.2; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0");
    client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Charset","ISO-8859-1");
    HttpResponseMessage response = await client.GetAsync(url);
    response.EnsureSuccessStatusCode();
    var responseStream = await response.Content.ReadAsStreamAsync();
    var streamReader = new StreamReader(responseStream);
    var str = streamReader.ReadToEnd();

}

和网址是

url = @"http://www.nseindia.com/live_market/dynaContent/live_watch/live_index_watch.htm";

当我做的时候

client.DefaultRequestHeaders.Add("User-Agent","Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; 
                                  WOW64; Trident/6.0)");

代替那四个DefaultRequestHeaders,我得到403错误,但这是nse网站,并且对所有人都是免费的.请各位朋友帮我们正确回复..
问候

斯里瓦斯塔瓦

解决方法

client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Encoding",deflate");

通过这个,您告诉服务器您允许它压缩响应gzip/deflate.所以响应实际上是压缩的,这解释了为什么你会得到你得到的那种响应文本.

如果您想要纯文本,则不应添加标头,因此服务器不会压缩响应.如果删除上一行,则会获得正常的HTML响应文本.

或者,您当然可以保留该标头,并在收到响应后使用GZipStream解压缩响应.这将是这样的:

using (var responseStream = await response.Content.ReadAsStreamAsync())
using (var deflateStream = new GZipStream(responseStream,CompressionMode.Decompress))
using (var streamReader = new StreamReader(deflateStream))
{
    var str = streamReader.ReadToEnd();
    Console.WriteLine(str);
}

理想情况下,您应该检查response.Content.Headers.GetValues(“Content-Encoding”)的值,以确保编码是gzip.既然您还接受了deflate作为可能的编码,那么您可以使用DeflateStream对其进行解码;或者在Content-Encoding标头丢失的情况下不解码任何内容.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读