博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MFC抓取网页代码简单版。
阅读量:4539 次
发布时间:2019-06-08

本文共 1491 字,大约阅读时间需要 4 分钟。

最近又在网上找了一些有关MFC抓取网页代码的文章看,发现有个比较简单的代码,和大家分享下。

CInternetSession session(NULL, 0);    CHttpFile* htmlFile = NULL;    CString strLine, strHtml;    CString url = _T("http://www.tqyb.com.cn/data/gzWeather/gz_weatherForecastInDays.js?");    TCHAR sRecv[1024];    UINT CodePage = 65001;//CP_UTF8:65001 CP_ACP:0    strHtml = _T("");    //获取网页源码      htmlFile = (CHttpFile*)session.OpenURL(url);//重新打开连接      DWORD dwStatusCode;  //接受请求返回值    htmlFile->QueryInfoStatusCode(dwStatusCode);    if (dwStatusCode == HTTP_STATUS_OK)    {        while (htmlFile->ReadString(sRecv, 1024))        {            // 编码转换,可解决中文乱码问题              //gb2312转为unicode,则用CP_ACP              //gbk转为unicode,也用CP_ACP              //utf-8转为unicode,则用CP_UTF8              int nBufferSize = MultiByteToWideChar(CodePage, 0, (LPCSTR)sRecv, -1, NULL, 0);            wchar_t *pBuffer = new wchar_t[nBufferSize + 1];            memset(pBuffer, 0, (nBufferSize + 1)*sizeof(wchar_t));            //gb2312转为unicode,则用CP_ACP              //gbk转为unicode,也用CP_ACP              //utf-8转为unicode,则用CP_UTF8              MultiByteToWideChar(CodePage, 0, (LPCSTR)sRecv, -1, pBuffer, nBufferSize*sizeof(wchar_t));            strHtml += pBuffer;            strHtml += "\r\n";            delete pBuffer;        }    }        htmlFile->Close();    session.Close();    delete htmlFile;

注意了,这个网址代码格式是UTF8,中文会乱码,所以加了一个字符之间的转换,//PageCode = 65001.

而且在设置vs时,字符集要设置成多字符。

项目->属性->字符集->多字节字符。

转载于:https://www.cnblogs.com/learning-lzj2014/p/3917119.html

你可能感兴趣的文章
qt 读取xml文件
查看>>
python3之正则表达式
查看>>
Visual Studio提示“无法启动IIS Express Web服务器”的解决方法
查看>>
Java 时间总结
查看>>
jQuery EasyUI 拖放 – 基本的拖动和放置
查看>>
这些年正Android - 母亲
查看>>
[工具] BurpSuite--XssValidator插件
查看>>
LPC1788系统时钟初始化
查看>>
channel vs mutex
查看>>
页面布局(--FlowLayout,--BorderLayout,--GridLayout)
查看>>
实验吧--web--你真的会php吗
查看>>
vue组件化学习第二天
查看>>
网络枚举工具推荐
查看>>
003LeetCode--LongestSubstring
查看>>
quarzt(官方)---给自己看的文档(SchedulerListeners)-8
查看>>
Linux-慕课网学习笔记-3-1命令格式
查看>>
AJAX入门介绍
查看>>
[算法竞赛入门]第一章_算法概述
查看>>
SQL反模式笔记3——主键规范
查看>>
简单粗暴,微生物生态研究中常用数据库简介--转载
查看>>