当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 4 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : [问题]输入网址,将该网页保存…… 不知道应该从哪儿下手?
帖子发表于 : 2007-12-30 18:53 

注册: 2007-04-27 23:07
帖子: 240
送出感谢: 0 次
接收感谢: 0 次
课程设计,输入网址,然后将该网页的内容保存,也可以指定链接层数,即将该网页内的链接也下载下来

不知道该从哪儿下手?
应该看些什么方面的书籍??
最好是用C/C++的

3Q


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2007-12-30 21:27 
头像

注册: 2007-07-12 16:30
帖子: 303
地址: 桂林
送出感谢: 0 次
接收感谢: 2
先了解TCP/IP编程,再了解HTTP协议。
例如,给定URL“http://www.xxxxxxxxx.com/xxxx.html”:
通过TCP/IP编程,发送“GET /xxxx.html”请求到主机“www.xxxxxxxxx.com”的80端口。


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-01-07 21:04 

注册: 2007-01-22 10:22
帖子: 55
送出感谢: 0 次
接收感谢: 0 次
代码:
//根据请求的相对URL输出HTTP请求头
void FormatRequestHeader(char *&m_requestheader, int &Length, char *pServer,char *pObject,char *pCookie = NULL, char *pReferer = NULL, long nFrom = 0,long nTo = 0, int nServerType = 0)
{

   char szTemp[20];

   //第1行:方法,请求的路径,版本
   strcat(m_requestheader,"GET ");

   strcat(m_requestheader,pObject);
   strcat(m_requestheader," HTTP/1.1");
   strcat(m_requestheader,"\r\n");

   ///第2行:主机
   strcat(m_requestheader,"Host:");
   strcat(m_requestheader,pServer);
   strcat(m_requestheader,"\r\n");

   ///第3行:
   if(pReferer != NULL)
   {
      strcat(m_requestheader,"Referer:");
      strcat(m_requestheader,pReferer);
      strcat(m_requestheader,"\r\n");
   }
   //第4行:接收的数据类型
   strcat(m_requestheader,"Accept:*/*");
   strcat(m_requestheader,"\r\n");

   ///第5行:浏览器类型
   strcat(m_requestheader,"User-Agent:Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
   strcat(m_requestheader,"\r\n");

   ///第6行:连接设置,保持
   strcat(m_requestheader,"Connection:Keep-Alive");
   strcat(m_requestheader,"\r\n");

   ///第7行:Cookie.
   if(pCookie != NULL)
   {
      strcat(m_requestheader,"Set Cookie:0");
      strcat(m_requestheader,pCookie);
      strcat(m_requestheader,"\r\n");
   }
   ///第8行:请求的数据起始字节位置(断点续传的关键)
   if(nFrom > 0)
   {
      strcat(m_requestheader,"Range: bytes=");
      _ltoa(nFrom,szTemp,10);
      strcat(m_requestheader,szTemp);
      strcat(m_requestheader,"-");
      if(nTo > nFrom)
      {
         _ltoa(nTo,szTemp,10);
         strcat(m_requestheader,szTemp);
      }
      strcat(m_requestheader,"\r\n");
   }

   ///最后一行:空行
   strcat(m_requestheader,"\r\n");

   ///返回结果
   Length=strlen(m_requestheader);
}

windows下的,linux下不知道能不能用,应该差不多吧


最后由 icosagon 编辑于 2008-01-09 22:23,总共编辑了 1 次

页首
 用户资料  
 
4 楼 
 文章标题 : Re: [问题]输入网址,将该网页保存…… 不知道应该从哪儿下手?
帖子发表于 : 2008-01-07 21:09 
头像

注册: 2005-08-25 13:58
帖子: 808
地址: ustc
送出感谢: 0 次
接收感谢: 0 次
GodPig 写道:
最好是用C/C++的


如果用 python 就简单了,《python 核心编程》上就有一个类似的例子


_________________
爱喝真猪奶茶的夜鸣猪


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 4 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译