来自: 百度空间-软件工程师

大家都很熟悉HTTP协议的应用,因为每天都在网络上浏览着不少东西,也都知道是HTTP协议是相当简单的。每次用到FlashGet之类的下载软件下载网页,当用到那个“用FlashGet下载全部链接”时总觉得很神奇。
后来想想,其实要实现这些下载功能也并不难,只要按照HTTP协议发送request,然后对接收到的数据进行分析,如果页面上还有href之类的链接指向标志就可以进行深一层的下载了。HTTP协议目前用的最多的是1.1版本,要全面透彻地搞懂它就参考RFC2616文档吧。
下面是我用C语言编程写的一个http下载程序,希望对大家有些启发。源代码如下:

/******* http客户端程序 httpclient.c ************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <errno.h>
#include <unistd.h>
#include <netinet/in.h>
#include <limits.h>
#include <netdb.h>
#include <arpa/inet.h>
#include <ctype.h>

//httpclient.c 开始///

/********************************************
功能:搜索字符串右边起的第一个匹配字符
********************************************/
char * Rstrchr(char * s, char x)         {
         int i = strlen(s);
         if(!(*s))         return 0;
         while(s[i-1]) if(strchr(s + (i - 1), x))         return (s + (i - 1));         else i--;
         return 0;
}

/********************************************
功能:把字符串转换为全小写
********************************************/
void ToLowerCase(char * s)         {
         while(*s)         *s=tolower(*s++);
}

/**************************************************************
功能:从字符串src中分析出网站地址和端口,并得到用户要下载的文件
***************************************************************/
void GetHost(char * src, char * web, char * file, int * port)         {
         char * pA;
         char * pB;
         memset(web, 0, sizeof(web));
         memset(file, 0, sizeof(file));
         *port = 0;
         if(!(*src))         return;
         pA = src;
         if(!strncmp(pA, "http://", strlen("http://")))         pA = src+strlen("http://");
         else if(!strncmp(pA, "https://", strlen("https://")))         pA = src+strlen("https://");
         pB = strchr(pA, '/');
         if(pB)         {
           memcpy(web, pA, strlen(pA) - strlen(pB));
           if(pB+1)         {
             memcpy(file, pB + 1, strlen(pB) - 1);
             file[strlen(pB) - 1] = 0;
           }
         }
         else         memcpy(web, pA, strlen(pA));
         if(pB)         web[strlen(pA) - strlen(pB)] = 0;
         else         web[strlen(pA)] = 0;
         pA = strchr(web, ':');
         if(pA)         *port = atoi(pA + 1);
         else *port = 80;
}

/*********************************************************************
*filename: httpclient.c
*purpose: HTTP协议客户端程序,可以用来下载网页
*wrote by: zhoulifa(zhoulifa@163.com) 周立发(http://zhoulifa.bokee.com)
                  Linux爱好者 Linux知识传播者 SOHO族 开发者 最擅长C语言
*date time:2006-03-11 21:49:00
*Note: 任何人可以任意复制代码并运用这些代码,当然包括你的商业用途
*                                但请遵循GPL
*********************************************************************/
int main(int argc, char *argv[])
{
         int sockfd;
         char buffer[1024];
         struct sockaddr_in server_addr;
         struct hostent *host;
         int portnumber,nbytes;
         char host_addr[256];
         char host_file[1024];
         char local_file[256];
         FILE * fp;
         char request[1024];
         int send, totalsend;
         int i;
         char * pt;

if(argc!=2)
         {
           fprintf(stderr,"Usage:%s web-address/a/n",argv[0]);
           exit(1);
         }
         printf("parameter.1 is: %s/n", argv[1]);
         ToLowerCase(argv[1]);/*将参数转换为全小写*/
         printf("lowercase parameter.1 is: %s/n", argv[1]);

GetHost(argv[1], host_addr, host_file, &portnumber);/*分析网址、端口、文件名等*/
         printf("webhost:%s/n", host_addr);
         printf("hostfile:%s/n", host_file);
         printf("portnumber:%d/n/n", portnumber);

if((host=gethostbyname(host_addr))==NULL)/*取得主机IP地址*/
         {
           fprintf(stderr,"Gethostname error, %s/n", strerror(errno));
           exit(1);
         }

/* 客户程序开始建立 sockfd描述符 */
         if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1)/*建立SOCKET连接*/
         {
           fprintf(stderr,"Socket Error:%s/a/n",strerror(errno));
           exit(1);
         }

/* 客户程序填充服务端的资料 */
         bzero(&server_addr,sizeof(server_addr));
         server_addr.sin_family=AF_INET;
         server_addr.sin_port=htons(portnumber);
         server_addr.sin_addr=*((struct in_addr *)host->h_addr);

/* 客户程序发起连接请求 */
         if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1)/*连接网站*/
         {
           fprintf(stderr,"Connect Error:%s/a/n",strerror(errno));
           exit(1);
         }

sprintf(request, "GET /%s HTTP/1.1/r/nAccept: */*/r/nAccept-Language: zh-cn/r/n/
User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)/r/n/
Host: %s:%d/r/nConnection: Close/r/n/r/n", host_file, host_addr, portnumber);
         printf("%s", request);/*准备request,将要发送给主机*/

/*取得真实的文件名*/
         if(host_file && *host_file)         pt = Rstrchr(host_file, '/');
         else pt = 0;

memset(local_file, 0, sizeof(local_file));
         if(pt && *pt)         {
           if((pt + 1) && *(pt+1))         strcpy(local_file, pt + 1);
           else         memcpy(local_file, host_file, strlen(host_file) - 1);
         }
         else if(host_file && *host_file)         strcpy(local_file, host_file);
         else         strcpy(local_file, "index.html");
         printf("local filename to write:%s/n/n", local_file);

/*发送http请求request*/
         send = 0;totalsend = 0;
         nbytes=strlen(request);
         while(totalsend < nbytes) {
           send = write(sockfd, request + totalsend, nbytes - totalsend);
           if(send==-1)         {printf("send error!%s/n", strerror(errno));exit(0);}
           totalsend+=send;
           printf("%d bytes send OK!/n", totalsend);
         }

fp = fopen(local_file, "a");
         if(!fp)         {
           printf("create file error! %s/n", strerror(errno));
           return 0;
         }
         printf("/nThe following is the response header:/n");
         i=0;
         /* 连接成功了,接收http响应,response */
         while((nbytes=read(sockfd,buffer,1))==1)
         {
           if(i < 4)         {
             if(buffer[0] == '/r' || buffer[0] == '/n')         i++;
             else i = 0;
             printf("%c", buffer[0]);/*把http头信息打印在屏幕上*/
           }
           else         {
             fwrite(buffer, 1, 1, fp);/*将http主体信息写入文件*/
             i++;
             if(i%1024 == 0)         fflush(fp);/*每1K时存盘一次*/
           }
         }
         fclose(fp);
         /* 结束通讯 */
         close(sockfd);
         exit(0);
}
//httpclient.c 结束///

【c】C语言编程写的一个http下载程序相关推荐

  1. java语言简单代码_java语言编程如何实现一个最简单程序?

    在编程语言中,实践出结果是最重要的,其他的什么都是为此做准备,下面我们就来看看该如何编译一个最简单的java程序. 首先,启动你的编程软件,如eclipse等,具体可以网上了解, 再来,创建一个新的j ...

  2. c语言中怎么暂停一个一个游戏,求助:最近在linux下用c语言写了一个贪吃蛇程序,有几个问题,第一:贪吃蛇怎么实现暂停,第二:有时候同时输入上下左右中的两个键就会直接游戏结束...

    求助:最近在linux下用c语言写了一个贪吃蛇程序,有几个问题,第一:贪吃蛇怎么实现暂停,第二:有时候同时输入上下左右中的两个键就会直接游戏结束 /* 以下是主要的逻辑代码,还有些.c和.h就没发了 ...

  3. 翻出来的老物件,11年学习易语言之后写的一个游戏策划脚本辅助工具

    翻出来的老物件,11年学习易语言之后写的一个游戏策划脚本辅助工具,某年因为某恶心的项目回乡之后,学了下E语言,学完之后手有点痒痒,于是乎自己想写点东西,因为本身做了很长时间游戏,所以想做个游戏相关的, ...

  4. 分享下自己写的一个微信小程序请求远程数据加载到页面的代码

    分享下自己写的一个微信小程序请求远程数据加载到页面的代码 1  思路整理 就是页面加载完毕的时候  请求远程接口,然后把数据赋值给页面的变量 ,然后列表循环 2 js相关代码  我是改的 onload ...

  5. 用爬虫写一个,小说下载程序

    用爬虫写一个,小说下载程序 环境:python 3.7.3 没啥难度和技术含量,随便写写.本来程序有部分可用format进行优化,但又想了想小说名可能还会 有一些奇奇怪怪的符号,就没弄了. impor ...

  6. 闲来无事,用java写了一个魔方小程序。附源码

    闲来无事,用java写了一个魔方小程序.附源码 使用三维数组.相对来说还是简单.呵呵. import java.util.ArrayList; import java.util.List; impor ...

  7. java实现魔方_闲来无事,用java写了一个魔方小程序。附源码 | 学步园

    闲来无事,用java写了一个魔方小程序.附源码 使用三维数组.相对来说还是简单.呵呵. import java.util.ArrayList; import java.util.List; impor ...

  8. python写的一个-批量下载股票年报的小工具

    python写的一个-批量下载股票年报的小工具 from urllib import request import requests import os import openpyxl# print( ...

  9. 身为菜鸟的我写了一个日历查询程序

    身为菜鸟的我写了一个日历查询程序 这个程序能完成的功能: 1.输入年份得到年历 2.输入年月得到月历 3.输入年月日得到距今多少天并显示今天的日期,是否为公历节日,显示输入日期是星期几. 以下是程序代 ...

最新文章

  1. 36 张图详解 ARP :网络世界没有我,你哪也别想去
  2. 机器视觉特征提取:HOG、SIFT、SURF、ORB、LBP、HAAR
  3. php的foreach循环执行过程分析以及循环中执行unset()的一些问题
  4. 长方形纸做容积最大的长方体_A4纸的尺寸是怎么来的?
  5. Tomcat启动问题,启动是Tomcat8,结果却是Tomcat9
  6. 为什么选择Nginx
  7. 使用django的权限管理系统permission
  8. 【python 7】OpenCV
  9. Java命令:jstack — 获取线程dump信息
  10. i css svg,如何设置 CSS 背景图中的 SVG 的颜色
  11. Uncaught TypeError: this.canvas.getContext is not a function
  12. css px转rem工具,支持生产整个css文件统一修改
  13. Annotation-specified bean name conflicts with existing
  14. 为什么需要等待2MSL
  15. 渺小的个体不能体会之孤独
  16. 【CSS3】一些听课记录(样例代码)
  17. MIPI RAW和YUV常见图像格式的解析、格式转换和看图软件
  18. MMA7361三轴加速度模块使用注意的问题
  19. 让每次自动获得的ip是一样的(挺管用)
  20. python爬取唐诗

热门文章

  1. 【Linux】嵌入式Linux系统的移植(下篇:BootLoader,以U-Boot为例)
  2. STM32使用SPI方式读写SD 卡
  3. [HAL]STM32 SPI+DMA驱动WS2812
  4. 图像处理之预处理方法
  5. 什么是语义化标签,常见的语义化标签介绍
  6. 更新npm和node
  7. 别再眼红别人家的年终奖了,这才是大多数人的现状!
  8. Java对象内存布局(JOL)
  9. C++指向const对象的指针和const指针
  10. DHD的上网设置与彩信设置