当前位置:我的异常网» C语言 » 怎么用c语言抓取网页中的数据

怎么用c语言抓取网页中的数据

www.myexceptions.net  网友分享于:2013-07-17  浏览:390次

如何用c语言抓取网页中的数据?

抓取网页数据的网址:http://www.dianping.com/search/category/1/10

只想截取网页中的店名和地址,但是在截取的时候就会出现如下代码的画面,请问大侠们该如何解决呢?(截取代码内容前面省略),网页代码很多没截取下来………

我是想把从网页中截取的店名和地址存入数据库的

alt="dianping.com" src="http://i1.dpfile.com/s/img/logo.gif" />

对不起,您的访问存在某些问题。如果您是正常访问,请尝试以下方法:

  • 点击此处查看常见访问问题。

  • 请帮助我们填写一份用户反馈,非常感谢!我们不会询问任何隐私信息,将根据您的回答寻求解决同类问题的方法。

  • 如果以上方法都不能解决您的问题,请与spam@dianping.com联系,并附上以下信息,我们会尽快处理:

    401

    180.173.173.253

    以下附上我的代码:

    1 #include

    2 #include

    3 #include

    4

    5 #include

    6 #include

    7

    8 FILE *fp;  //定义FILE类型指针

    9 //这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的

    10 //完成数据保存功能

    11 size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)

    12 {

    13     int written = fwrite(ptr, size, nmemb, (FILE *)fp);

    14     return written;

    15 }

    16

    17 int main(int argc, char *argv[])

    18 {

    19     CURL *curl;

    20

    21     curl_global_init(CURL_GLOBAL_ALL);

    22     curl=curl_easy_init();

    23     curl_easy_setopt(curl, CURLOPT_URL, argv[1]);

    24     curl_easy_setopt(curl, CURLOPT_HTTPGET, "?test=string");

    25

    26     if((fp=fopen(argv[2],"w"))==NULL)

    27     {

    28         curl_easy_cleanup(curl);

    29         exit(1);

    30     }

    31 //CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理

    32     curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);

    33     curl_easy_perform(curl);

    文章评论

c语言编程网页数据提取,怎么用c语言抓取网页中的数据相关推荐

  1. cookie追加数据_集算器 SPL 抓取网页数据

    [摘要] 集算器 SPL 支持抓取网页数据,根据抓取定义规则,可将网页数据下载到在本地进行统计分析.具体定义规则要求.使用详细情况,请前往乾学院:集算器 SPL 抓取网页数据! 网站上的数据源是我们进 ...

  2. excel两个表格数据对比_用Excel一键抓取网页表格数据

    无需插件或编程,Excel自带一键抓取网页表格数据,你会用吗?省去从网页复制甚至手工抄写的麻烦,极大提高工作效率! 首先在浏览器打开想要抓取表格的网页(例如:中国银行外汇牌价),复制地址栏网址,然后打 ...

  3. python通过代理访问网页_Python使用PyCurl通过SOCK5代理抓取网页 - Python - 服务器之家...

    Python使用PyCurl通过SOCK5代理抓取网页 发布时间:2013-10-09

  4. 爬虫抓取表格中的数据

    有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据 ...

  5. java 流的方式抓取网页 但是显示不全_用java抓取网页源代码时总是无法获取完整的源代码信息,求指导...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 无论是用urlconnection还是httpurlconnection都只能获得一部分网页源代码(即有的标签内容在网页上右键-查看源代码能看到,但是用下 ...

  6. Python scapy抓取网卡中的数据包

    # encoding: utf-8 from scapy.all import * import threading import sysdef dealwith():print '开始抓包'# 下面 ...

  7. idm抓取网页视频原理 idm抓取网页视频后怎么提取

    对于网页视频的下载,我们可以使用windows端多线程下载工具--Internet Download Manager,通过Internet Download Manager我们可以直接抓取网页视频,i ...

  8. r语言抓取网页数据_使用R进行网页抓取的简介

    r语言抓取网页数据 by Hiren Patel 希伦·帕特尔(Hiren Patel) 使用R进行网页抓取的简介 (An introduction to web scraping using R) ...

  9. 【期末课设】python爬虫基础与可视化,使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载。

    1.大作业的内容 本要求使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载. 2.案例需求 要求采用虚拟浏览器等动态爬虫技术,完 ...

最新文章

  1. 看看Vector源码Java 9
  2. csharp: 百度语音合成
  3. MFC中小笔记(三)
  4. Ubuntu 编译安装python3.7
  5. Linux程序接口实验:取进程标志及用户信息
  6. HuggingFace学习2:使用Bert模型训练文本分类任务
  7. webpack基本打包配置流程
  8. ubuntu 14.04 安装中文输入法fcitx
  9. java socket 异常处理_java.net.SocketException四大异常解决方案
  10. oracle索引失效解决,Oracle索引失效的原因
  11. 微信:公众号授权登录
  12. 卸载office2007不干净问题
  13. 智慧新能源管理-光伏物联网解决方案
  14. Lounge Lizard EP-4 for Mac(电钢琴插件)v4.2.5破解版
  15. 阿里巴巴发布AliGenie 语音开放平台 “智联网”战略又落一子
  16. 冯诺依曼最伟大的发现?----元胞自动机
  17. CFile用法与实现
  18. 时间序列分析之预处理(一)
  19. pytorch实现特征图可视化,代码简洁,包教包会
  20. 判断一个整数是奇数还是偶数

热门文章

  1. React UI 组件库 Chakra UI - 03主题对象和 chakra factory
  2. matlab rbe神经网络代码,第五课 径向基函数网络(RBFN) 人工神经网络理论及应用 教学课件.ppt...
  3. 微信小程序 wx:key
  4. 由于文件不可访问,或者内存或磁盘空间不足,所以无法打开数据库 ‘msdb
  5. 追加股东为被执行人的情形
  6. catdog matlab,3 、过共析钢组织中随含碳量的增加, P 的相对含量( ), Fe 3 C ǁ 的相对含量( )...
  7. unity 地图画格_unity游戏地形网格地图编辑生成插件Terrain Grid System v10.7
  8. jdb2/sdb1-8 io使用过高处理
  9. Word排版技巧:公式居中,编号居右
  10. 假面exe新U盘病毒专杀发布中【一个正常被隐藏,还有一个是病毒T_X】