c语言编程网页数据提取,怎么用c语言抓取网页中的数据
当前位置:我的异常网» C语言 » 怎么用c语言抓取网页中的数据
怎么用c语言抓取网页中的数据
www.myexceptions.net 网友分享于:2013-07-17 浏览:390次
如何用c语言抓取网页中的数据?
抓取网页数据的网址:http://www.dianping.com/search/category/1/10
只想截取网页中的店名和地址,但是在截取的时候就会出现如下代码的画面,请问大侠们该如何解决呢?(截取代码内容前面省略),网页代码很多没截取下来………
我是想把从网页中截取的店名和地址存入数据库的
alt="dianping.com" src="http://i1.dpfile.com/s/img/logo.gif" />
对不起,您的访问存在某些问题。如果您是正常访问,请尝试以下方法:
点击此处查看常见访问问题。
请帮助我们填写一份用户反馈,非常感谢!我们不会询问任何隐私信息,将根据您的回答寻求解决同类问题的方法。
如果以上方法都不能解决您的问题,请与spam@dianping.com联系,并附上以下信息,我们会尽快处理:
401
180.173.173.253
以下附上我的代码:
1 #include
2 #include
3 #include
4
5 #include
6 #include
7
8 FILE *fp; //定义FILE类型指针
9 //这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
10 //完成数据保存功能
11 size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)
12 {
13 int written = fwrite(ptr, size, nmemb, (FILE *)fp);
14 return written;
15 }
16
17 int main(int argc, char *argv[])
18 {
19 CURL *curl;
20
21 curl_global_init(CURL_GLOBAL_ALL);
22 curl=curl_easy_init();
23 curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
24 curl_easy_setopt(curl, CURLOPT_HTTPGET, "?test=string");
25
26 if((fp=fopen(argv[2],"w"))==NULL)
27 {
28 curl_easy_cleanup(curl);
29 exit(1);
30 }
31 //CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理
32 curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);
33 curl_easy_perform(curl);
文章评论
c语言编程网页数据提取,怎么用c语言抓取网页中的数据相关推荐
- cookie追加数据_集算器 SPL 抓取网页数据
[摘要] 集算器 SPL 支持抓取网页数据,根据抓取定义规则,可将网页数据下载到在本地进行统计分析.具体定义规则要求.使用详细情况,请前往乾学院:集算器 SPL 抓取网页数据! 网站上的数据源是我们进 ...
- excel两个表格数据对比_用Excel一键抓取网页表格数据
无需插件或编程,Excel自带一键抓取网页表格数据,你会用吗?省去从网页复制甚至手工抄写的麻烦,极大提高工作效率! 首先在浏览器打开想要抓取表格的网页(例如:中国银行外汇牌价),复制地址栏网址,然后打 ...
- python通过代理访问网页_Python使用PyCurl通过SOCK5代理抓取网页 - Python - 服务器之家...
Python使用PyCurl通过SOCK5代理抓取网页 发布时间:2013-10-09
- 爬虫抓取表格中的数据
有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据 ...
- java 流的方式抓取网页 但是显示不全_用java抓取网页源代码时总是无法获取完整的源代码信息,求指导...
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 无论是用urlconnection还是httpurlconnection都只能获得一部分网页源代码(即有的标签内容在网页上右键-查看源代码能看到,但是用下 ...
- Python scapy抓取网卡中的数据包
# encoding: utf-8 from scapy.all import * import threading import sysdef dealwith():print '开始抓包'# 下面 ...
- idm抓取网页视频原理 idm抓取网页视频后怎么提取
对于网页视频的下载,我们可以使用windows端多线程下载工具--Internet Download Manager,通过Internet Download Manager我们可以直接抓取网页视频,i ...
- r语言抓取网页数据_使用R进行网页抓取的简介
r语言抓取网页数据 by Hiren Patel 希伦·帕特尔(Hiren Patel) 使用R进行网页抓取的简介 (An introduction to web scraping using R) ...
- 【期末课设】python爬虫基础与可视化,使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载。
1.大作业的内容 本要求使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载. 2.案例需求 要求采用虚拟浏览器等动态爬虫技术,完 ...
最新文章
- 看看Vector源码Java 9
- csharp: 百度语音合成
- MFC中小笔记(三)
- Ubuntu 编译安装python3.7
- Linux程序接口实验:取进程标志及用户信息
- HuggingFace学习2:使用Bert模型训练文本分类任务
- webpack基本打包配置流程
- ubuntu 14.04 安装中文输入法fcitx
- java socket 异常处理_java.net.SocketException四大异常解决方案
- oracle索引失效解决,Oracle索引失效的原因
- 微信:公众号授权登录
- 卸载office2007不干净问题
- 智慧新能源管理-光伏物联网解决方案
- Lounge Lizard EP-4 for Mac(电钢琴插件)v4.2.5破解版
- 阿里巴巴发布AliGenie 语音开放平台 “智联网”战略又落一子
- 冯诺依曼最伟大的发现?----元胞自动机
- CFile用法与实现
- 时间序列分析之预处理(一)
- pytorch实现特征图可视化,代码简洁,包教包会
- 判断一个整数是奇数还是偶数
热门文章
- React UI 组件库 Chakra UI - 03主题对象和 chakra factory
- matlab rbe神经网络代码,第五课 径向基函数网络(RBFN) 人工神经网络理论及应用 教学课件.ppt...
- 微信小程序 wx:key
- 由于文件不可访问,或者内存或磁盘空间不足,所以无法打开数据库 ‘msdb
- 追加股东为被执行人的情形
- catdog matlab,3 、过共析钢组织中随含碳量的增加, P 的相对含量( ), Fe 3 C ǁ 的相对含量( )...
- unity 地图画格_unity游戏地形网格地图编辑生成插件Terrain Grid System v10.7
- jdb2/sdb1-8 io使用过高处理
- Word排版技巧:公式居中,编号居右
- 假面exe新U盘病毒专杀发布中【一个正常被隐藏,还有一个是病毒T_X】