获取html内标题,通过html敏捷包获取标题标签
我正在尝试使用htmlagility pack来获得结果的链接和结果
我有这个代码
using HtmlAgilityPack;
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Net;
using System.ServiceModel.Syndication;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using System.Xml;
namespace Search
{
public partial class Form1 : Form
{
// load snippet
HtmlAgilityPack.HtmlDocument htmlSnippet = new HtmlAgilityPack.HtmlDocument();
public Form1()
{
InitializeComponent();
}
private void btn1_Click(object sender, EventArgs e)
{
listBox1.Items.Clear();
StringBuilder sb = new StringBuilder();
byte[] ResultsBuffer = new byte[8192];
string SearchResults = "http://google.com/search?q=" + txtKeyWords.Text.Trim();
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(SearchResults);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream resStream = response.GetResponseStream();
string tempString = null;
int count = 0;
do
{
count = resStream.Read(ResultsBuffer, 0, ResultsBuffer.Length);
if (count != 0)
{
tempString = Encoding.ASCII.GetString(ResultsBuffer, 0, count);
sb.Append(tempString);
}
}
while (count > 0);
string sbb = sb.ToString();
HtmlAgilityPack.HtmlDocument html = new HtmlAgilityPack.HtmlDocument();
html.OptionOutputAsXml = true;
html.LoadHtml(sbb);
HtmlNode doc = html.DocumentNode;
foreach (HtmlNode link in doc.SelectNodes("//a[@href]"))
{
//HtmlAttribute att = link.Attributes["href"];
string hrefValue = link.GetAttributeValue("href", string.Empty);
if (!hrefValue.ToString().ToUpper().Contains("GOOGLE") && hrefValue.ToString().Contains("/url?q=") && hrefValue.ToString().ToUpper().Contains("HTTP://"))
{
int index = hrefValue.IndexOf("&");
if (index > 0)
{
hrefValue = hrefValue.Substring(0, index);
listBox1.Items.Add(hrefValue.Replace("/url?q=", ""));
}
}
}
}
}
}
此代码返回查询的结果链接我想获得每个链接的标题标签我如何获得每个链接的标题?
任何人都可以帮忙吗?
获取html内标题,通过html敏捷包获取标题标签相关推荐
- 获取局域网内服务器信息,使用Java代码获取服务器性能信息及局域网内主机名.pdf...
使使用用Java代代码码获获取取服服务务器器性性能能信信息息及及局局域域网网内内主主机机名名 最近做个项目,就是要取 cpu 占有率等等的系统信息,一开始以为要用动态链接库了,但后来发现可以像下面这样 ...
- vc获取网页内table
1.独立代码: //-----------开始---------------------// #include <atlbase.h> #include <mshtml.h> ...
- 安卓ROM内置推广联盟赚钱 开发者联盟 精英助手 APP推广包获取 推广包渠道
苹果romer联盟顶级代理.本站代理直接享有三级权限.让您加盟即赢在起跑线.业绩显著的可以在本站申请省级代理.安卓.苹果romer软件联盟隶属烟台乐盟网络科技有限公司.是国内唯一定位于安卓APK软件推 ...
- 初窥R(基本说明、获取帮助、工作空间、输入输出、包)
初窥R(基本说明.获取帮助.工作空间.输入输出.包) 本篇简要介绍使用R的一些基本概念,包括基本说明.获取帮助.工作空间.输入输出,每个知识点中都会通过一个例子来练习. 一.R基本情况说明 1.R是一 ...
- 4k超清壁纸APP抓包获取所有壁纸下载地址
4k超清壁纸APP抓包获取所有壁纸下载地址 Lan 2020-05-09 10:38 288 人阅读 0 条评论 额,最近发现手机壁纸似乎有段时间没换了,刚好又看到网上有一个APP叫做4 ...
- UserAgent和获取手机内安装的所有app列表
获取手机内安装的所有app列表 注意: 获取收集所有app的信息,很耗时,需要在子线程中执行 1.新建两个实体类 BaseBean和ListAppBean import android.text.Te ...
- ipa文件包获取服务器地址,ipa文件包获取服务器地址
ipa文件包获取服务器地址 内容精选 换一换 下载地址:http://www.ccb.jhu.edu/software/hisat/downloads/hisat-0.1.6-beta-source. ...
- 根据域名获取ip地址、端口、服务器类型和标题
这个是我在一家网络安全公司面试时的操作题,回来后经过多次修改后才得到一个比较完整的程序. 整个模块可以分成两个大部分.一个是数据库的操作,一个是信息的获取(类似爬虫?) 信息的获取分为四个小操作,ip ...
- python显示日历_Python获取时间范围内日期列表和周列表的函数
Python获取时间范围内日期列表和周列表的函数 1.获取日期列表 # -*- coding=utf-8 -*- import datetime def dateRange(beginDate, en ...
最新文章
- python数据结构与算法(二)
- java数据从本地文件中取出_java 从数据库取数据并存入本地文本中
- WebApi Ajax 跨域请求解决方法(CORS实现)
- Git bash 编码格式配置_02
- HTTP状态保持(cookie、session)
- 用计算机坑人,10大坑人专业,坑你没商量!
- Ubuntu18.04之微信中文乱码解决
- python - - 函数 - - 递归函数
- JavaScript中变量的类型
- PE制作实录 —— 定义我的 PE 工具箱
- 互联网老辛带你了解云架构集群
- 周受资将兼任TikTok CEO;默沙东中国总裁罗万里将出任美国总裁 | 高管变动2021年4月26日-5月2日
- 网络安全就业前景怎么样?好找工作吗?
- The container name /mysql is already in use by container
- fastjson html 转义,JSONString的转义和反转义
- 淘宝天猫各大电商平台接口测试
- 微盟“删库”144小时:痛的不是股价,是信任
- Python爬一爬世界杯赛程
- php 二维数组去重合并,PHP 二维数组去重合并
- 【算法技巧】位运算装逼指南
热门文章
- Java-所有类型的Class对象
- C语言 数组排序 – 插入法排序 - C语言零基础入门教程
- Python Chainmap函数 - Python零基础入门教程
- Android mock单例对象,如何对Java单例模式进行mock
- linux获取文件的md5,linux shell 获取文件md5的命令linux操作系统 -电脑资料
- 仪表盘刻度调整_惊艳了我的仪表盘 那些年我遇到最美的“面孔”
- java 代理ip工具类_Java基础之java处理ip的工具类
- java jvm 加载类的顺序_java JVM-类加载静态初始化块调用顺序
- 七代处理器装win7_为啥新电脑没法装windows7系统?解决方法总会有的
- html代码大全(很全的)_HTML教学(1):写一个属于自己的网址大全(新手版)