C#正则_取出标签内的内容(非贪婪)
using System.Text.RegularExpressions;
/// <summary>
/// 执行正则提取出值
/// </summary>
/// <param name="RegexString">正则表达式</param>
/// <param name="HtmlCode">HtmlCode源代码</param>
/// <returns>数组</returns>
public static string[] GetRegValueAarry(string RegexString, string HtmlCode)
{
string[] MatchVale = new String[30];//初始化数组
int i = 0;
Regex r = new Regex(RegexString);
for (Match m = r.Match(HtmlCode); m.Success; m = m.NextMatch())
{
MatchVale[i] = m.Value.ToString();
i++;
}
return MatchVale;
}
/// <summary>
/// 获取标签内的内容(只取出第一个)
/// </summary>
/// <param name="code"></param>
/// <param name="wordsBegin"></param>
/// <param name="wordsEnd"></param>
/// <returns></returns>
public static string SniffwebCode(string code, string wordsBegin, string wordsEnd)
{
string NewsTitle = "";
Regex regex1 = new Regex("" + wordsBegin + @"(?<content>[\s\S]+?)" + wordsEnd + "", RegexOptions.Compiled | RegexOptions.IgnoreCase);
for (Match match1 = regex1.Match(code); match1.Success; match1 = match1.NextMatch())
{
NewsTitle += match1.Groups["content"].ToString();
break;
}
return NewsTitle;
}
// <summary>
/// 获取标签内的内容并用~连上
/// </summary>
/// <param name="code"></param>
/// <param name="wordsBegin"></param>
/// <param name="wordsEnd"></param>
/// <returns></returns>
public static string SniffwebCodeSplit(string code, string wordsBegin, string wordsEnd)
{
string NewsTitle = "";
Regex regex1 = new Regex("" + wordsBegin + @"(?<content>[\s\S]+?)" + wordsEnd + "", RegexOptions.Compiled | RegexOptions.IgnoreCase);
for (Match match1 = regex1.Match(code); match1.Success; match1 = match1.NextMatch())
{
NewsTitle += match1.Groups["content"].ToString() + "~";
}
return NewsTitle;
}
转载于:https://www.cnblogs.com/hucaihao/p/3569658.html
C#正则_取出标签内的内容(非贪婪)相关推荐
- php 删除指定html标签,总结php删除html标签和标签内的内容的方法
经常扒别人网站文章的坑们:我是指那种批量式采集的压根不看内容的,少不了都会用到删除html标签的函数:这里介绍3种不同用途上的方法: $str=' 这里是p标签 这里是a标签 '; 1:删除全部或者保 ...
- 去除a链接+java正则_JavaScript实现正则去除a标签并保留内容的方法【测试可用】...
本文实例讲述了JavaScript实现正则去除a标签并保留内容的方法.分享给大家供大家参考,具体如下: 一.问题: 有如下HTML代码,要求用正则去除a标签,只留下内容 //www.jb51.net ...
- 总结php删除html标签和标签内的内容的方法
经常扒别人网站文章的坑们: 我是指那种批量式采集的压根不看内容的: 少不了都会用到删除html标签的函数: 这里介绍3种不同用途上的方法: $str='<div><p>这里是p ...
- python用方括号提取字符中的数值_Python使用re模块正则提取字符串中括号内的内容示例...
Python使用re模块正则提取字符串中括号内的内容示例 本文实例讲述了Python使用re模块正则提取字符串中括号内的内容操作.分享给大家供大家参考,具体如下: 直接上代码吧: # -*- codi ...
- 使用正则表达式 匹配 HTML 标签内的内容
正则表达式如下 /(?<=((<[a-zA-Z-]+?){0,1}>))([\s\S]+)(?=([\s]{0,1}<\/[a-zA-Z-]+(>{0,1})))/g 测 ...
- Python使用re模块正则提取字符串中括号内的内容示例
Python使用re模块正则提取字符串中括号内的内容示例 这篇文章主要介绍了Python使用re模块正则提取字符串中括号内的内容,结合实例形式分析了Python使用re模块进行针对括号内容的正则匹配操 ...
- python爬虫时删除多余标签内的内容remove、remove_tags
当爬取到内容后,发现有些便签内的内容不是我们想要的,这时只能通过删除多余标签的方法来进行处理 doc = pq(html)doc('.article-t style').remove() 如上是:想要 ...
- td标签内文字内容颜色改变
td标签 使用style样式改变文字内容颜色解决方法: <td style="color: red"> 我是td </td> 这种方式是没有效果的. 正确方 ...
- xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...
利用xpath来提取所有标签里面的内容,即使标签头不同 #-*-coding:utf8-*- import re import os from lxml import etree html = ''' ...
最新文章
- 解决eclipse ctrl+鼠标左键不能用
- python批量下载网页文件-Python实现批量下载文件
- DL之CNN:计算机视觉之卷积神经网络算法的简介(经典架构/论文)、CNN优化技术、调参学习实践、CNN经典结构及其演化、案例应用之详细攻略
- 北航java大作业,北航成人继续教育 本科 计算机科学与技术 JAVA——大作业.doc
- DSG-Oracle数据库在线迁移服务
- 如何让其他机器访问你的oracle数据库
- mysql5.7.17主从_mysql5.7.17主从同步配置
- click事件在什么时候出发_什么是移动端?
- 大龄程序员失业后,看他们是如何破局突围的?
- 双向lstm-crf源码的问题和细微修改
- 线性反馈移位寄存器LFSR和循环冗余码CRC
- JAVA 利用牛顿迭代公式开方
- python输出excel指定列为文本格式_POI设置excel某列值为文本格式
- linux下利用yum安装svn
- 手机选择之我见——需求分析
- luoguP4568 [JLOI2011]飞行路线
- 大数据面试技巧——个人总结(持续更新)
- 项目实习(五)网络渗透实验
- Mysql 中的 mvcc原理
- 也谈BlackBerry网络连接
热门文章
- 一个初级的前端工程师需要知道些什么?
- [李景山php]每天TP5-20161225|thinkphp5-Console.php-2
- [saiku] 使用 Apache Phoenix and HBase 结合 saiku 做大数据查询分析
- android-swipelistview的开源项目的配置
- BerkeleyDB-JE数据库操作封装
- .NET控件Designer架构设“.NET研究”计
- WMI远程访问问题解决方法
- cesium学习笔记(问题记录)——以cesium1.77版本为例
- 开源战略游戏源码_开源的历史告诉我们关于战略优势的知识
- Guayadeque成为音乐爱好者的开源播放器的6个原因