echo http://3g.163.com/touch/article.html?docid=C6SM5BG40005877U | sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p'

-n 只输出匹配的行

/p 打印结果

mark:

用反斜杠转义的地方跟普通的正则是反过来的,即表示普通字符不加转义,正则的功能字符需转义;

?表示0或1个不生效。无奈只能用{0,1};

.*? 表示非贪婪模式不生效。例子中用了[^/] 代替

统计域名

cat url_file.txt | sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p' | sort | uniq -c | sort -n -r  | awk 'OFS="\t"{print $1,$2}' > domain_sort.txt

后面加上  awk 'OFS="\t"{print $1,$2}' 是为了结果复制到 Excel 方便

sed解析url的域名相关推荐

  1. Go 学习笔记(50)— Go 标准库之 net/url(查询转义、查询参数增/删/改/查、解析URL)

    1. URL 概述 import "net/url" url 包解析 URL 并实现了查询的转码.URL 提供了一种定位因特网上任意资源的手段,但这些资源是可以通过各种不同的方案( ...

  2. 通过url,获取html内容,并解析,如何使用 JavaScript 解析 URL

    在 Web 开发中,有许多情况需要解析 URL,这篇主要学习如何使用 URL 对象实现这一点. 开始 创建一个以下内容的 HTML 文件,并在浏览器中打开. JavaScript URL parsin ...

  3. python爬虫基础扫盲之urllib.pase解析URL

    在笨方法"学习python笔记之urlopen,中提了urllib主要是提供打开网页,解析url等功能用于网络爬虫,其lib主要包含四个部分,其中urllib.parse主要是负责url的解 ...

  4. js常用方法,JS实用方法,jq获得文件后缀,解析window。location,解析URL参数

    jq获取文件后缀的方法 var file = "测试文档1111111111.docx"; // 文件 var fileName = file.replace(/.*(\/|\\) ...

  5. 多活主备选择性DNS解析(一个域名对应多个IP)

    多活主备选择性DNS 问题背景 知识背景 DNS解析存在多级缓存(此处仅列举到DNS服务器层:后续流程不涉及) DNS一对多域名的解析随机性 DNS 域名解析负载均衡缺点: 可能方案 方案一.dns解 ...

  6. 网址,URL,域名,IP地址,DNS,域名解析

    网址,URL,域名,IP地址,DNS,域名解析 文章简介 一篇关于网址.URL.IP地址.域名.DNS.域名解析的白话长文. 编写形式:QA 背景知识 互联网上的所有数据都是存储在主机(服务器)上互联 ...

  7. 解析URL得到IP地址

    导读 上一篇总结中涉及到的是输入URL的过程中浏览器做出的一些反馈,这一篇将总结之后发生的事情. 浏览器判断是URL还是搜索关键字 解析URL DNS解析获得IP地址 多IP域名DNS查询解决方案 什 ...

  8. urlparse解析url

    python3中urlparse模块和urllib模块合并,urlparse()在urllib.parse中进行调用. urlparse()把url拆分为6个部分,scheme(协议),netloc( ...

  9. 实例讲解node.js解析URL并获取绝对路径和格式化

    解析URL url.parse(urlStr[, parseQueryString][, slashesDenoteHost]) 参数 说明 urlStr 网址 parseQueryString 是否 ...

  10. 取出url中的字符_如何在JavaScript中解析URL:例如主机名,路径名,查询,哈希?...

    统一资源定位符(缩写URL)是对Web资源(网页,图像,文件)的引用.URL指定资源位置和检索资源的机制(http,ftp,mailto). 例如,这是此博客文章的URL: 通常,您需要访问URL的特 ...

最新文章

  1. 运动皮层的树突状钙信号驱动光学脑机接口
  2. 整理前端工作中的可复用代码(二):拓展spark-md5,支持计算网络文件md5
  3. centos7 安装 Minio
  4. Boost::context模块callcc的斐波那契测试程序
  5. html Selection
  6. 利用IDEA部署过的Tomcat开发Web Service
  7. java ac自动机_如何使用Java实现AC自动机全文检索实例
  8. 【英语学习】【Daily English】U05 Places L02 Any apartment available?
  9. 在python中类型属于对象变量是没有类型的_如何理解python对象有类型,变量无类型...
  10. applicationcontext获取bean_如果你每次面试前都要去背一篇Spring中Bean的生命周期,请看完这篇文章...
  11. 网络限速软件测试大乐,宽带测速谁靠谱?网速测试软件大对比
  12. python函数调用的五种方式
  13. 一文搞懂X509证书PEM DER CRT CER的区别
  14. 图像处理:连通区域算法
  15. cannot resolve symbol 问题
  16. 基于解决sci和ei等国外论文检索难等问题的辅助软件分析
  17. 网易云课堂吴恩达Andrew Ng深度学习笔记(二)
  18. 尚学堂Java第五章所有题目
  19. Blender PS Zbrush 人物眼球制作2 - Albedo 贴图和UV不匹配修正
  20. 自适应控制课程心得体会

热门文章

  1. Win10重复按键盘经常按不出?Win10关闭筛选键步骤
  2. 【PIE-Engine Studio学习笔记06】图像分类——监督分类
  3. Python pandas 根据指定条件筛选数据
  4. python热力图转灰度图_热力图(HeatMap)实现
  5. 【原创】带下划线单选菜单栏-标签Tab
  6. html css 命名规范,css模块命名规范(推荐)
  7. 原创分享 计算机毕业设计PySpark+LSTM+Hadoop招聘推荐系统 招聘大数据 招聘数据分析 协同过滤算法(基于物品+基于用户) 招聘可视化大屏 就业推荐系统 就业数据分析
  8. unity 生成和识别二维码
  9. ios frame和bounds区别
  10. CNCC 2022| 隐私计算:理论、技术、应用与未来