私信回复关键词【插件】~

获取Excel高手都在用的“插件合集+插件使用小技巧”!

心血来潮在知乎里面搜索一下 Excel,想学习一些高点赞文章的写作方法。

看到这些标题,完了,一下子勾起下载和收藏的欲望啦!

怎么样把所有高点赞的文章全部都抓下来呢?

开始的时候我想的是用 Python。

后来想一想,用 Power query 好像也可以实现,于是就做出了下面这个效果。

在表格里面输入搜索词,然后右键刷新,就可以得到搜索结果。

你能明白我一定要抓到表格里吗?

因为 Excel 里可以根据「点赞数量」直接排序啊!

那种感觉就跟排队一样,到哪里排队,我都是第 1 个,挑最好的!

好了,闲话少说,我们来看一看这个表格是怎么做出来的。

大致可以分为 4 个步骤:

❶ 获取 JSON 数据连接;

❷ Power query 处理数据;

❸ 配置搜索地址;

❹ 添加超链接。

01

操作步骤

获取 JSON 数据连接

平常在浏览网页的时候,是一个单纯的网页地址。

而网页里所看到的数据,实际上也有一个单独的数据链接,这个可以在浏览器里面查找到。

我们需要的数据链接,对应的通常是 JSON 格式的数据,就像下面这样。

查找的方法,需要进入到开发者模式,然后查看数据的 Network 变化,找到 xhr 类型的链接,其中一个就是数据的传输连接。

把这个链接复制下来,这就是 Power query 要抓取数据的链接。

Power query 处理

你可能不知道,Power Query 除了可以抓取 Excel 当中的数据之外,

还可以抓取 SQL、Access 等多个类型的数据:

网站数据也是其中一个:

把前面我们获取的链接,粘贴到 PQ 里面,链接就可以抓取数据了。

然后得到的是网页的数据格式,怎么把具体的文章数据获取到呢?

Power Query 强大的地方就在于,它可以自动识别 json 的数据格式,并解析提取具体的内容。

整个过程,我们不需要做任何的操作,只是鼠标点点就可以完成。

这个时候我们获得的数据,会有一些不需要的多余的数据。

比如说:thumbnail_info(缩略图信息),relationship,question,id.1 等等。

把它们删掉,只保留可需要的文章的标题、作者、超链接等等就可以了。

数据处理完成后,在开始选卡,点击「关闭并上载」,就完成了数据的抓取,非常简单。

配置搜索地址

不过这个时候,我们所抓取到的数据是固定的,没办法根据我们输入的关键词来更新。

这是因为数据超链接当中所包含的搜索词没有更新。

所以这一步呢,我们需要配置一下这个数据链接,实现根据搜索词动态更新。

在表格里面新创建一个数据,然后加载到 Power query 里面。

再获取这个搜索词,以变量的形式放在搜索地址里面,就完成了搜索地址的配置。

修改后的地址代码如下:

  getdata = (page)=>  let      keywords = 搜索词[ 搜索词]{0},      源 = Json.Document(Web.Contents("https://www.zhihu.com/api/v4/search_v3?t=general&q="& keywords & "&correction=1&offset="& Text.From(page*20) &"&limit=20&random=" & Text.From(Number.Random()))),      data = 源[data],      jsondata = Table.FromList(data, Splitter.SplitByNothing(), null, null, ExtraValues.Error)  in      jsondata,  转换为表 = Table.Combine(List.Transform({1..10}, getdata)),  

▲ 左右滑动查看

添加超链接

到这一步所有的数据都已经处理完成了,但是如果想要查看原始的知乎页面,需要复制这个超链接,然后在浏览器里打开。

每次要点击好几次鼠标比较麻烦;

这里我们借助 HYPERLINK 这一个函数,生成一个可以点击的超链接,这样访问起来就简单很多了。

最后效果

最后的效果就是:

❶ 输入搜索词;

❷ 点击右键刷新;

❸ 找点赞最高的;

❹ 点击【点击查看】,享受插队的感觉!

02

总结

知道在表格里面搜索的好处了吗?

❶ 按照「点赞数」排序,「评论数」排序;

❷ 看过的文章,可以加一列写备注;

❸ 可以筛选自己喜欢的「作者」等等。

明白为什么,精英都是 Excel 控了吧?

现在大部分表格的使用者,还是把 Excel 当做一个报表工具,画画表格、写写公式而已。

请你记住下面几个 Excel 新功能,这些功能已经让 Excel 成长为了,一个强大的数据统计、数据分析软件,不再是你印象中的报表而已。

❶ Power query:数据整理、清洗工具,搭载M强大的M语言,可以实现多表合并,也是本文的主要技术。

❷ Power Pivot:数据统计工具,可以自定义统计方法,实现透视表多字段计算、自定义DAX数据计算方式。

❸ Power BI:强大、易用的可视化工具,实现交互式数呈现,是企业商务数据报告优质解决方案。

欢迎在留言区聊聊:

你还知道哪些 Excel 的神奇用法?

你最希望 Excel 有什么功能?

……

私信回复关键词【插件】~

获取Excel高手都在用的“插件合集+插件使用小技巧”!

怎么用excel表做网页搜索工具_你敢相信?Excel居然可以做搜索引擎相关推荐

  1. 如何使用python读取excel表的某一列_使用python采集Excel表中某一格数据

    安装并导入模块 打开命令行窗口,输入: pip install -i https://mirrors.aliyun.com/pypi/simple/ openpyxl 导入: from openpyx ...

  2. oracle小鸡与合计,Excel EXCEL表中怎样快速实现小计和合计!excel小鸡 合计 总计

    怎么用EXCEL做每页自动小计? 步骤1 :前面插一列,在2至6入1,7至11行输入2.然后先取A2:A11,双击右下角向下填充,填充方式为复制单元格. 步骤2:选取整个数据表,数据 - 分类汇总 , ...

  3. bootstrap交互式网页设计工具_强烈推荐几种好用的网页设计工具

    今天我就要给大家推荐几种好用的网页设计工具,有了这些工具可以帮助设计师更加轻松地完成工作. 网站伴随着网络的快速发展而快速兴起,成为了上网的主要依托,而网页设计也因此成为了众多设计师的宠儿.今天我就要 ...

  4. 涉密信息搜索工具_搜索只知道百度?这些工具让你更快找到想要的信息

    最近很火的 Magi 搜索,被认为是下一代搜索引擎的雏形. 最近,一个叫 Magi 的搜索引擎火了.它可以根据你输入的关键词,自动聚合相关属性,不用到链接中去找信息,也不用等词条更新,几乎是「一眼」就 ...

  5. java 网页开发工具_制作网站常用的网页开发工具有哪些

    我们要想制作好网站其实是离不开网站代码的HTML,我们在制作网站的时候是需要用到一些常用的网页开发工具,才能完成我们网页的编写,那么,你知道制作网站常用的网页开发工具有哪些吗?不清楚的话,下面小编和你 ...

  6. windows搜索工具_加快搞定并替代 Windows 10 搜索框搜索文件速度的免费小工具

    毫无疑问,Everything 搜索是 Windows 操作系统上可用的最快的搜索工具之一.它比内置的 Windows 搜索工具快得多,因为它几乎立即返回结果,并支持许多自定义选项以优化搜索.而今天大 ...

  7. jsp后台批量导入excel表格数据到mysql中_运用java解析excel表,拿到表中的数据并批量插入数据库...

    首先,本文是运用jxl进行excel表的解析,所以我们需要先下载一个jxl.jar的jar包: 并且需要一个与excel表对应的实体类,用于接收excel的数据: 然后就是代码部分,我们先编写一个函数 ...

  8. excel查找定位删除0值_查找和删除Excel行的快速方法

    excel查找定位删除0值 It's finally summer, and you need to stay cool, even when you're using Excel. Here's a ...

  9. excel如何晒出重复数据_怎么筛选出excel中重复数据

    本文收集整理关于怎么筛选出excel中重复数据的相关议题,使用内容导航快速到达. 内容导航: Q1:Excel的数据怎么筛选一列中重复的数据 假如1在A2单元格,在B2单元格输入公式, =IF(COU ...

最新文章

  1. 【官方福利】CSDN内测师限时申请,参与赢年末礼包
  2. 压缩感知(Compressive Sensing)学习之(一)
  3. Redis运维和开发学习笔记(2) redis持久化
  4. leetcode 621. 任务调度器(贪心算法)
  5. post postman 传递数组对象_如何使用postman做接口测试
  6. .val()数据乱码_【目标检测数据集】PASCAL VOC制作
  7. V 8 nfs+drbd+heartbeat
  8. 扫地机器人电路原理图_扫地机有这一台就够了:石头扫地机器人T6 首拆
  9. 记录一次通过抓包解决Zabbix no active checks on server
  10. CentOS中zip压缩和unzip解压缩命令详解
  11. Atitit nosql的概念与attilax的理解 目录 1. 常见的nosql 二、Redis,Memcache,MongoDb的特点 1 HBase 1 2. Nosql的核心nosql 1
  12. 共享茶室小程序开发解决方案
  13. python docx创建表格
  14. Device模块管理设备信息,用于获取手机设备的相关信息,如IMEI、IMSI、型号、厂商等
  15. CentOS 搭建NFS
  16. 前端面试 - css , 布局 ,js ,vue
  17. fleck 客户端_Fleck - 又一个灵感之源 #iPhone
  18. 在线学习及作业平台管理系统(ssm,mysql)
  19. 练习- Java顺序结构综合练习三之金融投资收益计算
  20. Linux - 系统文件目录说明

热门文章

  1. 计算机组成相关论文,计算机组成与结构课程论文.docx
  2. zabbix监控redis
  3. linux下expdp定时备份_Linux下定时任务的配置
  4. axios post封装对象到后端_axios 使用post方式传递参数,后端接受不到
  5. python switch高效替代_python 中无switch(写了几个函数代替switch)
  6. cacti php zombie,Cacti1.2.x新版教程之监控本机
  7. springboot 以jar方式在linux后台运行
  8. fortran基础知识1----循环
  9. 单表60亿记录等大数据场景的MySQL优化和运维之道 | 高可用架构
  10. 1.Android新版开发教程笔记—Android ADB工具使用