这两天,在用php写一个爬虫。
对方的代码都在JS中,表现形式为ASCII编码。如下图示:

"\u003cdiv class=\"grid-container footer-container\"\u003e\n  \u003cdiv class=\"grid footer\"\u003e\n    \u003cdiv class=\"grid__item md--one-quarter\"\u003e\n      \u003cp class=\"footer__title\"\u003eSupport\u003c/p\u003e\n      \u003cul class=\"footer__nav\"\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/about\"\u003e\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/contact\"\u003eContact us\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/cookies\"\u003eCookie Policy\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/terms\"\u003eTerms of use\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/privacy\"\u003ePrivacy Policy\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/ub/refunds\"\u003eReturns Policy\u003c/a\u003e\u003c/li\u003e\n      \u003c/ul\u003e\n      \u003cp class=\"footer__title\"\u003eSafe and Secure\u003c/p\u003e\n      \u003cimg class=\"footer__ssl\" src=\"/themes/compare-modular/images/v2/ssl-secured.svg\" alt=\"\"\u003e\n    \u003c/div\u003e\n    \u003cdiv class=\"grid__item md--one-half\"\u003e\n      \u003cp class=\"footer__title\"\u003eShop\u003c/p\u003e\n      \u003cul class=\"footer__nav footer__nav--categories\"\u003e\n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Home\u0026#43;Furniture\u0026#43;DIY\"\u003eHome, Furniture \u0026amp; DIY\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Garden\u0026#43;Patio\"\u003eGarden \u0026amp; Patio\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=TV\u0026#43;Speakers\"\u003eSound \u0026amp; Vision\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=sports\u0026#43;equipment\"\u003eSports Goods\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=makeup\u0026#43;skincare\"\u003eHealth \u0026amp; Beauty\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=cars\u0026#43;motorcycles\"\u003eCars, Motorcycles \u0026amp; Vehicles\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=jewellery\u0026#43;watches\"\u003eJewellery \u0026amp; Watches\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?=mobile\u0026#43;phones\"\u003eSmartphones\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Toys\u0026#43;Games\"\u003eToys \u0026amp; Games\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=baby\"\u003eBaby\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=child\u0026#43;clothes\"\u003eKids Clothes \u0026amp; Shoes\u003c/a\u003e\u003c/li\u003e\n          \n        \n          \n            \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=clothing\u0026#43;accessories\"\u003eClothing \u0026amp; Accessories\u003c/a\u003e\u003c/li\u003e\n          \n        \n      \u003c/ul\u003e\n    \u003c/div\u003e\n    \u003cdiv class=\"grid__item md--one-quarter\"\u003e\n      \u003cp class=\"footer__title\"\u003eOur Address\u003c/p\u003e\n      \u003cul class=\"footer__nav\"\u003e\n        \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"https://www.redbrain.com/\"\u003eRedBrain\u003c/a\u003e\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003eSuite 14, Cathedral House\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003e5 Beacon Street\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003eLichfield\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003eStaffordshire\u003c/li\u003e\n        \u003cli class=\"footer__nav__item\"\u003eWS13 7AA\u003c/li\u003e\n      \u003c/ul\u003e\n    \u003c/div\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n\u003cdiv class=\"grid-container footer-container footer-container--2\"\u003e\n  \u003cdiv class=\"grid\"\u003e\n    \u003cdiv class=\"grid__item\"\u003e\n      \u003cdiv class=\"footer footer--2\"\u003e\n        \u003ca class=\"footer--2__link\" href=\"/\"\u003e\u003cimg class=\"footer--2__logo\" src=\"/images/logo.svg\" alt=\"\"\u003e\u003c/a\u003e\n        \u003cp\u003e© RedBrain 2018\u003c/p\u003e\n      \u003c/div\u003e\n    \u003c/div\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n\n\n\n 

怎么转啊?
找啊找啊,找朋友。找到一个小方法。

$str = preg_replace("/\\\\u([0-9a-f]{3,4})/i", "&#x\\1;", $str);
$str = html_entity_decode($str, null, 'UTF-8');

转换后效果为

<div class="grid-container footer-container"><div class="grid footer"><div class="grid__item md--one-quarter"><p class="footer__title">Support</p><ul class="footer__nav"><li class="footer__nav__item"><a href="/about"></a></li><li class="footer__nav__item"><a href="/contact">Contact us</a></li><li class="footer__nav__item"><a href="/cookies">Cookie Policy</a></li><li class="footer__nav__item"><a href="/terms">Terms of use</a></li><li class="footer__nav__item"><a href="/privacy">Privacy Policy</a></li><li class="footer__nav__item"><a href="/ub/refunds">Returns Policy</a></li></ul><p class="footer__title">Safe and Secure</p><img class="footer__ssl" src="/themes/compare-modular/images/v2/ssl-secured.svg" alt=""></div><div class="grid__item md--one-half"><p class="footer__title">Shop</p><ul class="footer__nav footer__nav--categories"><li class="footer__nav__item"><a href="/search?q=Home+Furniture+DIY">Home, Furniture &amp; DIY</a></li><li class="footer__nav__item"><a href="/search?q=Garden+Patio">Garden &amp; Patio</a></li><li class="footer__nav__item"><a href="/search?q=TV+Speakers">Sound &amp; Vision</a></li><li class="footer__nav__item"><a href="/search?q=sports+equipment">Sports Goods</a></li><li class="footer__nav__item"><a href="/search?q=makeup+skincare">Health &amp; Beauty</a></li><li class="footer__nav__item"><a href="/search?q=cars+motorcycles">Cars, Motorcycles &amp; Vehicles</a></li><li class="footer__nav__item"><a href="/search?q=jewellery+watches">Jewellery &amp; Watches</a></li><li class="footer__nav__item"><a href="/search?=mobile+phones">Smartphones</a></li><li class="footer__nav__item"><a href="/search?q=Toys+Games">Toys &amp; Games</a></li><li class="footer__nav__item"><a href="/search?q=baby">Baby</a></li><li class="footer__nav__item"><a href="/search?q=child+clothes">Kids Clothes &amp; Shoes</a></li><li class="footer__nav__item"><a href="/search?q=clothing+accessories">Clothing &amp; Accessories</a></li></ul></div><div class="grid__item md--one-quarter"><p class="footer__title">Our Address</p><ul class="footer__nav"><li class="footer__nav__item"><a href="https://www.redbrain.com/">RedBrain</a></li><li class="footer__nav__item">Suite 14, Cathedral House</li><li class="footer__nav__item">5 Beacon Street</li><li class="footer__nav__item">Lichfield</li><li class="footer__nav__item">Staffordshire</li><li class="footer__nav__item">WS13 7AA</li></ul></div></div>
</div>
<div class="grid-container footer-container footer-container--2"><div class="grid"><div class="grid__item"><div class="footer footer--2"><a class="footer--2__link" href="/"><img class="footer--2__logo" src="/images/logo.svg" alt=""></a><p>© RedBrain 2018</p></div></div></div>
</div>

好啦,搞定了。

关于\u003c转换成正常html符号的事相关推荐

  1. 将十进制数转换成二进制数(C语言)

    C语言--将十进制数转换成二进制数 方法:除 2 取余,逆序排列 原理:用 2 整除十进制整数,可以得到一个商和余数:再用 2 去除商,又会得到一个商和余数,如此进行,直到商为小于 1 时为止,然后把 ...

  2. c++ int自动转换成无符号变量产生的问题

    c++ int自动转换成无符号变量产生的问题 无符号对象不会小于零,尽管我们不会故意给无符号对象赋一个负值,但可能写出这样的代码. 1.当一个算数表达式中既有无符号数又有int值时,那个int值就会转 ...

  3. php函数用竖线隔开,用指定的分隔符号把字符串转换成数组《 PHP 基础 》

    现在我这里有一个字符串 ... 就是这个 $tracks ... 它的值是用竖线分隔开的一些文字 ... 使用 explode 函数 ... 我们可以使用竖线作为分隔符,把这个字符串转换成一个数组. ...

  4. javascript 将中文符号转换成英文符号

    javascript 将中文符号转换成英文符号 CreateTime--2018年3月30日09:01:29 Author:Marydon /*** 将中文符号转换成英文符号*/ function c ...

  5. C语言strtoul()函数:将字符串转换成unsigned long(无符号长整型数)

    头文件:#include <stdlib.h> strtoul() 函数源自于"string to unsigned long",用来将字符串转换成无符号长整型数(un ...

  6. 将源代码中的全角符号转换成半角符号并对代码风格进行美化

    从网上拷下来的代码经常会出现全角符号,代码风格也很糟糕,可以用下面的方法进行修正美化. 1.安装astyle 2.写一个format.sh脚本 这里只是对空格还有数字.字母进行转换,可根据自己的需求再 ...

  7. 将24位(任意位数)补码转换成有符号整数的方法

    我们在使用ADC的时候可能会遇到AD转换结果以24bit.12bit.10bit或诸如此类的补码形式输出,而计算机或单片机中,变量类型大多是8bit.16bit.32bit的.那该怎样把这些AD转换得 ...

  8. linux命令:将一行数据根据指定符号转换成多行

    将一行转换成多行cat stat7.txt | awk -F"*" '{print $4}' | awk -F" " '{for(i=1;i<=NF;i+ ...

  9. oracle 转化为整数,字符串转换成整数——从源码学习

    字符串转换成整数:输入一个表示整数的字符串,把该字符串转换成整数并输出,例如输入字符串"345",则输出整数345. 在笔试面试中,atoi 即「字符串转换成整数」是一个经典问题了 ...

最新文章

  1. 从定制软件到通用软件的转变
  2. 手把手教你实现GAN半监督学习
  3. 序列模式挖掘、频繁项集与频繁序列
  4. 春节假期延长了,这里给你推荐几本2020年不容错过的机器学习书籍!
  5. 购买阿里云服务器地域如何选择?
  6. mscoreei.dll没有被指定在windows上运行_在Windows上使用Docker运行.NetCore
  7. Linux 数据流重定向
  8. unity 线程断点时卡机_Compute Shader在Unity和UE4中的应用
  9. Solr+Hbase多条件查(优劣互补)
  10. 数据库常用的锁有哪些?
  11. 服务器系统怎么么安装手绘板驱动,wacom数位板如何使用?wacom数位板驱动安装教程!...
  12. 台式计算机连接投影仪无信号,acer投影仪显示无信号?电脑开机显示器无信号?投影仪无信号输入的解决办法是什么?...
  13. rabbitMq入门
  14. 【转】一个老程序员的心理话
  15. Android 仿京东商城购物车及源码
  16. 如何解决360极速浏览器主页无法修改问题
  17. 拜仁超越自我终成夙愿-记2013欧冠决赛
  18. 大学物理复习笔记——静电场
  19. A2B的典型应用-给汽车的车机系统做从设备板
  20. 类型转换、强制类型转换

热门文章

  1. 众美集团携手行业伙伴 聚焦城镇创新与城市更新
  2. PM、PD、UE与UI 分别是什么
  3. 20189215 2018-2019-2 《密码与安全新技术专题》课程总结
  4. Excel 实用小技巧:如何复制出使用公式后得到的数据
  5. 制作正方体html+css3(动画)
  6. java逻辑他推理之公式逆推
  7. 利用Python进行数据分析:数据规整(基于DataFrame)
  8. 证券基础知识---股票
  9. php 即时通讯 app,即时通讯软件有什么
  10. 工控自动化方案:和利时LE系列PLC数采通讯