关于\u003c转换成正常html符号的事
这两天,在用php写一个爬虫。
对方的代码都在JS中,表现形式为ASCII编码。如下图示:
"\u003cdiv class=\"grid-container footer-container\"\u003e\n \u003cdiv class=\"grid footer\"\u003e\n \u003cdiv class=\"grid__item md--one-quarter\"\u003e\n \u003cp class=\"footer__title\"\u003eSupport\u003c/p\u003e\n \u003cul class=\"footer__nav\"\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/about\"\u003e\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/contact\"\u003eContact us\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/cookies\"\u003eCookie Policy\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/terms\"\u003eTerms of use\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/privacy\"\u003ePrivacy Policy\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/ub/refunds\"\u003eReturns Policy\u003c/a\u003e\u003c/li\u003e\n \u003c/ul\u003e\n \u003cp class=\"footer__title\"\u003eSafe and Secure\u003c/p\u003e\n \u003cimg class=\"footer__ssl\" src=\"/themes/compare-modular/images/v2/ssl-secured.svg\" alt=\"\"\u003e\n \u003c/div\u003e\n \u003cdiv class=\"grid__item md--one-half\"\u003e\n \u003cp class=\"footer__title\"\u003eShop\u003c/p\u003e\n \u003cul class=\"footer__nav footer__nav--categories\"\u003e\n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Home\u0026#43;Furniture\u0026#43;DIY\"\u003eHome, Furniture \u0026amp; DIY\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Garden\u0026#43;Patio\"\u003eGarden \u0026amp; Patio\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=TV\u0026#43;Speakers\"\u003eSound \u0026amp; Vision\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=sports\u0026#43;equipment\"\u003eSports Goods\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=makeup\u0026#43;skincare\"\u003eHealth \u0026amp; Beauty\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=cars\u0026#43;motorcycles\"\u003eCars, Motorcycles \u0026amp; Vehicles\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=jewellery\u0026#43;watches\"\u003eJewellery \u0026amp; Watches\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?=mobile\u0026#43;phones\"\u003eSmartphones\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=Toys\u0026#43;Games\"\u003eToys \u0026amp; Games\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=baby\"\u003eBaby\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=child\u0026#43;clothes\"\u003eKids Clothes \u0026amp; Shoes\u003c/a\u003e\u003c/li\u003e\n \n \n \n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"/search?q=clothing\u0026#43;accessories\"\u003eClothing \u0026amp; Accessories\u003c/a\u003e\u003c/li\u003e\n \n \n \u003c/ul\u003e\n \u003c/div\u003e\n \u003cdiv class=\"grid__item md--one-quarter\"\u003e\n \u003cp class=\"footer__title\"\u003eOur Address\u003c/p\u003e\n \u003cul class=\"footer__nav\"\u003e\n \u003cli class=\"footer__nav__item\"\u003e\u003ca href=\"https://www.redbrain.com/\"\u003eRedBrain\u003c/a\u003e\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003eSuite 14, Cathedral House\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003e5 Beacon Street\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003eLichfield\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003eStaffordshire\u003c/li\u003e\n \u003cli class=\"footer__nav__item\"\u003eWS13 7AA\u003c/li\u003e\n \u003c/ul\u003e\n \u003c/div\u003e\n \u003c/div\u003e\n\u003c/div\u003e\n\u003cdiv class=\"grid-container footer-container footer-container--2\"\u003e\n \u003cdiv class=\"grid\"\u003e\n \u003cdiv class=\"grid__item\"\u003e\n \u003cdiv class=\"footer footer--2\"\u003e\n \u003ca class=\"footer--2__link\" href=\"/\"\u003e\u003cimg class=\"footer--2__logo\" src=\"/images/logo.svg\" alt=\"\"\u003e\u003c/a\u003e\n \u003cp\u003e© RedBrain 2018\u003c/p\u003e\n \u003c/div\u003e\n \u003c/div\u003e\n \u003c/div\u003e\n\u003c/div\u003e\n\n\n\n
怎么转啊?
找啊找啊,找朋友。找到一个小方法。
$str = preg_replace("/\\\\u([0-9a-f]{3,4})/i", "&#x\\1;", $str);
$str = html_entity_decode($str, null, 'UTF-8');
转换后效果为
<div class="grid-container footer-container"><div class="grid footer"><div class="grid__item md--one-quarter"><p class="footer__title">Support</p><ul class="footer__nav"><li class="footer__nav__item"><a href="/about"></a></li><li class="footer__nav__item"><a href="/contact">Contact us</a></li><li class="footer__nav__item"><a href="/cookies">Cookie Policy</a></li><li class="footer__nav__item"><a href="/terms">Terms of use</a></li><li class="footer__nav__item"><a href="/privacy">Privacy Policy</a></li><li class="footer__nav__item"><a href="/ub/refunds">Returns Policy</a></li></ul><p class="footer__title">Safe and Secure</p><img class="footer__ssl" src="/themes/compare-modular/images/v2/ssl-secured.svg" alt=""></div><div class="grid__item md--one-half"><p class="footer__title">Shop</p><ul class="footer__nav footer__nav--categories"><li class="footer__nav__item"><a href="/search?q=Home+Furniture+DIY">Home, Furniture & DIY</a></li><li class="footer__nav__item"><a href="/search?q=Garden+Patio">Garden & Patio</a></li><li class="footer__nav__item"><a href="/search?q=TV+Speakers">Sound & Vision</a></li><li class="footer__nav__item"><a href="/search?q=sports+equipment">Sports Goods</a></li><li class="footer__nav__item"><a href="/search?q=makeup+skincare">Health & Beauty</a></li><li class="footer__nav__item"><a href="/search?q=cars+motorcycles">Cars, Motorcycles & Vehicles</a></li><li class="footer__nav__item"><a href="/search?q=jewellery+watches">Jewellery & Watches</a></li><li class="footer__nav__item"><a href="/search?=mobile+phones">Smartphones</a></li><li class="footer__nav__item"><a href="/search?q=Toys+Games">Toys & Games</a></li><li class="footer__nav__item"><a href="/search?q=baby">Baby</a></li><li class="footer__nav__item"><a href="/search?q=child+clothes">Kids Clothes & Shoes</a></li><li class="footer__nav__item"><a href="/search?q=clothing+accessories">Clothing & Accessories</a></li></ul></div><div class="grid__item md--one-quarter"><p class="footer__title">Our Address</p><ul class="footer__nav"><li class="footer__nav__item"><a href="https://www.redbrain.com/">RedBrain</a></li><li class="footer__nav__item">Suite 14, Cathedral House</li><li class="footer__nav__item">5 Beacon Street</li><li class="footer__nav__item">Lichfield</li><li class="footer__nav__item">Staffordshire</li><li class="footer__nav__item">WS13 7AA</li></ul></div></div>
</div>
<div class="grid-container footer-container footer-container--2"><div class="grid"><div class="grid__item"><div class="footer footer--2"><a class="footer--2__link" href="/"><img class="footer--2__logo" src="/images/logo.svg" alt=""></a><p>© RedBrain 2018</p></div></div></div>
</div>
好啦,搞定了。
关于\u003c转换成正常html符号的事相关推荐
- 将十进制数转换成二进制数(C语言)
C语言--将十进制数转换成二进制数 方法:除 2 取余,逆序排列 原理:用 2 整除十进制整数,可以得到一个商和余数:再用 2 去除商,又会得到一个商和余数,如此进行,直到商为小于 1 时为止,然后把 ...
- c++ int自动转换成无符号变量产生的问题
c++ int自动转换成无符号变量产生的问题 无符号对象不会小于零,尽管我们不会故意给无符号对象赋一个负值,但可能写出这样的代码. 1.当一个算数表达式中既有无符号数又有int值时,那个int值就会转 ...
- php函数用竖线隔开,用指定的分隔符号把字符串转换成数组《 PHP 基础 》
现在我这里有一个字符串 ... 就是这个 $tracks ... 它的值是用竖线分隔开的一些文字 ... 使用 explode 函数 ... 我们可以使用竖线作为分隔符,把这个字符串转换成一个数组. ...
- javascript 将中文符号转换成英文符号
javascript 将中文符号转换成英文符号 CreateTime--2018年3月30日09:01:29 Author:Marydon /*** 将中文符号转换成英文符号*/ function c ...
- C语言strtoul()函数:将字符串转换成unsigned long(无符号长整型数)
头文件:#include <stdlib.h> strtoul() 函数源自于"string to unsigned long",用来将字符串转换成无符号长整型数(un ...
- 将源代码中的全角符号转换成半角符号并对代码风格进行美化
从网上拷下来的代码经常会出现全角符号,代码风格也很糟糕,可以用下面的方法进行修正美化. 1.安装astyle 2.写一个format.sh脚本 这里只是对空格还有数字.字母进行转换,可根据自己的需求再 ...
- 将24位(任意位数)补码转换成有符号整数的方法
我们在使用ADC的时候可能会遇到AD转换结果以24bit.12bit.10bit或诸如此类的补码形式输出,而计算机或单片机中,变量类型大多是8bit.16bit.32bit的.那该怎样把这些AD转换得 ...
- linux命令:将一行数据根据指定符号转换成多行
将一行转换成多行cat stat7.txt | awk -F"*" '{print $4}' | awk -F" " '{for(i=1;i<=NF;i+ ...
- oracle 转化为整数,字符串转换成整数——从源码学习
字符串转换成整数:输入一个表示整数的字符串,把该字符串转换成整数并输出,例如输入字符串"345",则输出整数345. 在笔试面试中,atoi 即「字符串转换成整数」是一个经典问题了 ...
最新文章
- 从定制软件到通用软件的转变
- 手把手教你实现GAN半监督学习
- 序列模式挖掘、频繁项集与频繁序列
- 春节假期延长了,这里给你推荐几本2020年不容错过的机器学习书籍!
- 购买阿里云服务器地域如何选择?
- mscoreei.dll没有被指定在windows上运行_在Windows上使用Docker运行.NetCore
- Linux 数据流重定向
- unity 线程断点时卡机_Compute Shader在Unity和UE4中的应用
- Solr+Hbase多条件查(优劣互补)
- 数据库常用的锁有哪些?
- 服务器系统怎么么安装手绘板驱动,wacom数位板如何使用?wacom数位板驱动安装教程!...
- 台式计算机连接投影仪无信号,acer投影仪显示无信号?电脑开机显示器无信号?投影仪无信号输入的解决办法是什么?...
- rabbitMq入门
- 【转】一个老程序员的心理话
- Android 仿京东商城购物车及源码
- 如何解决360极速浏览器主页无法修改问题
- 拜仁超越自我终成夙愿-记2013欧冠决赛
- 大学物理复习笔记——静电场
- A2B的典型应用-给汽车的车机系统做从设备板
- 类型转换、强制类型转换