php u6d4b,PHP解码unicode编码的中文字符代码分享
晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"……/u65b0/u6d6a/u5fae/u535a……", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,上度娘搞了半天,试了很多的姿(方)势(法),终于搞定了。
问题背景:
晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"……/u65b0/u6d6a/u5fae/u535a……", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,上度娘搞了半天,试了很多的姿(方)势(法),终于搞定了。
解决方案:
呵呵,老外就是给力啊, 猛戳这里看老外给的解决方案
方案A(稳定版+推荐):functionreplace_unicode_escape_sequence($match) {
returnmb_convert_encoding(pack('H*',$match[1]),'UTF-8','UCS-2BE');
}
$name='/u65b0/u6d6a/u5fae/u535a';
$str= preg_replace_callback('/u([0-9a-f]{4})/i','replace_unicode_escape_sequence',$name);
echo$str;//输出: 新浪微博
//咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)
classHelper_Tool
{
staticfunctionunicodeDecode($data)
{
functionreplace_unicode_escape_sequence($match) {
returnmb_convert_encoding(pack('H*',$match[1]),'UTF-8','UCS-2BE');
}
$rs= preg_replace_callback('/u([0-9a-f]{4})/i','replace_unicode_escape_sequence',$data);
return$rs;
}
}
//调用
$name='/u65b0/u6d6a/u5fae/u535a';
$data= Helper_Tool::unicodeDecode($name);//输出新浪微博
方案B(次推荐):<?php
functionunicodeDecode($name){
$json='{"str":"'.$name.'"}';
$arr= json_decode($json,true);
if(emptyempty($arr))return'';
return$arr['str'];
}
$name='/u65b0/u6d6a/u5fae/u535a';
echounicodeDecode($name);//输出: 新浪微博
对于方案B, 我要特别重点说明下注意事项, 在好友 XAR (猛戳XAR博客) 的技术支持下,总结出要处理的字符串(即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号,否则就会导致解析失败, 所以有必要的话可以借助 str_replace()函数将非法字符格式化为合格字符)
本站只做收集整理与发布、我们不保证资源的完整性,安全性,时效性与可用性,请会员下载自行测试 。 本站分享的资源仅限用于学习和研究目的,不得将上述内容用于商业或非法用途,否则后果请用户自负。 本站分享的所有资源均来自网络收集,如有版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或其它存储设备中彻底删除上述内容及相关附件。
如有侵权 请提供权属证明,发送至(8@mingmiwang.com)收到信息后我们会在48小时内处理。
标签:
赏
版权声明:本站转载仅出于为网民提供更多的信息参考之用,如有侵权 请提供权属证明 本站将删除侵权链接。
php u6d4b,PHP解码unicode编码的中文字符代码分享相关推荐
- php输出字符unicode码,PHP解码unicode编码的中文字符代码分享
问题背景: 晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicod ...
- unicode解码php,PHP解码unicode编码的中文字符
问题背景: 晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a...... 如何解码unicode编码的字符?[好使 ...
- 使用unicode编码识别中文字符、字母和数字,包括生僻汉字
查询网络上如何识别中文字符的帖子,发现大部分只判断了常用汉字,即Unicode范围为0x4E00 ~ 0x9FA5. unicode编码最新版本是2009年9月出版的5.2版,对汉字又进行了扩充.以往 ...
- VS2015解决非Unicode编码包含中文字段无法编译的问题
VS2015解决非Unicode编码包含中文字段无法编译的问题 参考文章: (1)VS2015解决非Unicode编码包含中文字段无法编译的问题 (2)https://www.cnblogs.com/ ...
- JavaScript中Unicode编码和中文相互转换
Unicode转换 简介 官方中文名称为统一码,也译名为万国码.国际码.单一码,是计算机科学领域的业界标准.它整理.编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字. Uni ...
- \u65b0\u7f51\u5173 unicode编码与中文 互转
中文转unicode编码: 首先,我给大家提供一个中文转unicode编码的工具 链接: //download.csdn.net/download/qq_43560721/11988683 操作步骤: ...
- python 中文转Unicode编码 Unicode编码转中文的四种方法
一,中文转Unicode编码 chinese = "你好" re = chinese.encode("unicode_escape") print(re)返回: ...
- unicode编码 php,PHP解码unicode编码
这篇文章主要介绍了PHP解码unicode编码 ,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下function unicode_decode($name) { //方法一 $name ...
- C语言 | unicode 编码的中文输出
C语言 | unicode 编码的中文输出 1.代码 /******************************************************************** > ...
最新文章
- 数字货币 BCH 使用SLP创建转移token (Electron-Cash 3.4.5安装使用 )
- java 小波去噪原理_小波去噪的基本知识
- 数据结构学习笔记(一):链表(linked list)
- Android开发之adb命令安装apk的问题
- MyBatis传入参数为list、数组、map写法
- 日常收集C#接口知识(知识全面)
- libevent c++高并发网络编程_【多线程高并发编程】Callable源码分析
- 【总结整理】javascript的函数调用时是否加括号
- GHOSTXPSP3系统封装网页图文教程
- macOS Big Sur M1机型,如何正确完成软件的系统扩展设置?
- How Touch Screen Monitors Work
- 容器技术Docker K8s 2 云原生容器技术概述
- Chrome、FireFox浏览器新标签页打开搜索和书签
- ASM文件系统 数据如何写和读数据
- Python下载及环境的安装
- 镇楼篇--转行初入IT的心路历程
- c语言编程泰勒展开式计算,用C语言实现一个泰勒展开式的计算
- threejs中引入draco压缩后的模型
- css网站变灰色代码
- 免费采集器-网页数据采集器
热门文章
- python2.7更新_centos系统python2.7更新到3.5
- [SDOI2006]线性方程组 高斯消元
- bzoj 4942 整数 思考记录
- 计算机视觉导论试题,计算机视觉基础复习.docx
- 【英语学习】【WOTD】impetus 释义/词源/示例
- python 3.7.732位安装步骤_Python3.7.0安装教程
- ctf 改变图片高度_通过CRC32爆破修改图片的宽高 ctf-misc图片隐写
- SVN中trunk,branches,tags用法详解
- 高擎信息安全大旗,打造“互联网+”新服务模式
- Crontab 计划任务