晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"……/u65b0/u6d6a/u5fae/u535a……", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,上度娘搞了半天,试了很多的姿(方)势(法),终于搞定了。

问题背景:

晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"……/u65b0/u6d6a/u5fae/u535a……", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,上度娘搞了半天,试了很多的姿(方)势(法),终于搞定了。

解决方案:

呵呵,老外就是给力啊, 猛戳这里看老外给的解决方案

方案A(稳定版+推荐):functionreplace_unicode_escape_sequence($match) {

returnmb_convert_encoding(pack('H*',$match[1]),'UTF-8','UCS-2BE');

}

$name='/u65b0/u6d6a/u5fae/u535a';

$str= preg_replace_callback('/u([0-9a-f]{4})/i','replace_unicode_escape_sequence',$name);

echo$str;//输出: 新浪微博

//咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)

classHelper_Tool

{

staticfunctionunicodeDecode($data)

{

functionreplace_unicode_escape_sequence($match) {

returnmb_convert_encoding(pack('H*',$match[1]),'UTF-8','UCS-2BE');

}

$rs= preg_replace_callback('/u([0-9a-f]{4})/i','replace_unicode_escape_sequence',$data);

return$rs;

}

}

//调用

$name='/u65b0/u6d6a/u5fae/u535a';

$data= Helper_Tool::unicodeDecode($name);//输出新浪微博

方案B(次推荐):<?php

functionunicodeDecode($name){

$json='{"str":"'.$name.'"}';

$arr= json_decode($json,true);

if(emptyempty($arr))return'';

return$arr['str'];

}

$name='/u65b0/u6d6a/u5fae/u535a';

echounicodeDecode($name);//输出: 新浪微博

对于方案B, 我要特别重点说明下注意事项, 在好友 XAR (猛戳XAR博客) 的技术支持下,总结出要处理的字符串(即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号,否则就会导致解析失败, 所以有必要的话可以借助 str_replace()函数将非法字符格式化为合格字符)

本站只做收集整理与发布、我们不保证资源的完整性,安全性,时效性与可用性,请会员下载自行测试 。 本站分享的资源仅限用于学习和研究目的,不得将上述内容用于商业或非法用途,否则后果请用户自负。 本站分享的所有资源均来自网络收集,如有版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或其它存储设备中彻底删除上述内容及相关附件。

如有侵权 请提供权属证明,发送至(8@mingmiwang.com)收到信息后我们会在48小时内处理。

标签:

版权声明:本站转载仅出于为网民提供更多的信息参考之用,如有侵权 请提供权属证明 本站将删除侵权链接。

php u6d4b,PHP解码unicode编码的中文字符代码分享相关推荐

  1. php输出字符unicode码,PHP解码unicode编码的中文字符代码分享

    问题背景: 晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicod ...

  2. unicode解码php,PHP解码unicode编码的中文字符

    问题背景: 晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a...... 如何解码unicode编码的字符?[好使 ...

  3. 使用unicode编码识别中文字符、字母和数字,包括生僻汉字

    查询网络上如何识别中文字符的帖子,发现大部分只判断了常用汉字,即Unicode范围为0x4E00 ~ 0x9FA5. unicode编码最新版本是2009年9月出版的5.2版,对汉字又进行了扩充.以往 ...

  4. VS2015解决非Unicode编码包含中文字段无法编译的问题

    VS2015解决非Unicode编码包含中文字段无法编译的问题 参考文章: (1)VS2015解决非Unicode编码包含中文字段无法编译的问题 (2)https://www.cnblogs.com/ ...

  5. JavaScript中Unicode编码和中文相互转换

    Unicode转换 简介 官方中文名称为统一码,也译名为万国码.国际码.单一码,是计算机科学领域的业界标准.它整理.编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字. Uni ...

  6. \u65b0\u7f51\u5173 unicode编码与中文 互转

    中文转unicode编码: 首先,我给大家提供一个中文转unicode编码的工具 链接: //download.csdn.net/download/qq_43560721/11988683 操作步骤: ...

  7. python 中文转Unicode编码 Unicode编码转中文的四种方法

    一,中文转Unicode编码 chinese = "你好" re = chinese.encode("unicode_escape") print(re)返回: ...

  8. unicode编码 php,PHP解码unicode编码

    这篇文章主要介绍了PHP解码unicode编码 ,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下function unicode_decode($name) { //方法一 $name ...

  9. C语言 | unicode 编码的中文输出

    C语言 | unicode 编码的中文输出 1.代码 /******************************************************************** > ...

最新文章

  1. 数字货币 BCH 使用SLP创建转移token (Electron-Cash 3.4.5安装使用 )
  2. java 小波去噪原理_小波去噪的基本知识
  3. 数据结构学习笔记(一):链表(linked list)
  4. Android开发之adb命令安装apk的问题
  5. MyBatis传入参数为list、数组、map写法
  6. 日常收集C#接口知识(知识全面)
  7. libevent c++高并发网络编程_【多线程高并发编程】Callable源码分析
  8. 【总结整理】javascript的函数调用时是否加括号
  9. GHOSTXPSP3系统封装网页图文教程
  10. macOS Big Sur M1机型,如何正确完成软件的系统扩展设置?
  11. How Touch Screen Monitors Work
  12. 容器技术Docker K8s 2 云原生容器技术概述
  13. Chrome、FireFox浏览器新标签页打开搜索和书签
  14. ASM文件系统 数据如何写和读数据
  15. Python下载及环境的安装
  16. 镇楼篇--转行初入IT的心路历程
  17. c语言编程泰勒展开式计算,用C语言实现一个泰勒展开式的计算
  18. threejs中引入draco压缩后的模型
  19. css网站变灰色代码
  20. 免费采集器-网页数据采集器

热门文章

  1. python2.7更新_centos系统python2.7更新到3.5
  2. [SDOI2006]线性方程组 高斯消元
  3. bzoj 4942 整数 思考记录
  4. 计算机视觉导论试题,计算机视觉基础复习.docx
  5. 【英语学习】【WOTD】impetus 释义/词源/示例
  6. python 3.7.732位安装步骤_Python3.7.0安装教程
  7. ctf 改变图片高度_通过CRC32爆破修改图片的宽高 ctf-misc图片隐写
  8. SVN中trunk,branches,tags用法详解
  9. 高擎信息安全大旗,打造“互联网+”新服务模式
  10. Crontab 计划任务