如果你将“联通”二字保存到记事本中,保存后关闭,重新打开,记事本将显示乱码。

仔细研究一下,你会发现这不是什么神奇的事情。我们点一下另存为:

但是记事本默认应该使用GBK(或GB2312)编码来给字符编码,所以正常的文本中,点击另存为应该是这样的:

说明只有“联通”的文档已被自动更正为UTF-8编码,这是为什么?
在简体中文系统下,ANSI编码代表 GB2312编码,而记事本默认使用ANSI编码。
而在UTF-8编码中,当需要两个字节表示一个字符的时候,该字符的第一个字节必为“110XXXXX”,第二个字节必为“10XXXXXX”。
“联”字为-63 -86,即11000001 10101010;“通”字为-51 -88,即11001101 10101000。两个字都符合UTF-8的规律,所以记事本以UTF-8的格式保存了文本。
所以,我们可以遍历一下所有范围内的汉字,结果发现以下字符均会被保存成UTF-8编码。

public class Main
{public static void main(String[] args){int i = 0;for (byte left = (byte) 0b11000000; left <= (byte) 0b11011111; left++){for (byte right = (byte) 0b10000000; right <= (byte) 0b10111111; right++){System.out.print(new String(new byte[] {left, right}));i++;}System.out.println();}System.out.println(i);}
}

运行结果:

纮纴纻纼绖绤绬绹缊缐缞缷缹缻缼缽缾缿罀罁罃罆罇罈罉罊罋罌罍罎罏罒罓馈愧溃坤昆捆困括扩廓阔垃拉喇蜡腊辣啦莱来赖蓝婪栏拦篮阑兰澜谰揽
羳羴羵羶羷羺羻羾翀翂翃翄翆翇翈翉翋翍翏翐翑習翓翖翗翙翚翛翜翝翞翢翣痢立粒沥隶力璃哩俩联莲连镰廉怜涟帘敛脸链恋炼练粮凉梁粱良两辆量
聙聛聜聝聞聟聠聡聢聣聤聥聦聧聨聫聬聭聮聯聰聲聳聴聵聶職聸聹聺聻聼聽隆垄拢陇楼娄搂篓漏陋芦卢颅庐炉掳卤虏鲁麓碌露路赂鹿潞禄录陆戮驴
脌脕脗脙脛脜脝脟脠脡脢脣脤脥脦脧脨脩脪脫脭脮脰脳脴脵脷脹脺脻脼脽脿谩芒茫盲氓忙莽猫茅锚毛矛铆卯茂冒帽貌贸么玫枚梅酶霉煤没眉媒镁每
膧膩膫膬膭膮膯膰膱膲膴膵膶膷膸膹膼膽膾膿臄臅臇臈臉臋臍臎臏臐臑臒臓摹蘑模膜磨摩魔抹末莫墨默沫漠寞陌谋牟某拇牡亩姆母墓暮幕募慕木目
艀艁艂艃艅艆艈艊艌艍艎艐艑艒艓艔艕艖艗艙艛艜艝艞艠艡艢艣艤艥艦艧艩拧泞牛扭钮纽脓浓农弄奴努怒女暖虐疟挪懦糯诺哦欧鸥殴藕呕偶沤啪趴
苺苼苽苾苿茀茊茋茍茐茒茓茖茘茙茝茞茟茠茡茢茣茤茥茦茩茪茮茰茲茷茻茽啤脾疲皮匹痞僻屁譬篇偏片骗飘漂瓢票撇瞥拼频贫品聘乒坪苹萍平凭瓶
莯莵莻莾莿菂菃菄菆菈菉菋菍菎菐菑菒菓菕菗菙菚菛菞菢菣菤菦菧菨菫菬菭恰洽牵扦钎铅千迁签仟谦乾黔钱钳前潜遣浅谴堑嵌欠歉枪呛腔羌墙蔷强
葊葋葌葍葎葏葐葒葓葔葕葖葘葝葞葟葠葢葤葥葦葧葨葪葮葯葰葲葴葷葹葻葼取娶龋趣去圈颧权醛泉全痊拳犬券劝缺炔瘸却鹊榷确雀裙群然燃冉染瓤
蓘蓙蓚蓛蓜蓞蓡蓢蓤蓧蓨蓩蓪蓫蓭蓮蓯蓱蓲蓳蓴蓵蓶蓷蓸蓹蓺蓻蓽蓾蔀蔁蔂伞散桑嗓丧搔骚扫嫂瑟色涩森僧莎砂杀刹沙纱傻啥煞筛晒珊苫杉山删煽
蕗蕘蕚蕛蕜蕝蕟蕠蕡蕢蕣蕥蕦蕧蕩蕪蕫蕬蕭蕮蕯蕰蕱蕳蕵蕶蕷蕸蕼蕽蕿薀薁省盛剩胜圣师失狮施湿诗尸虱十石拾时什食蚀实识史矢使屎驶始式示士
藔藖藗藘藙藚藛藝藞藟藠藡藢藣藥藦藧藨藪藫藬藭藮藯藰藱藲藳藴藵藶藷藸恕刷耍摔衰甩帅栓拴霜双爽谁水睡税吮瞬顺舜说硕朔烁斯撕嘶思私司丝
虁虂虃虄虅虆虇虈虉虊虋虌虒虓處虖虗虘虙虛虜虝號虠虡虣虤虥虦虧虨虩虪獭挞蹋踏胎苔抬台泰酞太态汰坍摊贪瘫滩坛檀痰潭谭谈坦毯袒碳探叹炭
蛝蛠蛡蛢蛣蛥蛦蛧蛨蛪蛫蛬蛯蛵蛶蛷蛺蛻蛼蛽蛿蜁蜄蜅蜆蜋蜌蜎蜏蜐蜑蜔蜖汀廷停亭庭挺艇通桐酮瞳同铜彤童桶捅筒统痛偷投头透凸秃突图徒途涂
蝷蝸蝹蝺蝿螀螁螄螆螇螉螊螌螎螏螐螑螒螔螕螖螘螙螚螛螜螝螞螠螡螢螣螤巍微危韦违桅围唯惟为潍维苇萎委伟伪尾纬未蔚味畏胃喂魏位渭谓尉慰
蟺蟻蟼蟽蟿蠀蠁蠂蠄蠅蠆蠇蠈蠉蠋蠌蠍蠎蠏蠐蠑蠒蠔蠗蠘蠙蠚蠜蠝蠞蠟蠠蠣稀息希悉膝夕惜熄烯溪汐犀檄袭席习媳喜铣洗系隙戏细瞎虾匣霞辖暇峡
衻衼袀袃袆袇袉袊袌袎袏袐袑袓袔袕袗袘袙袚袛袝袞袟袠袡袣袥袦袧袨袩袪小孝校肖啸笑效楔些歇蝎鞋协挟携邪斜胁谐写械卸蟹懈泄泻谢屑薪芯锌
褉褋褌褍褎褏褑褔褕褖褗褘褜褝褞褟褠褢褣褤褦褧褨褩褬褭褮褯褱褲褳褵褷选癣眩绚靴薛学穴雪血勋熏循旬询寻驯巡殉汛训讯逊迅压押鸦鸭呀丫芽
襽襾覀覂覄覅覇覈覉覊見覌覍覎規覐覑覒覓覔覕視覗覘覙覚覛覜覝覞覟覠覡摇尧遥窑谣姚咬舀药要耀椰噎耶爷野冶也页掖业叶曳腋夜液一壹医揖铱
觻觼觽觾觿訁訂訃訄訅訆計訉訊訋訌訍討訏訐訑訒訓訔訕訖託記訙訚訛訜訝印英樱婴鹰应缨莹萤营荧蝇迎赢盈影颖硬映哟拥佣臃痈庸雍踊蛹咏泳涌
詟詠詡詢詣詤詥試詧詨詩詪詫詬詭詮詯詰話該詳詴詵詶詷詸詺詻詼詽詾詿誀浴寓裕预豫驭鸳渊冤元垣袁原援辕园员圆猿源缘远苑愿怨院曰约越跃钥
諃諄諅諆談諈諉諊請諌諍諎諏諐諑諒諓諔諕論諗諘諙諚諛諜諝諞諟諠諡諢諣铡闸眨栅榨咋乍炸诈摘斋宅窄债寨瞻毡詹粘沾盏斩辗崭展蘸栈占战站湛
謤謥謧謨謩謪謫謬謭謮謯謰謱謲謳謴謵謶謷謸謹謺謻謼謽謾謿譀譁譂譃譄譅帧症郑证芝枝支吱蜘知肢脂汁之织职直植殖执值侄址指止趾只旨纸志挚
讇讈讉變讋讌讍讎讏讐讑讒讓讔讕讖讗讘讙讚讛讜讝讞讟讬讱讻诇诐诪谉谞住注祝驻抓爪拽专砖转撰赚篆桩庄装妆撞壮状椎锥追赘坠缀谆准捉拙卓
貈貋貍貎貏貐貑貒貓貕貖貗貙貚貛貜貝貞貟負財貢貣貤貥貦貧貨販貪貫責貭亍丌兀丐廿卅丕亘丞鬲孬噩丨禺丿匕乇夭爻卮氐囟胤馗毓睾鼗丶亟鼐乜
賭賮賯賰賱賲賳賴賵賶賷賸賹賺賻購賽賾賿贀贁贂贃贄贅贆贇贈贉贊贋贌贍佟佗伲伽佶佴侑侉侃侏佾佻侪佼侬侔俦俨俪俅俚俣俜俑俟俸倩偌俳倬倏
趢趤趥趦趧趨趩趪趫趬趭趮趯趰趲趶趷趹趻趽跀跁跂跅跇跈跉跊跍跐跒跓跔凇冖冢冥讠讦讧讪讴讵讷诂诃诋诏诎诒诓诔诖诘诙诜诟诠诤诨诩诮诰诳
踿蹃蹅蹆蹌蹍蹎蹏蹐蹓蹔蹕蹖蹗蹘蹚蹛蹜蹝蹞蹟蹠蹡蹢蹣蹤蹥蹧蹨蹪蹫蹮蹱邸邰郏郅邾郐郄郇郓郦郢郜郗郛郫郯郾鄄鄢鄞鄣鄱鄯鄹酃酆刍奂劢劬劭
軃軄軅軆軇軈軉車軋軌軍軏軐軑軒軓軔軕軖軗軘軙軚軛軜軝軞軟軠軡転軣軤堋堍埽埭堀堞堙塄堠塥塬墁墉墚墀馨鼙懿艹艽艿芏芊芨芄芎芑芗芙芫芸
輤輥輦輧輨輩輪輫輬輭輮輯輰輱輲輳輴輵輶輷輸輹輺輻輼輽輾輿轀轁轂轃轄荨茛荩荬荪荭荮莰荸莳莴莠莪莓莜莅荼莶莩荽莸荻莘莞莨莺莼菁萁菥菘
迉迊迋迌迍迏迒迖迗迚迠迡迣迧迬迯迱迲迴迵迶迺迻迼迾迿逇逈逌逎逓逕逘蕖蔻蓿蓼蕙蕈蕨蕤蕞蕺瞢蕃蕲蕻薤薨薇薏蕹薮薜薅薹薷薰藓藁藜藿蘧蘅
還邅邆邇邉邊邌邍邎邏邐邒邔邖邘邚邜邞邟邠邤邥邧邨邩邫邭邲邷邼邽邿郀摺撷撸撙撺擀擐擗擤擢攉攥攮弋忒甙弑卟叱叽叩叨叻吒吖吆呋呒呓呔呖
2048

这2048个字符与[0-9a-zA-Z]的任意组合保存到记事本中都会出现乱码。随便写点儿其他汉字,或者强行使用GBK编码保存文档,这个情况就会消失了。

在进阶的路上,欢迎各位大神指正。

老生常谈:为什么记事本无法单独保存“联通”二字相关推荐

  1. 记事本不能显示“联通”二字的原因

    如果你将"联通"二字在电脑的"记事本"里输入,关闭之,再打开,呵呵,变了--变成了一个方块儿!奇怪不奇怪?金小伟的博客 中提到的就是这种现象.我在这里做一个回答 ...

  2. 记事本输入“联通”俩字,关闭再打开乱码

    这是个很有意思的事情.     这里需要提一下ANSI,不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准.然后,这些编码方式没有固定的格式,但是比如说 ...

  3. 记事本保存“联通”的原理分析

    简单分析: 这是微软记事本的一个BUG,准确点就是unicode编码的问题. 只要你拿拼音输入"liantong"所对应的汉字,比如连同,连通等都会出现这个状况. 而且这个问题只在 ...

  4. 报文 wireshark_wireshark小知识:如何仅显示抓包的前100个包,并单独保存文件

    需求说明: 某项目交付现场,由于抓包文件过大,客户提出将syslog抓包的前100个报文发送给对接厂家看看: 这里涉及两个问题: 一.如何仅显示wireshark抓包里的前100个包? 二.如何将显示 ...

  5. Java黑皮书课后题第8章:**8.37(猜测首府)编写一个程序,重复提示用户输入一个州的首府。当接收到用户输入后,程序报告答案是否正确。假设50个州以及它们的首府保存在一个二维数组中,提示用户回答所

    **8.37(猜测首府)编写一个程序,重复提示用户输入一个州的首府 题目 题目描述与运行示例 破题 代码 题目 题目描述与运行示例 **8.37(猜测首府)编写一个程序,重复提示用户输入一个州的首府. ...

  6. JSK-115 单独的数字(二)【位运算】

    单独的数字(二) 一个整型数组中有一个元素只出现一次,其它元素都出现两次.求出只出现一次的元素. 要求: 线性时间复杂度,不能使用额外空间. 聪明的你能搞定吗? 格式: 第一行输入数字n,代表有n个数 ...

  7. Excel·VBA工作簿拆分所有工作表单独保存

    对Excel活动工作簿进行拆分,每个工作表单独保存为工作簿文件,文件保存在该工作簿同一文件夹下单独文件夹内 Sub 工作簿拆分所有工作表单独保存文件()'将活动工作簿wb拆分,每个ws单独保存为文件, ...

  8. 如何用vba把word文档的每页单独保存为一个word文档

    要将word文档的每页单独保存为一个word文档,首先需要能够逐页遍历word文档. 逐页遍历word文档可以使用word的定位功能. 代码如下: Sub SplitToOnePage()Const ...

  9. 如何对CAD图纸上的图形进行单独保存起来

    在CAD中打开,如何对CAD图纸上的图形进行单独保存起来呢?小伙伴们知道要怎么来进行操作吗?相信很多的小伙伴们都想要知道,那下面小编就来教教大家具体操作方法,想要了解的朋友也可以来看看,希望对你们有帮 ...

最新文章

  1. python自动化从零开始_从零开始的自动化测试框架——Python篇
  2. python获取列表的最后一个元素
  3. 我做的百度飞桨PaddleOCR .NET调用库
  4. 链表node中保存的是什么_Redis源码解析一 --链表结构
  5. Redmine性能测试
  6. django_4:数据库1——django操作数据库
  7. [转]Install Windows Server 2012 in VMware Workstation
  8. 对象可以在栈上分配空间吗?_Java面试题之:Java中所有的对象都分配在堆中吗?...
  9. Allegro各属性说明如 Clines或者Cline Segs
  10. oracle startup mount是什么意思,startup,startup mount,startup nomount之间的区别-Oracle
  11. 微信小程序开发与公众号运营有什么区别
  12. 如何学会计算机基础,学会这4点,你就能快速掌握电脑基本操作,摆脱新手的标签...
  13. 无法连接imssage信息服务器,苹果iPhone X用iMessage发短信信息总是失败解决方法
  14. Unity读取项目文件夹图片,PC端
  15. czl蒻蒟的OI之路7
  16. JavaWeb09_Cookie Session
  17. 2019-5-15-影子系统让-C++-程序无法运行
  18. 开始我的WebWork之旅
  19. 青云QingCloud推出“平步青云”创业扶持计划
  20. MVP架构开发的鼠绘漫画客户端

热门文章

  1. c语言核桃的数量--程序设计,C/C++知识点之核桃的数量(最小公倍数)
  2. 一文梳理无监督对比学习(MoCo/SimCLR/SwAV/BYOL/SimSiam)
  3. 减轻产品风险的测试设计技术
  4. 【cocos精品】正版《仙剑奇侠传》带你重温仙剑之旅
  5. LNMP编译安装及应用(理论+实验)——详细步骤说明,看完可以尝试操作
  6. 让编程像密室游戏一样有趣
  7. 小爱儿童智能陪伴机器人改变孩子对学习的看法!
  8. pycurl下有一个retriever-multi.py勉强可以用用
  9. 18_小米监控Open-Falcon:Rabbitmq监控
  10. macosx86 Broadcom NetXtreme Gigabit Ethernet 网卡