前言:最近,学习了Java IO流的相关的知识,想通过读写文件的方式练习和巩固所学知识。在使用File类创建文件时,突然想到,我该如何指定文件使用的编码呢? 进而想到,应该如何查看一个文件的编码呢?

一、问题分析

先去互联网上查找答案,结果如下:

FileInputStream fis=new FileInputStream(“xxxx.txt”);
OutputStreamWriter osw=new OutputStreamWriter(fis,“UTF-8”);

上面的代码大概意思是在写入文件时,写入的字符使用UTF-8编码,和我预想的不一样,我想在创建文件的同时指定编码。像下面这样,

File myfile = new File("test.txt”, “UTF-8”);
if (!myfile.exists()) myfile.createNewFile();

于是,我去查看Java API 8官方文档,File没有提供可以指定字符编码的构造函数。

同时也没提供set或者get等其他访问字符字符编码的方法,说明字符编码不是文件的固有属性。像文件创建时间,文件修改时间,是否可读、可写、可执行,这些都是文件的固有属性,或者说元信息,它们是文件的一部分。

二、字符编码

我们知道,计算机中存储的任何信息都是01串,文字也不例外。

对于字符的处理包括两个过程:编码和解码

编码:把字符"映射“到01串
解码:把01串"映射“到字符

不同的字符编码,例如GBK、UTF-8,编码和解码使用的规则不同。

对于同样的文本字符串:“中国”,使用UTF-8编码保存,一般使用三个字节保存一个汉字,(底层的01字符串的16进制形式)。

使用GBK编码保存,使用两个字节表示一个汉字。

当我们在文本编辑器中写好文字保存时,编辑器会根据你设置的字符编码类型将文本”映射“成01串。

你设置的字符类型,仅仅是编辑器把文字编码成成10串的转换规则而已,并不是文本的属性。

在编辑器打开文本文件时,显示的不是底层的01串,而是文字,是因为编辑器使用某种文字编码,把01串解码为字符。如果,解码时,使用的字符编码和编码时的一致或者兼容,就可以正确显示文本。如果解码时,使用的字符编码和编码时的不一致或者不兼容,就会乱码。

例如,我有一个文本文件使用的是GBK编码,内容是”明月几时有“,


我使用VS code (微软的一款非常好用的文本编辑器)打开文件,用术语说,就是解码文件。其默认使用的文字编码是UTF-8,解码相同。但是,因为我的文本底层是GBK编码的01串(两个字节一个字符),使用UTF-8解码01串,由于编码,解码不一致,必然会导致乱码。这时,只要手动选择对应的GBK编码,解码文件就不会乱码了。


乱码也从侧面说明了,字符编码不是文件的固有属性

扯了这么多,就是为了说明这一点:字符编码就是解码和编码时用的规则,不是文件的固有属性。

我不禁产生疑惑,为什么当初不把字符编码设置为文件属性的一部分呢?

假设可以设置,并且设置为GBK,那么操作系统需要维护改功能。像一个文件是不可写的,那么有程序试图写文件,操作系统会拒绝写入一样,操作系统必须写入的字节必须是满足GBK编码要求,那么每次写入字节,操作系统都需要检查该字节的合法性,这需要非常大的性能开销,甚至是无法实现的,因为有些特殊字节即可以表示GBK,也可以表示UTF-8,是有歧义的。在说,做这一些的意义是什么,为了编辑器可以在打开文件的时候,可以根据编码属性选择正确的编码吗?没有必要,智能的编辑器,可以根据内容的前几个字节,推断出你的01串使用了什么编码。另外,你也可以手动设置解码所用的字符编码。

三 、问题解决

在创建文件的时候,无法指定文件的编码。在将文字写入(例如文本编辑器的Ctrl + S 保存,本质执行的就是写入操作)文件时,可以选择将文字转换为01串的编码规则。

针对Java程序,代码如下,正是文章最开始提及的代码:

FileInputStream fis=new FileInputStream(“xxxx.txt”);
OutputStreamWriter osw=new OutputStreamWriter(fis,“UTF-8”);

Java如何在创建文件时指定编码相关推荐

  1. php指定编码创建,MYSQL创建数据库时指定编码

    mysql 创建 数据库时指定编码很重要,很多开发者都使用了默认编码,但是我使用的经验来看,制定数据库的编码可以很大程度上避免倒入导出带来的乱码问题. 我们遵循的标准是,数据库,表,字段和页面或文本的 ...

  2. mysql创建数据库指定utf 8_MySQL创建数据库时指定编码utf8mb4和添加用户

    MySQL创建数据库时指定编码utf8mb4和添加用户 CREATE DATABASE `wordpress` DEFAULT CHARACTER SET utf8 COLLATE utf8_gene ...

  3. MySQL创建数据库时指定编码和用户授权

    为什么80%的码农都做不了架构师?>>>    MySQL创建数据库时指定编码和用户授权 转载于:https://my.oschina.net/michao/blog/2989144

  4. 创建数据库时指定编码方式

    CREATE DATABASE db_name DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; CREATE DATABASE 的语法: CRE ...

  5. idea查看java文件编码_Intellij Idea编译项目下的.java文件时的编码问题

    由<编译.java文件时的编码问题>可知,在编译.java文件的时候,需要正确指定一个编码方案,该编码方案用于解码.java文件的字节流. 那么在使用Intellij Idea编译(假定使 ...

  6. Java中通过命令行启动jar包时指定编码

    场景 Java中运行jar包的命令是 java -jar badao.jar 但是在Windows中通过这种方式运行jar包的话,会因为中文乱码的问题导致 Jar包运行异常. 注: 博客: https ...

  7. Java创建文件时出现拒绝访问

    Java创建文件时出现拒绝访问 ​ 不能让盘目录直接作为保存路径,所以出现了IOxception package com.yyr.FileText;import java.io.File;public ...

  8. Java 创建文件时 创建文件夹

    问题描述 创建文件时因为没有此文件夹 报异常 解决方案: // 文件路径 String filePath = "E:\\tmp\\upload\\test.txt";File de ...

  9. python为csv文件添加表头_python读csv文件时指定行为表头或无表头的方法

    python读csv文件时指定行为表头或无表头的方法 pd.read_csv()方法中header参数,默认为0,标签为0(即第1行)的行为表头.若设置为-1,则无表头.示例如下: (1)不设置hea ...

  10. Java File.createNewFile 创建文件的四种方式小笔记

    本文为joshua317原创文章,转载请注明:转载自joshua317博客 Java File.createNewFile 创建文件的四种方式小笔记 - joshua317的博客 1.File(Str ...

最新文章

  1. Tomcat安全加固
  2. 好程序员web前端分享数组及排序、去重和随机点名
  3. application.yml如何显示成小叶子图标
  4. Swift之SwiftUI自定义star rating评分组件
  5. java操作poi如何更改excel中的数据
  6. 解决redis启动时的警告
  7. 8位可控加减法器_行测高分技巧-资料分析之有效数字加减法取舍
  8. Gensim1.0.0+ 错误'Word2Vec' object has no attribute 'vocab'
  9. 华为荣耀畅玩8c主板电路图_【awinic inside】华为双新品发布!荣耀V9 play 携手荣耀畅玩6上演“青春加速度”!...
  10. 种树(codevs 1768)
  11. 你的公司有如下的症状吗?
  12. 词性标注-隐马尔可夫模型
  13. 如何在任何设备上将您的Apple笔记导出为PDF文件?
  14. linux重启网络服务后什么端口都不通,linux的端口不通怎么解决
  15. DRUID连接池:java.sql.SQLRecoverableException: 关闭的语句
  16. 第一讲 地理信息系统概述
  17. 个人主页,引导页,导航网站源码三分钟下载安装【美观大气】
  18. dbm和db的关系与区别
  19. pow函数需要注意的问题
  20. matlab定义struck,Peter Struck

热门文章

  1. openwrt开发--驱动程序IPK包开发(GPIO控制)
  2. 软件工程 第五章:交互图
  3. SpringBoot项目配置明文密码泄露问题处理
  4. adb shell dumpsys activity top
  5. PreparedStatement类详解以及案例
  6. 大数据可视化工具-大屏展示
  7. 3d人体智能测试软件,三维人体解剖软件(3dbody)
  8. 如何备份光猫html文件夹,华为光猫备份jffs2及HG8321R-RMS切换HG8321版本教程
  9. 整流七 - 三相PWM整流器—公式推导篇
  10. ubuntu20.04【一键脚本安装wps并配置字体】