字符流和字节流有什么那区别

编程语言及工具

105人已加入

描述

  在Java中,根据处理的数据单位不同,分为字节流和字符流。

  字符流是由字符组成的,例如 FileReader、FileWriter、BufferedReader、BufferedWriter、InputStreamReader、OutputStreamWriter 等。

  IT专业名词,不包含边界数据的连续流。

  字节流是由字节组成的,字符流是由字符组成的。 Java里字符由两个字节组成。字节流是最基本的,所有的InputStream和OutputStream的子类都是,主要用在处理二进制数据,它是按字节来处理的但实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理,也就是要进行字符集的转化。在从字节流转化为字符流时,实际上就是byte[]转化为String时,public String(byte bytes, String charsetName)有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统默认的long

  流式传输主要指将整个音频和视频及三维媒体等多媒体文件经过特定的压缩方式解析成一个个压缩包,由视频服务器向用户计算机顺序或实时传送。在采用流式传输方式的系统中,用户不必像采用下载方式那样等到整个文件全部下载完毕,而是只需经过几秒或几十秒的启动延时即可在用户的计算机上利用解压设备对压缩的A/V、3D等多媒体文件解压后进行播放和观看。此时多媒体文件的剩余部分将在后台的服务器内继续下载。

  字符流与字节流的区别

  1. 什么是流

  Java中的流是对字节序列的抽象,我们可以想象有一个水管,只不过现在流动在水管中的不再是水,而是字节序列。和水流一样,Java中的流也具有一个“流动的方向”,通常可以从中读入一个字节序列的对象被称为输入流;能够向其写入一个字节序列的对象被称为输出流。

  2. 字节流

  Java中的字节流处理的最基本单位为单个字节,它通常用来处理二进制数据。Java中最基本的两个字节流类是InputStream和OutputStream,它们分别代表了组基本的输入字节流和输出字节流。InputStream类与OutputStream类均为抽象类,我们在实际使用中通常使用Java类库中提供的它们的一系列子类。下面我们以InputStream类为例,来介绍下Java中的字节流。

  InputStream类中定义了一个基本的用于从字节流中读取字节的方法read,这个方法的定义如下:

  public abstract int read() throws IOException;

  这是一个抽象方法,也就是说任何派生自InputStream的输入字节流类都需要实现这一方法,这一方法的功能是从字节流中读取一个字节,若到了末尾则返回-1,否则返回读入的字节。关于这个方法我们需要注意的是,它会一直阻塞知道返回一个读取到的字节或是-1。另外,字节流在默认情况下是不支持缓存的,这意味着每调用一次read方法都会请求操作系统来读取一个字节,这往往会伴随着一次磁盘IO,因此效率会比较低。有的小伙伴可能认为InputStream类中read的以字节数组为参数的重载方法,能够一次读入多个字节而不用频繁的进行磁盘IO。那么究竟是不是这样呢?我们来看一下这个方法的源码:

  public int read(byte b[]) throws IOException {

  return read(b, 0, b.length);

  }

  public int read(byte b[], int off, int len) throws IOException {

  if (b == null) {

  throw new NullPointerException();

  } else if (off 《 0 || len 《 0 || len 》 b.length - off) {

  throw new IndexOutOfBoundsException();

  } else if (len == 0) {

  return 0;

  }

  int c = read();

  if (c == -1) {

  return -1;

  }

  b[off] = (byte)c;

  int i = 1;

  try {

  for (; i 《 len ; i++) {

  c = read();

  if (c == -1) {

  break;

  }

  b[off + i] = (byte)c;

  }

  } catch (IOException ee) {

  }

  return i;

  }

  从以上的代码我们可以看到,实际上read(byte[])方法内部也是通过循环调用read()方法来实现“一次”读入一个字节数组的,因此本质来说这个方法也未使用内存缓冲区。要使用内存缓冲区以提高读取的效率,我们应该使用BufferedInputStream。

  3. 字符流

  Java中的字符流处理的最基本的单元是Unicode码元(大小2字节),它通常用来处理文本数据。所谓Unicode码元,也就是一个Unicode代码单元,范围是0x0000~0xFFFF。在以上范围内的每个数字都与一个字符相对应,Java中的String类型默认就把字符以Unicode规则编码而后存储在内存中。然而与存储在内存中不同,存储在磁盘上的数据通常有着各种各样的编码方式。使用不同的编码方式,相同的字符会有不同的二进制表示。实际上字符流是这样工作的:

  输出字符流:把要写入文件的字符序列(实际上是Unicode码元序列)转为指定编码方式下的字节序列,然后再写入到文件中;

  输入字符流:把要读取的字节序列按指定编码方式解码为相应字符序列(实际上是Unicode码元序列从)从而可以存在内存中。

  我们通过一个demo来加深对这一过程的理解,示例代码如下:

  import java.io.FileWriter;

  import java.io.IOException;

  public class FileWriterDemo {

  public static void main(String[] args) {

  FileWriter fileWriter = null;

  try {

  try {

  fileWriter = new FileWriter(“demo.txt”);

  fileWriter.write(“demo”);

  } finally {

  fileWriter.close();

  }

  } catch (IOException e) {

  e.printStackTrace();

  }

  }

  }

  以上代码中,我们使用FileWriter向demo.txt中写入了“demo”这四个字符,我们用十六进制编辑器WinHex查看下demo.txt的内容:

  JAVA

  从上图可以看出,我们写入的“demo”被编码为了“64 65 6D 6F”,但是我们并没有在上面的代码中显式指定编码方式,实际上,在我们没有指定时使用的是操作系统的默认字符编码方式来对我们要写入的字符进行编码。

  由于字符流在输出前实际上是要完成Unicode码元序列到相应编码方式的字节序列的转换,所以它会使用内存缓冲区来存放转换后得到的字节序列,等待都转换完毕再一同写入磁盘文件中。

  4. 字符流与字节流的区别

  经过以上的描述,我们可以知道字节流与字符流之间主要的区别体现在以下几个方面:

  字节流操作的基本单元为字节;字符流操作的基本单元为Unicode码元。

  字节流默认不使用缓冲区;字符流使用缓冲区。

  字节流通常用于处理二进制数据,实际上它可以处理任意类型的数据,但它不支持直接写入或读取Unicode码元;字符流通常处理文本数据,它支持写入及读取Unicode码元。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分