Java字符串

本文大部分内容转自:深入理解Java String类型

String的不可变性

String类部分代码如下:

1
2
3
4
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];

可以看到String类被final关键字修饰,表明String类不可以被继承。同时存储数据的char数组也被final关键字修饰,表示String的值不可以修改。

为什么 Java 要这样设计?

  • 保证 String 对象安全性,避免 String 被篡改。

  • 保证 hash 值不会频繁变更

  • 可以实现字符串常量池。通常有两种创建字符串对象的方式,一种是通过字符串常量的方式创建,如 String str="abc"; 另一种是字符串变量通过 new 形式的创建,如 String str = new String("abc")

    • 使用第一种方式创建字符串对象时,JVM 首先会检查该对象是否在字符串常量池中,如果在,就返回该对象引用,否则新的字符串将在常量池中被创建。这种方式可以减少同一个值的字符串对象的重复创建,节约内存。

    • String str = new String("abc") 这种方式,首先在编译类文件时,"abc" 常量字符串将会放入到常量结构中,在类加载时,"abc" 将会在常量池中创建;其次,在调用 new 时,JVM 命令将会调用 String 的构造函数,同时引用常量池中的 "abc" 字符串,在堆内存中创建一个 String 对象;最后,str 将引用 String 对象。

String的性能考量

字符串拼接

  1. 字符串常量拼接,编译器会将其优化成一个常量字符串。

    1
    2
    3
    4
    5
    6
    public static void main(String[] args) {
    // 本行代码在 class 文件中,会被编译器直接优化为:
    // String str = "abc";
    String str = "a" + "b" + "c";
    System.out.println("str = " + str);
    }
  2. 字符串变量的拼接,编译器会优化成StringBuilder的方式。

    1
    2
    3
    4
    5
    6
    7
    8
    public static void main(String[] args) {
    String str = "";
    for(int i=0; i<1000; i++) {
    // 本行代码会被编译器优化为:
    // str = (new StringBuilder(String.valueOf(str))).append(i).toString();
    str = str + i;
    }
    }

    但是,每次循环都会生成一个新的 StringBuilder 实例,同样也会降低系统的性能。

    字符串拼接的正确方案:

    • 如果需要使用字符串拼接,应该优先考虑 StringBuilderappend 方法替代使用 +
    • 如果在并发编程中,String 对象的拼接涉及到线程安全,可以使用 StringBuffer。但是要注意,由于 StringBuffer 是线程安全的,涉及到锁竞争,所以从性能上来说,要比 StringBuilder 差一些。

字符串分割

Stringsplit() 方法使用正则表达式实现其强大的分割功能。而正则表达式的性能是非常不稳定的,使用不恰当会引起回溯问题,很可能导致 CPU 居高不下。

所以,应该慎重使用 split() 方法,可以考虑用 String.indexOf() 方法代替 split() 方法完成字符串的分割。如果实在无法满足需求,你就在使用 Split() 方法时,对回溯问题加以重视就可以了。

String.intern

在每次赋值的时候使用 Stringintern 方法,如果常量池中有相同值,就会重复使用该对象,返回对象引用,这样一开始的对象就可以被回收掉

在字符串常量中,默认会将对象放入常量池;在字符串变量中,对象是会创建在堆内存中,同时也会在常量池中创建一个字符串对象,复制到堆内存对象中,并返回堆内存对象引用。

如果调用 intern 方法,会去查看字符串常量池中是否有等于该对象的字符串,如果没有,就在常量池中新增该对象,并返回该对象引用;如果有,就返回常量池中的字符串引用。堆内存中原有的对象由于没有引用指向它,将会通过垃圾回收器回收。

注: 使用 intern 方法需要注意:一定要结合实际场景。因为常量池的实现是类似于一个 HashTable 的实现方式,HashTable 存储的数据越大,遍历的时间复杂度就会增加。如果数据过大,会增加整个字符串常量池的负担。

String、StringBuffer和StringBuilder的对比

  1. 三者都是final类,都不允许被继承;
  2. String类长度是不可变的,StringBuffer和StringBuilder类长度是可以改变的;
  3. StringBuffer类是线程安全的,StringBuilder不是线程安全的;
  4. String是不可变的对象,因此每次在对String类进行改变的时候都会生成一个新的string对象,然后将指针指向新的string对象,所以经常要改变字符串长度的话不要使用string,因为每次生成对象都会对系统性能产生影响,特别是当内存中引用的对象多了以后,JVM的GC就会开始工作,性能就会降低;

三者的使用策略,可总结为:

  1. 如果要操作少量的数据,用String ;单线程操作大量数据,用StringBuilder ;多线程操作大量数据,用StringBuffer
  2. 不要使用String类的”+”来进行频繁的拼接,因为那样的性能极差的,应该使用StringBuffer或StringBuilder类,这在Java的优化上是一条比较重要的原则。
  3. StringBuilder一般使用在方法内部来完成类似”+”功能,因为是线程不安全的,所以用完以后可以丢弃。StringBuffer主要用在全局变量中。
  4. 相同情况下使用 StirngBuilder 相比使用 StringBuffer 仅能获得 10%~15% 左右的性能提升,但却要冒多线程不安全的风险。而在现实的模块化编程中,负责某一模块的程序员不一定能清晰地判断该模块是否会放入多线程的环境中运行,因此:除非确定系统的瓶颈是在 StringBuffer上,并且确定你的模块不会运行在多线程模式下,才可以采用StringBuilder;否则还是用StringBuffer。
打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2021-2022 Yin Peng
  • 引擎: Hexo   |  主题:修改自 Ayer
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信