Java性能优化(10):谨慎改写clone

释放双眼，带上耳机，听听看~！

Cloneable接口的目的是作为对象的一个mixin接口，表明这样的对象允许克隆。不幸的是，它并没有成功达到这个目的。其主要的缺陷在于它缺少一个clone方法，Object的clone方法是被保护的，如果不借助于反射机制，则不能仅仅因为一个对象实现了Cloneable，就可以调用clone方法。即使在反射调用也可能会失败，因为并不保证该对象一定具有可访问性的clone方法。尽管存在这样那样的不足，这项设施仍然被广泛地使用着，值得我们进一步了解它。接下来，将告诉你如何实现一个行为良好的clone方法，并讨论何时这样做是恰当的，同时也简单地讨论了其他可替换做法。
那么，既然Cloneable并没有包含任何方法，它的作用又是什么？它决定了Object的clone方法返回该对象的逐域拷贝，否则的话，它抛出一个CloneNotSupportedException异常。这是接口的一种极端非典型的用法，它不值得仿效。通常情况下，实现一个接口是为了表明一个类可以为客户做某些事情。然而，对于Cloneable接口，它改变了超类中一个受保护的方法的行为。

为了实现Cloneable接口，使它对一个类确实产生效果，它和所有的超类都必须遵守一个相当复杂的、不可实施的，并且基本没有文档说明的协议。由此得到一种语言本身之外的机制:无须调用构造函数就可以创建一个对象。

Clone方法的通用约定是非常弱的:下面是来自java.lang.Object规范中的约定内容：
创建好返回对象的一个拷贝，这里”拷贝”的精确含义取决于该对象的类。一般大含义是，对于任何对象x，表达式

将会是true，并且，表达式

将会是true，但是，这些都不是绝对的要求。虽然，通常情况下，表达式

将会是true，但是，这也不是一个绝对要求。拷贝一个对象往往会导致创建该类的一个新实例，但同时它也会要求拷贝内部的数据结构。这个过程中没有调用构造函数。

这个约定存在几个问题，规定”没有调用构造函数”太强了。一个行为良好的clone方法可以调用构造函数来创建对象，构造之后再复制内部数据。如果这个类是final的，则clone甚至可能会返回一个构造函数创建的对象。

然而，规定”x.clone().getClass()通常应该等同于x.getClass()”则弱爆了。在实践中，程序员会假设:如果他们扩展了一个类，并且从子类中调用了super.clone，则返回的对象将是该子类的实例。超类能够提供这种功能的唯一途径是，返回一个通过调用super.clone而得到的对象。如果一个clone方法返回一个由构造函数创建的对象，它将具有错误的类。因此，**如果你改写了一个非final类的clone方法，则应该返回一个通过调用super.clone而得到的对象。**如果一个类的所有超类都遵守这条规则，那么一直调用super.clone，最终会调用到Object的clone方法，从而创建出正确类的实例。这种机制大致上类似于自动的构造函数链，只不过它不是强制要求的。

Cloneable接口并没有清楚地指明，一个类在实现这个接口时应该承担哪些责任。规范仅仅指出了:实现这个接口会以哪些方式影响到Object的clone实现的行为。**实际上，对于实现了Cloneable的类，我们总是期望它也提供了一个功能适当的公有clone方法。**但通常情况下，除非该类的所有超类都提供了一个行为良好的clone实现，不管是公有的，还是受保护的，否则，这是不可能的。

假设你希望在一个类中实现Cloneable，并且它的超类都提供了良好的clone方法。你从super.clone()中得到的对象可能会接近于最终要返回的对象，也可能相差甚远，这要取决于这个类的本质。从每一个超类的角度来看，这个对象是原始对象功能完整的克隆。在这个类中声明的域等同于被克隆对象中相应的域值。如果每个域包含一个原语类型的值，或者包含一个指向非可变对象的引用，那么被返回的对象可能正是你所需要的对象，在这种情况下不需要再做进一步处理。例如，PhoneNumber类正是这样的情形。在这种情况下，你所需要的是Object中受保护的clone方法提供一条公有的访问途径。

然后，如果对象中包含的域引用了可变的对象，那么使用这样的clone实现可能会导致灾难性后果。例如stack类

假设你希望把这个类做成可克隆的。如果它的clone方法仅仅返回super.clone()，那么这样的Stack实例，在其size域中具有正确的值，但是它的elements域将引用到与原始Stack实例中相同的数组上。修改原始的实例会破坏被克隆对象中的数组，反之亦然。很快你会发现，这个程序将产生毫无意义的结果，或者抛出NullPointerException异常。

如果调用Stack类唯一的构造函数，那么这种情况永远都不会发生。**实际上，clone方法是另一个构造函数；你必须确保它不会伤害到原始的对象，并且正确地建立起被克隆对象中的约束关系。**为了使Stack类中的clone方法正常的工作，它必须拷贝栈的内部信息。最容易的做法是，对于elements数组递归地调用clone:

注意，如果elements域是final的，则这种方案并不能正常工作，因为clone方法是被禁止给elements域赋一个新值的。这是一个基本问题:clone结构与指向可变对象的final域的正常用法是不兼容的。除非在原始对象和克隆对象之间可以安全地共享此可变对象。为了使一个类成为可克隆的，可能有必要从某些城市中去掉final修饰符。

递归调用clone往往还不够。假如，假设你正在为一个散列表编写clone方法，它的内部数据是由一个散列桶数组组成，每一个散列桶都指向”键-值”对链表的第一个条目，如果桶是空的，则为null。出于性能的考虑，该类实现了它自己的单向链表，而没有使用Java内部的java.util.LinkedList。该类如下:

假设你仅仅递归地克隆这个散列桶数组，就像我们为Stack类所做的那样

虽然被克隆的对象有它自己的桶数组，但是，这个数组引用的链表与原始对象是一样的，从而很容易引起克隆对象和原始对象之中的不确定行为。为了修正这个问题，你必须为每一个组成桶的链表单独地拷贝。下面是一种常见的做法:

私有类HashTable.Entry被加强了，它支持了一个”深度拷贝”方法。HashTable上的clone方法分配了一个适当大小的、新的buckets数组，并且遍历原始的bucket数组，对每一个非空散列桶进行深度拷贝。Entry类中的深度拷贝方法递归调用它自己，以便拷贝整个链表。虽然这项技术手法很漂亮，并且，如果散列桶不是很长的haunted，也会工作得很好，但是，这样克隆一个链表并不是一个好的方案，因给针对链表中的每个元素，它都要消耗一段栈空间。如果链表比较长的话，这将很容易导致栈溢出。为了避免发生这种情况，你可以在deepCopy中迭代代替递归:

克隆复杂对象的最后一个办法是，先调用super.clone,然后把结果对象中的所有域都设置到它们的空白状态，然后调用高层的方法来重新产生对象的状态。在我们的HashTable例子中，buckets域将被初始化为一个新的散列桶数组，然后，对于正在被克隆的散列表中的每一个键值对，都调用put(key,value)方法。这种做法往往会产生一个简单的、合理的、优美的clone方法，但是它允许起来没有”直接操作对象和其克隆的内部状态的clone方法”快。

如同构造函数一样，clone方法不应该在构造过程中，调用新对象中任何非final方法。如果clone调用了一个被该写过的方法，那么在该方法所在的子类都有机会修正新对象中的状态之前，该方法就会被执行，这样很有可能会导致克隆对象和原始对象之间的不一致。因此，上一段落中讨论的put(key,value)方法应该要么是final，要么是私有的。

Object的clone方法被声明为可抛出CloneNotSupportedException异常，但是改写版本的Clone方法可能会忽略这个声明。final类的clone方法应该省略这个声明，因为不会抛出被检查异常的方法会比抛出异常的方法用起来更舒服。如果一个可扩展的类改写了clone方法，那么改写版本的clone方法应该包含”抛出CloneNotSupportedException异常”，这样做可以使子类通过提供下面的clone方法，选择温和地放弃克隆能力:

遵守前面的建议并不是必需的，因为如果一个子类不希望它的实例被克隆，并且它改写的clone方法没有被声明为可抛出CloneNotSupportedException异常，那么它的clone方法总是可以抛出一个未被检查的异常。然而，通常的实践表明，在这样情况下，CloneNotSupportedException是正确的异常。

简而言之，所有实现了Cloneable接口的类都应该用一个公有的方法改写clone。此公有方法首先调用super.clone，然后修正任何都需要修正的域。通常情况下，这意味着要拷贝任何包含内部“深层结构”的可变对象，并且用指向新对象的引用代替原来指向这些对象的引用。虽然，这些内部拷贝操作往往可以通过递归地调用clone来完成，但这通常并不是最佳方法。如果该类只包含原语类型的域，或者指向非可变对象的引用，那么多半情况是没有域需要修正。这条规则也有例外，譬如，代表序列号或其他唯一ID值的域，或者代表对象的创建时间的域，尽管这些域是原语类型或者是非可变的，但它们也需要被修正。

**最好的做法是，提供某些其他的途径来代替对象拷贝，或者干脆不提供这样的能力。**例如，对于非可变类，支持对象拷贝并没有太大的意义，因为拷贝的对象与原始对象并没有实质的不同。

另一个实现对象拷贝的好办法是提供一个拷贝构造函数。所谓拷贝构造函数，它也是一个构造函数，其唯一的参数的类型是包含该构造函数的类，例如，

另一种方法是它的一个微小的变形:提供一个静态工厂来代替够着函数：

拷贝构造函数的做法，以及它的静态工厂方法变形，比Cloneable/clone方法具有更多的优势：它们不依赖于某一种很有风险的、语言之外的对象创建机制；它们不要求遵守尚未良好文档化的规范；它们不会与final域的正常使用发生冲突；它们不会要求可不捕获不必要的被检查异常；它们为客户提供了一个静态类型化的对象。虽然你不可能把一个拷贝构造函数或者静态工厂放到一个接口中，但是由于Cloneable接口缺少一个公有的clone方法，所以它也没有提供一个接口该有的功能。因此使用拷贝构造函数来代替clone方法，并没有放弃接口的功能特性。

跟进一步，一个拷贝构造函数可以带一个参数，它的类型可以是该类实现的一个适当的接口。按照惯例，所哟通用集合实现都提供了一个拷贝构造函数，它的参数类型是Collection或者map。基于接口的拷贝构造函数允许客户来选择拷贝动作的具体实现，而不是强迫客户接受原始的实现。假设你有一个LinkeList，并且希望把它拷贝成一个ArrayList。clone方法并没有提供这样的功能，但是用拷贝构造函数很容易实现:new ArrayList。

既然Cloneable具有以上那么多问题，所以，可以安全地说，其他接口不应该扩展这个接口，并且为了继承而设计的类也不应该实现这个接口。由于它具有这么多缺点，有些资深程序员从来不去改写clone方法，也从来不去调用它，除非是为了低开销地拷贝一个数组。对于一个专门为了继承而设计的类，如果你未能提供一个行为良好的protected类型的clone方法，那么它的子类要想实现Cloneable接口是不可能的。

{{userData.name}}已认证

Java性能优化(10):谨慎改写clone

Bootstrap 间隔 (Spacing)

从零搭建自己的SpringBoot后台框架(二十三)

{{userData.name}}已认证

Related posts:

Bootstrap 间隔 (Spacing)

从零搭建自己的SpringBoot后台框架(二十三)

Java性能优化

SSM-Spring-01：Spring的概念+入门案例

[易学易懂系列|rustlang语言|零基础|快速入门|（19）|多线程]

使用Rust开发操作系统(Canonical地址以及虚拟地址和物理地址操作)