Java 知识梳理(二)—— 算法与编程
Java 算法编程。java 排序算法,经典问题算法,单例模式
编写一个程序,将 a.txt 文件中的单词与 b.txt 文件中的单词交替合并到 c.txt 文件中,a.txt 文件中的单词用回车符分隔,b.txt 文件中用回车或空格进行分隔。
答:
import java.io.File; |
编写一个程序,将 d:\java 目录下的所有.java 文件复制到 d:\jad 目录下,并将原来文件的扩展名从.java 改为.jad。
(大家正在做上面这道题,网上迟到的朋友也请做做这道题,找工作必须能编写这些简单问题的代码!)
答:listFiles 方法接受一个 FileFilter 对象,这个 FileFilter 对象就是过虑的策略对象,不同的人提供不同的 FileFilter 实现,即提供了不同的过滤策略。
import java.io.File; |
由本题总结的思想及策略模式的解析:
import java.io.File; |
编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串,但要保证汉字不被截取半个,如 “我 ABC”,4,应该截取 “我 AB”,输入 “我 ABC 汉 DEF”,6,应该输出 “我 ABC”,而不是 “我 ABC + 汉的半个”。
答:
首先要了解中文字符有多种编码及各种编码的特征。
假设 n 为要截取的字节数。
public class TrimGBK { |
有一个字符串,其中包含中文字符、英文字符和数字字符,请统计和打印出各个字符的个数。
答:如果一串字符如”aaaabbc 中国 1512” 要分别统计英文字符的数量,中文字符的数量,和数字字符的数量,假设字符中没有中文字符、英文字符、数字字符之外的其他特殊字符。
public class CountABC { |
说明生活中遇到的二叉树,用 java 实现二叉树
这是组合设计模式。
我有很多个 (假设 10 万个) 数据要保存起来,以后还需要从保存的这些数据中检索是否存在某个数据,(我想说出二叉树的好处,该怎么说呢?那就是说别人的缺点),假如存在数组中,那么,碰巧要找的数字位于 99999 那个地方,那查找的速度将很慢,因为要从第 1 个依次往后取,取出来后进行比较。平衡二叉树(构建平衡二叉树需要先排序,我们这里就不作考虑了)可以很好地解决这个问题,但二叉树的遍历(前序,中序,后序)效率要比数组低很多。
代码如下:
public class Node { |
从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数,并按重复次数排序:
1, 张三,28 2, 李四,35 3, 张三,28 4, 王五,35 5, 张三,28 6, 李四,35 7, 赵六,28 8, 田七,35
程序代码如下:
/* |
单实例 Singleton 设计模式
单实例 Singleton 设计模式可能是被讨论和使用的最广泛的一个设计模式了,这可能也是面试中问得最多的一个设计模式了。这个设计模式主要目的是想在整个系统中只能出现一个类的实例。这样做当然是有必然的,比如你的软件的全局配置信息,或者是一个 Factory,或是一个主控类,等等。你希望这个类在整个系统中只能出现一个实例。当然,作为一个技术负责人的你,你当然有权利通过使用非技术的手段来达到你的目的。比如:你在团队内部明文规定,“XX 类只能有一个全局实例,如果某人使用两次以上,那么该人将被处于 2000 元的罚款!”(呵呵),你当然有权这么做。但是如果你的设计的是东西是一个类库,或是一个需要提供给用户使用的 API,恐怕你的这项规定将会失效。因为,你无权要求别人会那么做。所以,这就是为什么,我们希望通过使用技术的手段来达成这样一个目的的原因。
本文会带着你深入整个 Singleton 的世界,当然,我会放弃使用 C++ 语言而改用 Java 语言,因为使用 Java 这个语言可能更容易让我说明一些事情。
Singleton 的教学版本
这里,我将直接给出一个 Singleton 的简单实现,因为我相信你已经有这方面的一些基础了。我们姑且把这个版本叫做 1.0 版
// version 1.0 |
在上面的实例中,我想说明下面几个 Singleton 的特点:(下面这些东西可能是尽人皆知的,没有什么新鲜的)
- 私有(private)的构造函数,表明这个类是不可能形成实例了。这主要是怕这个类会有多个实例。
- 即然这个类是不可能形成实例,那么,我们需要一个静态的方式让其形成实例:getInstance ()。注意这个方法是在 new 自己,因为其可以访问私有的构造函数,所以他是可以保证实例被创建出来的。
- 在 getInstance () 中,先做判断是否已形成实例,如果已形成则直接返回,否则创建实例。
- 所形成的实例保存在自己类中的私有成员中。
- 我们取实例时,只需要使用 Singleton.getInstance () 就行了。
当然,如果你觉得知道了上面这些事情后就学成了,那得给你当头棒喝一下了,事情远远没有那么简单。
Singleton 的实际版本
上面的这个程序存在比较严重的问题,因为是全局性的实例,所以,在多线程情况下,所有的全局共享的东西都会变得非常的危险,这个也一样,在多线程情况下,如果多个线程同时调用 getInstance () 的话,那么,可能会有多个进程同时通过 (singleton== null) 的条件检查,于是,多个实例就创建出来,并且很可能造成内存泄露问题。嗯,熟悉多线程的你一定会说 ——“我们需要线程互斥或同步”,没错,我们需要这个事情,于是我们的 Singleton 升级成 1.1 版,如下所示:
// version 1.1 |
嗯,使用了 Java 的 synchronized 方法,看起来不错哦。应该没有问题了吧?!错!这还是有问题!为什么呢?前面已经说过,如果有多个线程同时通过 (singleton== null) 的条件检查(因为他们并行运行),虽然我们的 synchronized 方法会帮助我们同步所有的线程,让我们并行线程变成串行的一个一个去 new,那不还是一样的吗?同样会出现很多实例。嗯,确实如此!看来,还得把那个判断 (singleton== null) 条件也同步起来。于是,我们的 Singleton 再次升级成 1.2 版本,如下所示:
// version 1.2 |
不错不错,看似很不错了。在多线程下应该没有什么问题了,不是吗?的确是这样的,1.2 版的 Singleton 在多线程下的确没有问题了,因为我们同步了所有的线程。只不过嘛……,什么?!还不行?!是的,还是有点小问题,我们本来只是想让 new 这个操作并行就可以了,现在,只要是进入 getInstance () 的线程都得同步啊,注意,创建对象的动作只有一次,后面的动作全是读取那个成员变量,这些读取的动作不需要线程同步啊。这样的作法感觉非常极端啊,为了一个初始化的创建动作,居然让我们达上了所有的读操作,严重影响后续的性能啊!
还得改!嗯,看来,在线程同步前还得加一个 (singleton== null) 的条件判断,如果对象已经创建了,那么就不需要线程的同步了。OK,下面是 1.3 版的 Singleton。
// version 1.3 |
感觉代码开始变得有点罗嗦和复杂了,不过,这可能是最不错的一个版本了,这个版本又叫 “双重检查” Double-Check。下面是说明:
- 第一个条件是说,如果实例创建了,那就不需要同步了,直接返回就好了。
- 不然,我们就开始同步线程。
- 第二个条件是说,如果被同步的线程中,有一个线程创建了对象,那么别的线程就不用再创建了。
相当不错啊,干得非常漂亮!请大家为我们的 1.3 版起立鼓掌!
但是,如果你认为这个版本大攻告成,你就错了。
主要在于 **singleton = new Singleton ()** 这句,这并非是一个原子操作,事实上在 JVM 中这句话大概做了下面 3 件事情。
- 给 singleton 分配内存
- 调用 Singleton 的构造函数来初始化成员变量,形成实例
- 将 singleton 对象指向分配的内存空间(执行完这步 singleton 才是非 null 了)
但是在 JVM 的即时编译器中存在指令重排序的优化。也就是说上面的第二步和第三步的顺序是不能保证的,最终的执行顺序可能是 1-2-3 也可能是 1-3-2。如果是后者,则在 3 执行完毕、2 未执行之前,被线程二抢占了,这时 instance 已经是非 null 了(但却没有初始化),所以线程二会直接返回 instance,然后使用,然后顺理成章地报错。
对此,我们只需要把 singleton 声明成 volatile 就可以了。下面是 1.4 版:
// version 1.4 |
使用 volatile 有两个功用:
1)这个变量不会在多个线程中存在复本,直接从内存读取。
2)这个关键字会禁止指令重排序优化。也就是说,在 volatile 变量的赋值操作后面会有一个内存屏障(生成的汇编代码上),读操作不会被重排序到内存屏障之前。
但是,这个事情仅在 Java 1.5 版后有用,1.5 版之前用这个变量也有问题,因为老版本的 Java 的内存模型是有缺陷的。
Singleton 的简化版本
上面的玩法实在是太复杂了,一点也不优雅,下面是一种更为优雅的方式:
这种方法非常简单,因为单例的实例被声明成 static 和 final 变量了,在第一次加载类到内存中时就会初始化,所以创建实例本身是线程安全的。
// version 1.5 |
但是,这种玩法的最大问题是 —— 当这个类被加载的时候,new Singleton () 这句话就会被执行,就算是 getInstance () 没有被调用,类也被初始化了。
于是,这个可能会与我们想要的行为不一样,比如,我的类的构造函数中,有一些事可能需要依赖于别的类干的一些事(比如某个配置文件,或是某个被其它类创建的资源),我们希望他能在我第一次 getInstance () 时才被真正的创建。这样,我们可以控制真正的类创建的时刻,而不是把类的创建委托给了类装载器。
好吧,我们还得绕一下:
下面的这个 1.6 版是老版《Effective Java》中推荐的方式。
// version 1.6 |
上面这种方式,仍然使用 JVM 本身机制保证了线程安全问题;由于 SingletonHolder 是私有的,除了 getInstance () 之外没有办法访问它,因此它只有在 getInstance () 被调用时才会真正创建;同时读取实例的时候不会进行同步,没有性能缺陷;也不依赖 JDK 版本。
Singleton 优雅版本
public enum Singleton{ |
居然用枚举!!看上去好牛逼,通过 EasySingleton.INSTANCE 来访问,这比调用 getInstance () 方法简单多了。
默认枚举实例的创建是线程安全的,所以不需要担心线程安全的问题。但是在枚举中的其他任何方法的线程安全由程序员自己负责。还有防止上面的通过反射机制调用私用构造器。
这个版本基本上消除了绝大多数的问题。代码也非常简单,实在无法不用。这也是新版的《Effective Java》中推荐的模式。
Singleton 的其它问题
怎么?还有问题?!当然还有,请记住下面这条规则 ——“无论你的代码写得有多好,其只能在特定的范围内工作,超出这个范围就要出 Bug 了”,这是 “陈式第一定理”,呵呵。你能想一想还有什么情况会让这个我们上面的代码出问题吗?
在 C++ 下,我不是很好举例,但是在 Java 的环境下,嘿嘿,还是让我们来看看下面的一些反例和一些别的事情的讨论(当然,有些反例可能属于钻牛角尖,可能有点学院派,不过也不排除其实际可能性,就算是提个醒吧):
- Class Loader。不知道你对 Java 的 Class Loader 熟悉吗?“类装载器”?!C++ 可没有这个东西啊。这是 Java 动态性的核心。顾名思义,类装载器是用来把类 (class) 装载进 JVM 的。JVM 规范定义了两种类型的类装载器:启动内装载器 (bootstrap) 和用户自定义装载器 (user-defined class loader)。 在一个 JVM 中可能存在多个 ClassLoader,每个 ClassLoader 拥有自己的 NameSpace。一个 ClassLoader 只能拥有一个 class 对象类型的实例,但是不同的 ClassLoader 可能拥有相同的 class 对象实例,这时可能产生致命的问题。如 ClassLoaderA,装载了类 A 的类型实例 A1,而 ClassLoaderB,也装载了类 A 的对象实例 A2。逻辑上讲 A1=A2,但是由于 A1 和 A2 来自于不同的 ClassLoader,它们实际上是完全不同的,如果 A 中定义了一个静态变量 c,则 c 在不同的 ClassLoader 中的值是不同的。
于是,如果咱们的 Singleton 1.3 版本如果面对着多个 Class Loader 会怎么样?呵呵,多个实例同样会被多个 Class Loader 创建出来,当然,这个有点牵强,不过他确实存在。难道我们还要整出个 1.4 版吗?可是,我们怎么可能在我的 Singleton 类中操作 Class Loader 啊?是的,你根本不可能。在这种情况下,你能做的只有是 ——“保证多个 Class Loader 不会装载同一个 Singleton”。
- 序例化。如果我们的这个 Singleton 类是一个关于我们程序配置信息的类。我们需要它有序列化的功能,那么,当反序列化的时候,我们将无法控制别人不多次反序列化。不过,我们可以利用一下 Serializable 接口的 readResolve () 方法,比如:
public class Singleton implements Serializable |
- 多个 Java 虚拟机。如果我们的程序运行在多个 Java 的虚拟机中。什么?多个虚拟机?这是一种什么样的情况啊。嗯,这种情况是有点极端,不过还是可能出现,比如 EJB 或 RMI 之流的东西。要在这种环境下避免多实例,看来只能通过良好的设计或非技术来解决了。
- volatile 变量。关于 volatile 这个关键字所声明的变量可以被看作是一种 “程度较轻的同步 synchronized”;与 synchronized 块相比,volatile 变量所需的编码较少,并且运行时开销也较少,但是它所能实现的功能也仅是 synchronized 的一部分。当然,如前面所述,我们需要的 Singleton 只是在创建的时候线程同步,而后面的读取则不需要同步。所以,volatile 变量并不能帮助我们即能解决问题,又有好的性能。而且,这种变量只能在 JDK 1.5 + 版后才能使用。
- 关于继承。是的,继承于 Singleton 后的子类也有可能造成多实例的问题。不过,因为我们早把 Singleton 的构造函数声明成了私有的,所以也就杜绝了继承这种事情。
- 关于代码重用。也话我们的系统中有很多个类需要用到这个模式,如果我们在每一个类都中有这样的代码,那么就显得有点傻了。那么,我们是否可以使用一种方法,把这具模式抽象出去?在 C++ 下这是很容易的,因为有模板和友元,还支持栈上分配内存,所以比较容易一些(程序如下所示),Java 下可能比较复杂一些,聪明的你知道怎么做吗?
template class Singleton |
递归算法题 1
一个整数,大于 0,不用循环和本地变量,按照 n,2n,4n,8n 的顺序递增,当值大于 5000 时,把值按照指定顺序输出来。
例:n=1237
则输出为:
1237,2474,4948,9896,9896,4948,2474,1237,
提示:写程序时,先致谢按递增方式的代码,写好递增的以后,再增加考虑递减部分。
public static void doubleNum(int n){ |
递归算法题 2
第 1 个人 10,第 2 个比第 1 个人大 2 岁,依次递推,请用递归方式计算出第 8 个人多大?
public class Test { |
排序算法
//插入排序: |
有数组 a [n],用 java 代码将数组元素顺序颠倒
public class Test { |
12.金额转换,阿拉伯数字的金额转换成中国传统的形式如:(¥1011)->(一千零一拾一元整)输出。
public class Test { |