百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

神秘的UUID

bigegpt 2024-08-16 14:28 3 浏览

一 简介

作为开发人员大家对 UUID 应该都比较熟悉了,Java 中也提供了相关的类和生成方法,供业务中使用。这里准备对 UUID 生成的过程做一次深入了解。

二 什么是 UUID

2.1 概念

根据百度百科的描述:

UUID 是 通用唯一识别码(Universally Unique Identifier)的缩写,是一种软件建构的标准,亦为开放软件基金会组织在分布式计算环境领域的一部分。其目的,是让分布式系统中的所有元素,都能有唯一的辨识信息,而不需要通过中央控制端来做辨识信息的指定。如此一来,每个人都可以创建不与其它人冲突的 UUID。

2.2 UUID 实例

现实中,最广泛应用的 UUID,是微软的全局唯一标识符(GUID),而其他重要的应用,则有 Linux ext2/ext3 文件系统、LUKS 加密分区、GNOME、KDE、Mac OS X 等等。

恰好手边有一台 mac 电脑,我们可以在:点击电脑左上角苹果图标-->关于本机-->系统报告-->硬件-->硬件 uuid 查看到硬件 uuid。


2.3 UUID 组成

UUID 由下面的几部分组成:

(1)UUID 的第一个部分与时间有关,如果你在生成一个 UUID 之后,过几秒又生成一个 UUID,则第一个部分不同,其余相同。

(2)时钟序列。

(3)全局唯一的 IEEE 机器识别号,如果有网卡,从网卡 MAC 地址获得,没有网卡以其他方式获得。

生成的结果串会比较长是 UUID 的缺陷。关于 UUID 这个标准,使用最普遍的是微软的 GUID(Globals Unique Identifiers)。在 ColdFusion 中可以用 CreateUUID()函数很简单地生成 UUID,其格式为:xxxxxxxx-xxxx- xxxx-xxxxxxxxxxxxxxxx(8-4-4-16),其中每个 x 是 0-9 或 a-f 范围内的一个十六进制的数字。而标准的 UUID 格式为:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx (8-4-4-4-12),可以从 cflib 下载 CreateGUID() UDF 进行转换。


三 Java 中的 UUID 类

3.1 java.util.UUID

java.util 包中提供了一个 UUID 类,其中包含了生成 UUID 的方法,供开发者调用。文档中对此也做了一些注释,从中我们也可以了解到更详细的关于 UUID 的信息(以下为注释中的部分关键信息截取):

A UUID represents a 128-bit value


 * <p> There exist different variants of these global identifiers.  The methods
 * of this class are for manipulating the Leach-Salz variant, although the
 * constructors allow the creation of any variant of UUID (described below).
 *
 * <p> The layout of a variant 2 (Leach-Salz) UUID is as follows:
 *
 * The most significant long consists of the following unsigned fields:
 * <pre>
 * 0xFFFFFFFF00000000 time_low
 * 0x00000000FFFF0000 time_mid
 * 0x000000000000F000 version
 * 0x0000000000000FFF time_hi
 * </pre>
 * The least significant long consists of the following unsigned fields:
 * <pre>
 * 0xC000000000000000 variant
 * 0x3FFF000000000000 clock_seq
 * 0x0000FFFFFFFFFFFF node
 * </pre>

从中我们可以看到:

1、UUID 表示一个 128 位的值;

2、这些通用标识符具有不同的变体。此类的方法用于操作 Leach-Salz 变体,不过构造方法允许创建任何 UUID 变体(将在下面进行描述);

3、变体 2 (Leach-Salz) UUID 的布局如下: long 型数据的最高有效位由以下无符号字段组成:

 0xFFFFFFFF00000000 time_low
 0x00000000FFFF0000 time_mid
 0x000000000000F000 version
 0x0000000000000FFF time_hi
 

long 型数据的最低有效位由以下无符号字段组成:

 0xC000000000000000 variant
 0x3FFF000000000000 clock_seq
 0x0000FFFFFFFFFFFF node
 

variant 字段包含一个表示 UUID 布局的值。以上描述的位布局仅在 UUID 的 variant 值为 2(表示 Leach-Salz 变体)时才有效。

version 字段保存描述此 UUID 类型的值。有 4 种不同的基本 UUID 类型:基于时间的 UUID、DCE 安全 UUID、基于名称的 UUID 和随机生成的 UUID。 这些类型的 version 值分别为 1、2、3 和 4。

关于 UUID 的文档可以参考:类 UUID。

3.2 UUID 的版本及相关代码

version 1:基于时间的 UUID

public long timestamp() {
    if (version() != 1) {
        throw new UnsupportedOperationException("Not a time-based UUID");
    }


    return (mostSigBits & 0x0FFFL) << 48
         | ((mostSigBits >> 16) & 0x0FFFFL) << 32
         | mostSigBits >>> 32;
}

version 2:DCE 安全的 UUID

相关文档:https://www.ietf.org/rfc/rfc4122.txt

DCE(Distributed Computing Environment)安全的 UUID 和基于时间的 UUID 算法相同,但会把时间戳的前 4 位置换为 POSIX 的 UID 或 GID。这个版本的 UUID 在实际中较少用到。

version 3:基于名字的 UUID

    public static UUID nameUUIDFromBytes(byte[] name) {
        MessageDigest md;
        try {
            md = MessageDigest.getInstance("MD5");
        } catch (NoSuchAlgorithmException nsae) {
            throw new InternalError("MD5 not supported", nsae);
        }
        byte[] md5Bytes = md.digest(name);
        md5Bytes[6]  &= 0x0f;  /* clear version        */
        md5Bytes[6]  |= 0x30;  /* set to version 3     */
        md5Bytes[8]  &= 0x3f;  /* clear variant        */
        md5Bytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(md5Bytes);
    }

version 4:随机 UUID

    public static UUID randomUUID() {
        SecureRandom ng = Holder.numberGenerator;


        byte[] randomBytes = new byte[16];
        ng.nextBytes(randomBytes);
        randomBytes[6]  &= 0x0f;  /* clear version        */
        randomBytes[6]  |= 0x40;  /* set to version 4     */
        randomBytes[8]  &= 0x3f;  /* clear variant        */
        randomBytes[8]  |= 0x80;  /* set to IETF variant  */
        return new UUID(randomBytes);
    }

version 5:基于名字的 UUID(SHA1)

3.3 UUID 生成方法

下面代码是生成 uuid 的典型方法:

UUID uuid = UUID.randomUUID();
System.out.println(uuid);

本地测试生成的 uuid 结果为:744124dc-0e39-460b-8898-ba7285d796f5,是一个十六进制数字的字符串。

因为字符串包含 36 个字符,比较长,所以在使用时,有时候也会考虑用 UUID 的 getMostSignificantBits 方法,只保留最具明显特征的 64bit,例如:

long uuid = UUID.randomUUID().getMostSignificantBits();
System.out.println(uuid);

结果为:-3023758490243282597。

3.4 UUID 的唯一性保证

随机产生的 UUID(例如说由 java.util.UUID 类别产生的)的 128 个比特中,有 122 个比特是随机产生,4 个比特在此版本('Randomly generated UUID')被使用,还有 2 个在其变体('Leach-Salz')中被使用。利用生日悖论,可计算出两笔 UUID 拥有相同值的机率约为:


以下是以 x=2^122 计算出 UUID 后产生碰撞的机率:


可见,随机方法产生重复 GUID 并造成错误的概率是非常低的。

3.5 是否线程安全?

我们再来看一下 UUID 的 randomUUID()方法:

SecureRandom ng = Holder.numberGenerator;


byte[] randomBytes = new byte[16];
ng.nextBytes(randomBytes);
randomBytes[6]  &= 0x0f;  /* clear version        */
randomBytes[6]  |= 0x40;  /* set to version 4     */
randomBytes[8]  &= 0x3f;  /* clear variant        */
randomBytes[8]  |= 0x80;  /* set to IETF variant  */
return new UUID(randomBytes);

重点是 SecureRandom ng = Holder.numberGenerator;这里。Holder 的位置:

private static class Holder {
    static final SecureRandom numberGenerator = new SecureRandom();
}

看到这里,相信有些基础扎实的朋友会想到单例模式的一种实现方式了,静态内部类方式,通过这种方式保证了获取单例实例时的线程安全。

接下来是 ng.nextBytes(randomBytes);

    @Override
    public void nextBytes(byte[] bytes) {
        secureRandomSpi.engineNextBytes(bytes);
    }

SecureRandomSpi 是一个抽象类:

protected abstract void engineNextBytes(byte[] bytes);

SecureRandom 就是 SecureRandomSpi 的实现类,实现方法如下:



    public synchronized void engineNextBytes(byte[] var1) {
        int var2 = 0;
        byte[] var4 = this.remainder;
        if (this.state == null) {
            byte[] var5 = new byte[20];
            SecureRandom.SeederHolder.seeder.engineNextBytes(var5);
            this.state = this.digest.digest(var5);
        }


        int var7 = this.remCount;
        int var3;
        int var6;
        if (var7 > 0) {
            var3 = var1.length - var2 < 20 - var7 ? var1.length - var2 : 20 - var7;


            for(var6 = 0; var6 < var3; ++var6) {
                var1[var6] = var4[var7];
                var4[var7++] = 0;
            }


            this.remCount += var3;
            var2 += var3;
        }


        while(var2 < var1.length) {
            this.digest.update(this.state);
            var4 = this.digest.digest();
            updateState(this.state, var4);
            var3 = var1.length - var2 > 20 ? 20 : var1.length - var2;


            for(var6 = 0; var6 < var3; ++var6) {
                var1[var2++] = var4[var6];
                var4[var6] = 0;
            }


            this.remCount += var3;
        }


        this.remainder = var4;
        this.remCount %= 20;
    }

方法中的 synchronized 关键字,表明了这是一个同步方法,通过 synchronized 实现同步。

Uuid 是不可变的,所以它可能是线程安全的,但显然有些访问器中存在一些使其不安全的evil caching going on(该 bug 现在已修复)。但是线程转储只是说一个线程正在等待SecureRandom.nextBytes的锁,该锁由UUID.randomUUID工厂使用,这绝对是线程安全的。据我所知,当多个线程同时调用它时,应该会发生这种情况。

相关推荐

了解Linux目录,那你就了解了一半的Linux系统

大到公司或者社群再小到个人要利用Linux来开发产品的人实在是多如牛毛,每个人都用自己的标准来配置文件或者设置目录,那么未来的Linux则就是一团乱麻,也对管理造成许多麻烦。后来,就有所谓的FHS(F...

Linux命令,这些操作要注意!(linux命令?)

刚玩Linux的人总觉得自己在演黑客电影,直到手滑输错命令把公司服务器删库,这才发现命令行根本不是随便乱用的,而是“生死簿”。今天直接上干货,告诉你哪些命令用好了封神!喜欢的一键三连,谢谢观众老爷!!...

Linux 命令速查手册:这 30 个高频指令,拯救 90% 的运维小白!

在Linux系统的世界里,命令行是强大的武器。对于运维小白而言,掌握一些高频使用的Linux命令,能极大提升工作效率,轻松应对各种系统管理任务。今天,就为大家奉上精心整理的30个Linu...

linux必学的60个命令(linux必学的20个命令)

以下是Linux必学的20个基础命令:1.cd:切换目录2.ls:列出文件和目录3.mkdir:创建目录4.rm:删除文件或目录5.cp:复制文件或目录6.mv:移动/重命名文件或目录7....

提高工作效率的--Linux常用命令,能够决解95%以上的问题

点击上方关注,第一时间接受干货转发,点赞,收藏,不如一次关注评论区第一条注意查看回复:Linux命令获取linux常用命令大全pdf+Linux命令行大全pdf为什么要学习Linux命令?1、因为Li...

15 个实用 Linux 命令(linux命令用法及举例)

Linux命令行是系统管理员、开发者和技术爱好者的强大工具。掌握实用命令不仅能提高效率,还能解锁Linux系统的无限潜力,本文将深入介绍15个实用Linux命令。ls-列出目录内容l...

Linux 常用命令集合(linux常用命令全集)

系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DM...

Linux的常用命令就是记不住,怎么办?

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux常用文件操作命令(linux常用文件操作命令有哪些)

ls命令在Linux维护工作中,经常使用ls这个命令,这是最基本的命令,来写几条常用的ls命令。先来查看一下使用的ls版本#ls--versionls(GNUcoreutils)8.4...

Linux 常用命令(linux常用命令)

日志排查类操作命令查看日志cat/var/log/messages、tail-fxxx.log搜索关键词grep"error"xxx.log多条件过滤`grep-E&#...

简单粗暴收藏版:Linux常用命令大汇总

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友在Linux系统中,命令行界面(CLI)是管理员和开发人员最常用的工具之一。通过命令行,用户可...

「Linux」linux常用基本命令(linux常用基本命令和用法)

Linux中许多常用命令是必须掌握的,这里将我学linux入门时学的一些常用的基本命令分享给大家一下,希望可以帮助你们。总结送免费学习资料(包含视频、技术学习路线图谱、文档等)1、显示日期的指令:d...

Linux的常用命令就是记不住,怎么办?于是推出了这套教程

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux的30个常用命令汇总,运维大神必掌握技能!

以下是Linux系统中最常用的30个命令,精简版覆盖日常操作核心需求,适合快速掌握:一、文件/目录操作1.`ls`-列出目录内容`ls-l`(详细信息)|`ls-a`(显示隐藏文件)...

Linux/Unix 系统中非常常用的命令

Linux/Unix系统中非常常用的命令,它们是进行文件操作、文本处理、权限管理等任务的基础。下面是对这些命令的简要说明:**文件操作类:*****`ls`(list):**列出目录内容,显...