分布式 ID 生成方案之美团 Leaf

Posted by 彭超 on 2020-07-22
Estimated Reading Time 3 Minutes
Words 1k In Total
Viewed Times

分布式主键

在庞大复杂的分布式系统中,通常需要对海量数据进行唯一标识,随着数据日渐增长,对数据分库分表以后需要有一个唯一 ID 来标识一条数据,而数据库的自增 ID 显然不能满足需求,此时就需要有一个能够生成全局唯一 ID 的系统,需要满足以下条件:

  • 全局唯一性:最基本的要求就是不能出现重复的 ID。
  • 递增:保证下一个 ID 一定大于上一个 ID。
  • 信息安全:如果 ID 是连续的,用户就可以按照顺序进行恶意爬取数据,所以 ID 生成无规则。

上述的 2 和 3 点需求是互斥的,无法使用同一个方案满足。

生成方案

数据库生成

以 MySQL 为例,利用给字段设置 auto_increment_incrementauto_increment_offset 来实现 ID 自增。每次业务可以使用下列 SQL 进行读写得到 ID:

1
2
3
4
begin;
REPLACE INTO Tickets64 (stub) VALUES ('a');
SELECT LAST_INSERT_ID();
commit;
  • 优点:使用非常简单,ID 单调递增。
  • 缺点:非常依赖数据库,当数据库异常时则整个系统不可用。

UUID

  • 优点:本地生成,没有网络消耗,性能高。
  • 缺点:过长不易于存储;造成信息不安全,基于 MAC 地址生成可能会造成 MAC 地址泄露。

Snowflake

Snowflake(雪花算法)是由 Twitter 发布的分布式 ID 生成算法,它能够保证不同进程主键的不重复性,以及相同进程主键的有序性。它是通过时间位实现单调递增,且各个服务器如果都做了时间同步,那么生成的 ID 可以认为是总体有序的。

Leaf

Leaf 最早期需求是各个业务线的订单 ID 生成需求。在美团早期,有的业务直接通过数据库自增的方式生成 ID,有的业务通过 Redis 缓存来生成 ID,也有的业务直接用 UUID 这种方式来生成 ID。以上的方式各自有各自的问题,因此决定实现一套分布式 ID 生成服务来满足需求。

Leaf-segment

Leaf-segment 数据库方案,在使用数据库的方案上,做了以下改变:

  • 原方案每次获取 ID 都得读写一次数据库,造成数据库压力大。改为利用 proxy server 批量获取一个 segment 号段,用完之后再去数据库获取新的号段,大大减轻数据库的压力。
  • 各个业务不同的发号需求用 biz_tag 字段来区分,每个 big_tag 的 ID 获取相互隔离互不影响。

优点:

  • Leaf 服务可以很方便的线性扩展,性能完全能够支撑大多数业务场景。
  • ID 是趋势递增的 8 字节的 64 位数字,满足数据库存储的主键要求。
  • 容灾性高:Leaf 服务内部有号段缓存,即使数据库宕机,短时间内仍能可以正常对外提供服务。
  • 可以自定义 max_id 大小。

缺点:

  • ID 不够随机,能够泄露发号数量的信息,不安全。
  • 数据库宕机可能会造成整个系统不可用。

Leaf-snowflake

该方案完全沿用 snowflake 方案设计。对于 workerID 的分配,当服务器集群数量较小的情况下,完全可以手动配置。服务规模较大时,动手配置成本太高,所以使用 Zookeeper 持久顺序节点的特性自动对 snowflake 节点配置。

启动步骤如下:

  1. 启动 Leaf-snowflake 服务,连接 Zookeeper,在 leaf_forever 父节点下检查自己是否已经注册过。
  2. 如果有注册过直接取回自己的 workerID,启动服务。
  3. 如果没有注册过,就在该父节点下面创建一个持久顺序节点,创建成功后取回顺序号当做自己的 workerID 号。

使用 Leaf 生成 ID

  • 克隆项目

    1
    2
    3
    $ git clone https://github.com/antoniopeng/leaf.git
    $ cd leaf
    $ mvn clean install -DskipTests
  • 构建

    1
    2
    3
    $ cd leaf-docker
    $ chmod +x build.sh
    $ ./build.sh
  • 启动

    1
    $ docker-compose up -d
  • 测试

    1
    $ curl http://localhost:8080/api/snowflake/get/test

If you like this blog or find it useful for you, you are welcome to comment on it. You are also welcome to share this blog, so that more people can participate in it. If the images used in the blog infringe your copyright, please contact the author to delete them. Thank you !