Java 中使用 CompletableFuture 构建高并发异步任务编排的实战指南

在高并发系统里，“把一个接口写快”往往不是关键，真正难的是：把一组彼此依赖、部分并行、需要容错的任务组织起来，并且在高峰流量下还能稳定运行。

我在做聚合查询、订单履约、推荐服务拼装这类场景时，最常见的问题不是某一段代码慢，而是：

多个远程调用串行执行，整体延迟被拉长
某个子任务异常，整条链路直接失败
默认线程池用得随意，压测时线程数暴涨
超时、降级、日志追踪没做好，线上问题很难查

CompletableFuture 恰好就是解决这类问题的利器。它不只是“异步执行一个任务”，更重要的是：它可以表达任务之间的依赖关系、组合关系和异常处理策略。

这篇文章我会从架构视角出发，带你把 CompletableFuture 从“会用 API”推进到“能做高并发异步编排设计”。

背景与问题

先看一个典型场景：商品详情页聚合接口，需要同时获取：

商品基础信息
价格信息
库存信息
营销活动
用户个性化推荐

如果按串行方式调用，伪代码大概是这样：

Product product = productService.getProduct(id);
Price price = priceService.getPrice(id);
Stock stock = stockService.getStock(id);
Promotion promotion = promotionService.getPromotion(id);
Recommend recommend = recommendService.getRecommend(userId, id);

如果每个服务平均耗时 80ms，那么整体很容易逼近 400ms+。而实际业务中，用户并不关心你是不是调用了五个服务，他只关心页面为什么慢。

串行模式的问题

总耗时累加
异常传播粗暴
线程资源使用低效
无法自然表达依赖关系

更复杂一点，任务之间还不是完全独立：

获取库存可能依赖商品所属仓
推荐结果可能需要先拿到商品分类
营销服务慢时可以降级，但价格服务失败通常不能随便忽略

这时，我们需要的不是“简单异步”，而是任务编排。

为什么是 CompletableFuture

CompletableFuture 是 JDK 8 引入的异步编排工具，结合 Future、回调和函数式链式处理的能力，适合做：

并行执行多个 I/O 任务
任务间依赖传递
结果聚合
异常恢复
超时控制
分阶段流水线处理

它的价值不在于某个 API，而在于它能把一堆零散线程任务，组织成一张清晰的依赖图。

核心原理

先别急着记 API，我建议先建立三个认知。

1. CompletableFuture 本质是“可完成的结果容器”

你可以把它理解成：

未来某个时刻会拿到一个结果
这个结果可能成功，也可能失败
结果到达后，还能继续触发后续动作

这比传统 Future 强很多，传统 Future 主要是“提交任务 + 阻塞等待结果”，而 CompletableFuture 强在“结果完成后的继续编排”。

2. 它表达的是依赖关系，而不仅仅是线程切换

常见关系有三类：

串行依赖：A 做完再做 B
并行汇聚：A、B、C 同时做，最后汇总
竞争取胜：A、B 谁先返回用谁

3. 线程池决定了高并发下的生死线

很多人刚开始图省事，直接用默认线程池：

CompletableFuture.supplyAsync(() -> query());

这会使用 ForkJoinPool.commonPool()。在 CPU 计算型任务里问题不大，但在大量 I/O 阻塞场景下，很容易不够用，甚至互相拖垮。

结论先说：高并发异步编排，几乎一定要显式指定线程池。

任务编排模型

下面用一张图先把几种典型编排关系串起来。

flowchart TD
    A[请求进入] --> B[查询商品基础信息]
    A --> C[查询价格]
    A --> D[查询库存]
    B --> E[提取商品分类]
    E --> F[查询推荐]
    B --> G[提取仓库信息]
    G --> H[补充库存校验]
    C --> I[结果汇总]
    D --> I
    F --> I
    H --> I
    B --> I
    I --> J[返回聚合结果]

这张图里包含了两类关系：

A -> B/C/D：并行
B -> E -> F：依赖链
最后 I：统一汇总

这正是 CompletableFuture 最擅长的表达方式。

方案对比：为什么不用传统线程池 + Future

很多团队一开始会这么写：

手工 submit 多个任务
拿到多个 Future
最后循环 get()
自己处理异常和超时

这么做不是不能用，但问题是代码会很快失控。

方案	优点	缺点	适用场景
ThreadPool + Future	简单直接	组合能力弱，异常处理笨重	少量独立异步任务
CountDownLatch	等待多个任务结束方便	不关心返回值编排，扩展性一般	批量并发等待
Reactor/响应式流	适合全链路响应式	学习和迁移成本高	大规模响应式架构
CompletableFuture	JDK 原生、组合灵活、易落地	API 较多，线程池设计要谨慎	典型业务异步编排

如果你当前系统还是同步 MVC 架构，或者只是想把聚合接口、批处理流程、异步调用链优化掉，CompletableFuture 通常是性价比很高的选择。

核心原理拆解：常用编排 API 怎么选

1. 创建异步任务

`runAsync`

无返回值。

CompletableFuture.runAsync(() -> doSomething(), executor);

`supplyAsync`

有返回值，更常用。

CompletableFuture<String> future =
    CompletableFuture.supplyAsync(() -> "hello", executor);

2. 串行依赖

`thenApply`

上一步有结果，这一步同步加工结果。

future.thenApply(result -> result + " world");

`thenCompose`

上一步结果用于触发下一个异步任务，适合“异步任务嵌套打平”。

future.thenCompose(id -> CompletableFuture.supplyAsync(() -> queryById(id), executor));

这是很多人容易搞混的点：

thenApply：返回普通值
thenCompose：返回另一个 CompletableFuture

3. 并行组合

`thenCombine`

两个任务都完成后合并结果。

futureA.thenCombine(futureB, (a, b) -> merge(a, b));

`allOf`

等待一组任务全部完成。

CompletableFuture.allOf(f1, f2, f3);

`anyOf`

谁先返回用谁。

CompletableFuture.anyOf(f1, f2, f3);

4. 异常处理

`exceptionally`

出现异常时兜底。

future.exceptionally(ex -> defaultValue());

`handle`

无论成功失败都能处理。

future.handle((result, ex) -> ex == null ? result : fallback());

`whenComplete`

适合记录日志、埋点，不改结果。

future.whenComplete((result, ex) -> log.info("done"));

一张时序图看懂执行过程

sequenceDiagram
    participant Client as 调用方
    participant API as 聚合服务
    participant TP as 业务线程池
    participant P as 商品服务
    participant PR as 价格服务
    participant S as 库存服务
    participant R as 推荐服务

    Client->>API: 请求商品详情
    API->>TP: 提交商品任务
    API->>TP: 提交价格任务
    API->>TP: 提交库存任务
    TP->>P: 查询商品
    TP->>PR: 查询价格
    TP->>S: 查询库存
    P-->>TP: 返回商品信息
    TP->>R: 根据分类查询推荐
    PR-->>TP: 返回价格
    S-->>TP: 返回库存
    R-->>TP: 返回推荐
    TP-->>API: allOf 完成并汇总
    API-->>Client: 返回聚合结果

实战代码（可运行）

下面给一个可直接运行的示例，模拟“商品详情聚合接口”的高并发异步编排。

示例涵盖这些能力：

独立任务并行执行
依赖任务链式触发
自定义线程池
超时与降级
统一汇总结果

import java.util.concurrent.*;
import java.util.*;

public class CompletableFutureOrchestrationDemo {

    private static final ExecutorService IO_POOL = new ThreadPoolExecutor(
            16,
            32,
            60L,
            TimeUnit.SECONDS,
            new LinkedBlockingQueue<>(2000),
            new ThreadFactory() {
                private int idx = 1;
                @Override
                public Thread newThread(Runnable r) {
                    Thread t = new Thread(r, "cf-io-" + idx++);
                    t.setDaemon(false);
                    return t;
                }
            },
            new ThreadPoolExecutor.CallerRunsPolicy()
    );

    public static void main(String[] args) {
        try {
            ProductDetail detail = queryProductDetail(1001L, 9527L);
            System.out.println("聚合结果：");
            System.out.println(detail);
        } finally {
            IO_POOL.shutdown();
        }
    }

    public static ProductDetail queryProductDetail(Long productId, Long userId) {
        long start = System.currentTimeMillis();

        CompletableFuture<Product> productFuture =
                CompletableFuture.supplyAsync(() -> getProduct(productId), IO_POOL)
                        .orTimeout(500, TimeUnit.MILLISECONDS);

        CompletableFuture<Price> priceFuture =
                CompletableFuture.supplyAsync(() -> getPrice(productId), IO_POOL)
                        .completeOnTimeout(new Price(productId, -1), 300, TimeUnit.MILLISECONDS)
                        .exceptionally(ex -> {
                            System.out.println("price 降级: " + ex.getMessage());
                            return new Price(productId, -1);
                        });

        CompletableFuture<Stock> stockFuture =
                CompletableFuture.supplyAsync(() -> getStock(productId), IO_POOL)
                        .exceptionally(ex -> {
                            System.out.println("stock 降级: " + ex.getMessage());
                            return new Stock(productId, false);
                        });

        CompletableFuture<Recommend> recommendFuture =
                productFuture.thenCompose(product ->
                        CompletableFuture.supplyAsync(
                                () -> getRecommend(userId, product.category),
                                IO_POOL
                        )
                ).completeOnTimeout(new Recommend(Collections.emptyList()), 250, TimeUnit.MILLISECONDS)
                 .exceptionally(ex -> {
                     System.out.println("recommend 降级: " + ex.getMessage());
                     return new Recommend(Collections.emptyList());
                 });

        CompletableFuture<Void> all =
                CompletableFuture.allOf(productFuture, priceFuture, stockFuture, recommendFuture);

        try {
            all.join();

            Product product = productFuture.join();
            Price price = priceFuture.join();
            Stock stock = stockFuture.join();
            Recommend recommend = recommendFuture.join();

            ProductDetail detail = new ProductDetail(product, price, stock, recommend);
            long cost = System.currentTimeMillis() - start;
            System.out.println("总耗时: " + cost + " ms");
            return detail;
        } catch (CompletionException ex) {
            throw new RuntimeException("聚合查询失败: " + ex.getCause(), ex);
        }
    }

    static Product getProduct(Long productId) {
        sleep(120);
        return new Product(productId, "机械键盘", "keyboard");
    }

    static Price getPrice(Long productId) {
        sleep(80);
        return new Price(productId, 399);
    }

    static Stock getStock(Long productId) {
        sleep(100);
        return new Stock(productId, true);
    }

    static Recommend getRecommend(Long userId, String category) {
        sleep(150);
        return new Recommend(Arrays.asList(category + "-1", category + "-2", category + "-3"));
    }

    static void sleep(long ms) {
        try {
            Thread.sleep(ms);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            throw new RuntimeException("thread interrupted", e);
        }
    }

    static class Product {
        Long productId;
        String name;
        String category;

        Product(Long productId, String name, String category) {
            this.productId = productId;
            this.name = name;
            this.category = category;
        }

        @Override
        public String toString() {
            return "Product{productId=" + productId + ", name='" + name + "', category='" + category + "'}";
        }
    }

    static class Price {
        Long productId;
        int amount;

        Price(Long productId, int amount) {
            this.productId = productId;
            this.amount = amount;
        }

        @Override
        public String toString() {
            return "Price{productId=" + productId + ", amount=" + amount + "}";
        }
    }

    static class Stock {
        Long productId;
        boolean available;

        Stock(Long productId, boolean available) {
            this.productId = productId;
            this.available = available;
        }

        @Override
        public String toString() {
            return "Stock{productId=" + productId + ", available=" + available + "}";
        }
    }

    static class Recommend {
        List<String> items;

        Recommend(List<String> items) {
            this.items = items;
        }

        @Override
        public String toString() {
            return "Recommend{items=" + items + "}";
        }
    }

    static class ProductDetail {
        Product product;
        Price price;
        Stock stock;
        Recommend recommend;

        ProductDetail(Product product, Price price, Stock stock, Recommend recommend) {
            this.product = product;
            this.price = price;
            this.stock = stock;
            this.recommend = recommend;
        }

        @Override
        public String toString() {
            return "ProductDetail{" +
                    "product=" + product +
                    ", price=" + price +
                    ", stock=" + stock +
                    ", recommend=" + recommend +
                    '}';
        }
    }
}

这段代码里最关键的设计点

1. 商品、价格、库存并行执行

CompletableFuture.supplyAsync(...)

三个任务互不依赖，最适合直接并发。

2. 推荐任务依赖商品分类

productFuture.thenCompose(product -> CompletableFuture.supplyAsync(...))

这就是典型的“先查 A，再用 A 的结果异步触发 B”。

3. 对可降级任务设置超时兜底

.completeOnTimeout(defaultValue, timeout, unit)
.exceptionally(ex -> fallback)

像推荐、营销、画像这类任务通常可降级；但商品主信息则往往不能随便吞掉异常。

4. 使用 `allOf` 做收口

CompletableFuture.allOf(...)

统一等待，再逐个 join() 取结果。这样代码结构清晰，也方便在汇总层做监控和统计。

取舍分析：高并发下该怎么设计线程池

这是实战里最容易出事故的地方，我单独展开讲一下。

为什么不能滥用默认线程池

ForkJoinPool.commonPool() 更适合：

CPU 密集型
可拆分计算任务
非阻塞短任务

而我们的业务编排里，很多子任务其实是：

RPC 调用
数据库访问
Redis 访问
HTTP 请求
第三方接口调用

这些本质上是I/O 阻塞型任务。如果继续把它们扔进默认线程池，就会出现：

线程数不够，任务堆积
某些任务阻塞导致其他任务饥饿
commonPool 被全局共享，互相影响

实战建议

I/O 密集型任务池

核心线程数：根据机器核数和平均阻塞时间估算
队列要有界
拒绝策略要明确
线程名要可识别

简单经验值不是绝对，但可以先这么起步：

线程数 ≈ CPU核数 * 2 ~ 4（低阻塞）
线程数 ≈ CPU核数 * 4 ~ 8（中高阻塞）

如果接口依赖外部系统很多，最终还要结合压测数据调优。

容量估算思路

一个粗略方法：

需要线程数 ≈ 峰值QPS × 平均异步任务数 × 平均阻塞时长 / 1000

比如：

峰值 QPS = 300
每个请求平均触发 4 个 I/O 子任务
平均阻塞时长 50ms

那么：

300 × 4 × 50 / 1000 = 60

说明线程池量级至少要覆盖到这个级别，再结合队列长度、上下游超时和机器资源做修正。

当然，这只是估算起点，不是生产最终值。

常见坑与排查

下面这些坑，我基本都见过，甚至踩过。

坑 1：把 `join()`/`get()` 提前写进链路中，导致“伪异步”

错误示例：

CompletableFuture<Product> productFuture = CompletableFuture.supplyAsync(() -> getProduct(1L), IO_POOL);
Product product = productFuture.join(); // 提前阻塞
CompletableFuture<Recommend> recommendFuture =
        CompletableFuture.supplyAsync(() -> getRecommend(1L, product.category), IO_POOL);

问题在于：你本来想做异步编排，结果中途手动阻塞，后续并发优势直接没了。

建议： 尽量把 join() 留到最终汇总阶段。

坑 2：`thenApply` 和 `thenCompose` 混用错误

错误示例：

CompletableFuture<CompletableFuture<String>> nested =
        future.thenApply(v -> CompletableFuture.supplyAsync(() -> query(v), IO_POOL));

这样会得到嵌套 Future，后续处理很别扭。

正确方式：

CompletableFuture<String> flat =
        future.thenCompose(v -> CompletableFuture.supplyAsync(() -> query(v), IO_POOL));

坑 3：异常被吞掉，日志里什么都没有

有些人只写：

future.exceptionally(ex -> null);

这虽然防止了异常继续抛出，但也把问题线索吞了。

更好的写法：

future.exceptionally(ex -> {
    System.err.println("task failed: " + ex.getMessage());
    return defaultValue;
});

线上系统建议配合：

traceId
任务名
请求参数摘要
耗时
降级标记

坑 4：线程池过大，压测时反而更慢

很多人以为线程越多越快。实际上线程太多会带来：

线程切换开销
内存压力上升
下游服务被打爆
队列堆积，RT 抖动

经验建议： 先压测，再调优，不要拍脑袋设 500 或 1000 个线程。

坑 5：只管本地并发，不管下游承受能力

你本地 CompletableFuture 编排再漂亮，如果一下子并发打 10 个下游服务，整个系统可能很快进入雪崩。

排查路径：

看应用线程池活跃数、队列堆积
看下游接口 RT、超时率、错误率
看是否存在重试放大
看是否缺少隔离与限流

坑 6：异步链路里 ThreadLocal 上下文丢失

比如：

用户信息
traceId
租户上下文
MDC 日志上下文

异步切线程后，ThreadLocal 默认不会自动传递。

解决思路：

显式传参
使用支持上下文透传的封装线程池
接入链路追踪组件

这个问题线上很隐蔽，常见症状是：日志有打印，但 traceId 断了。

常见排查方法

当你怀疑 CompletableFuture 编排有问题时，可以按这个顺序查：

flowchart TD
    A[接口慢或超时] --> B{线程池是否堆积}
    B -->|是| C[查看活跃线程/队列长度/拒绝次数]
    B -->|否| D{是否某个子任务慢}
    C --> E[调小并发或扩容池并做隔离]
    D -->|是| F[定位慢任务: RPC/DB/HTTP]
    D -->|否| G{是否异常被吞掉}
    F --> H[增加超时/降级/熔断]
    G -->|是| I[补充 whenComplete/exceptionally 日志]
    G -->|否| J[检查提前 join、串行依赖、上下文丢失]

这个排查思路很朴素，但实用。线上故障时，千万别一上来盯着 API 文档抠语法，先看是不是资源问题、是不是下游慢、是不是错误被吞。

安全/性能最佳实践

这一节我只讲能落地的。

1. 为不同类型任务做线程池隔离

不要把所有异步任务都丢进一个池子。

可以按任务性质拆分：

RPC 调用池
数据库访问池
文件处理池
低优先级任务池

这样做的好处是：一个类型任务雪崩，不会拖死全部异步链路。

2. 必须设置超时，且区分“强依赖”和“弱依赖”

建议把任务分两类：

强依赖

失败就失败，比如：

商品主信息
订单主状态
支付结果确认

弱依赖

失败可降级，比如：

推荐
标签
营销角标
个性化信息

强依赖不要静默吞错，弱依赖要有默认值。

3. 有界队列 + 明确拒绝策略

无界队列看起来省心，实际上高峰时会让系统慢性死亡。

推荐原则：

队列有界
监控拒绝次数
拒绝后有降级或快速失败策略

4. 不要在异步任务里做长时间阻塞

如果你在 CompletableFuture 任务里又写了：

Thread.sleep(5000);

或者做长时间同步 I/O，又没有隔离线程池，那就相当于主动把并发能力锁死。

5. 保证幂等与可重试边界

异步编排常常会配合重试，但重试不是免费午餐。

要先确认：

下游接口是否幂等
是否会重复扣减库存
是否会重复发券
是否会放大流量

建议： 只对读请求或明确幂等的写请求做自动重试。

6. 做好观测性

至少监控这些指标：

线程池活跃线程数
队列长度
任务提交数/完成数/拒绝数
子任务成功率
子任务 P95/P99 耗时
超时次数
降级次数

如果没有这些指标，编排做得再复杂，出了问题你也很难定位。

7. 注意敏感数据传递

异步链路里经常会把上下文、请求对象直接传来传去，这里要注意：

不要把完整用户隐私信息塞进日志
不要把大对象无脑透传到每个异步任务
请求参数最好做裁剪和脱敏

这既是安全问题，也是性能问题。

一个实用的编排模板

如果你要在项目里沉淀统一写法，我建议团队至少形成下面这种模式：

明确子任务分类：强依赖 / 弱依赖
显式线程池
每个任务都有超时
弱依赖统一降级
汇总层统一收口
统一日志和监控埋点

伪代码模板如下：

CompletableFuture<A> aFuture = supplyAsync(A).orTimeout(...);
CompletableFuture<B> bFuture = supplyAsync(B).completeOnTimeout(defaultB, ...);
CompletableFuture<C> cFuture = aFuture.thenCompose(a -> supplyAsync(C(a))).exceptionally(...);

CompletableFuture<Void> all = CompletableFuture.allOf(aFuture, bFuture, cFuture);

all.join();

return assemble(aFuture.join(), bFuture.join(), cFuture.join());

别小看这个模板。很多团队把它标准化以后，异步编排代码的可读性会提升非常明显。

边界条件：什么时候不该用 CompletableFuture

虽然它很好用，但也不是银弹。

以下场景要慎用或换工具：

1. 全链路已经是响应式架构

如果你已经使用 WebFlux、Reactor、R2DBC 这类完整响应式体系，继续混搭 CompletableFuture 可能让模型更复杂。

2. 编排任务特别复杂，涉及大量动态工作流

比如：

多分支审批流
可配置工作流引擎
Saga 长事务编排

这类更适合工作流引擎或专门编排框架，不适合纯手写 CompletableFuture。

3. 任务大多是 CPU 密集型且可批量拆分

这时 ForkJoinPool、并行流甚至专门计算框架可能更合适。

总结

CompletableFuture 真正的价值，不是“把同步代码改成异步”，而是让你能够在 Java 里清晰地描述高并发任务之间的关系：

哪些任务可以并行
哪些任务存在依赖
哪些任务失败可降级
哪些任务必须强一致返回
如何在高峰流量下保证资源不被打穿

如果你准备在生产环境落地，我给你的可执行建议是：

先从聚合查询类接口开始，这类最容易见效
必须自定义线程池，不要默认 commonPool 直接上生产
把任务分成强依赖和弱依赖
每个异步任务都要有超时与异常处理
把 join() 放在最后汇总阶段
补齐监控、日志、traceId 透传
用压测结果调线程池，不要凭感觉设参数

最后说一句很实在的话：
CompletableFuture 不难，难的是你有没有把“并发、依赖、超时、降级、观测”作为一个整体去设计。只会几个 API，离线上稳定还差一大截；但一旦把这套思路建立起来，它会成为 Java 高并发编排里非常顺手的一把工具。