需要面试准备
延迟监控服务从每次请求的响应时间流中实时上报 p50 / p95 / p99 到值班大盘。合适的工具是 Greenwald-Khanna ε\varepsilonε-近似分位数摘要(Greenwald & Khanna, 2001, *Space-Efficient Online Computation of Quantile Summaries*, SIGMOD):把 NNN 个样本压缩成 O((1/ε)log(εN))O((1/\varepsilon) \log(\varepsilon N))O((1/ε)log(εN)) 个三元组,对任意分位查询保证秩误差 ≤εN\le \varepsilon N≤εN。