← 返回编程题库

需要面试准备

某买方研究台桌在跑一条面板数据聚合流水线。每条观测都带一个分组 key(板块标签、ticker、行业代码、日期桶——任意字符串型标识)以及一个数值(收益、因子分、成交量、PnL)。在做任何横截面分析之前,桌台先要把面板按 key 聚成每组一行,得到 每组均值。最小样本数门控是信号质量过滤器:非 NaN 观测过少的分组直接报为 NaN,而不是一个被噪声主导的均值,这样下游横截面模型就不会把样本不足的分组当成估计良好的分组去配权。

查看订阅方案