需要面试准备
某买方研究台桌在跑一条面板特征流水线。每条输入行带一个分组 key(ticker、板块标签、策略桶——任意字符串型标识)以及一个数值(日收益、因子分、实现波动率、成交价)。要构造一个当天可用的特征——比如 *这只票昨天的收益*——就得把每个值在 *同一个 key 内* 沿时间向后位移一格;要构造 ML 训练用的标签——比如 *这只票下一期的收益*——就得把每个值在同一个 key 内沿时间向前位移一格。这两件事其实是同一个原语:按 key 的位置型偏移。pandas 用户写 df.groupby('key')['value'].shift(offset),下面给出的是它的从零实现。