需要面试准备
分块时序保留交叉验证是某买方研究台在 label horizon 短到不需要重型 purge + embargo 那一套时的主力评估协议。普通 k 折用未来训练、用过去测试;走向前每折前移一根 bar(或 test_size 根 bar)、能塞多少折就塞多少折;分块 CV 介于两者之间。把按时间排好的 panel 切成 K 段大小近似的连续块,每块轮流当 test 折,严格早于该块的样本全部当 train。Train 永远在时间上早于 test,未来信息不会泄漏到模型——这是时序交叉验证的铁律。再加一段小小的 gap 防特征侧自相关(rolling mean、EWMA 这种输入即便 label 不重叠也会把相邻 bar 渗进来)。结果是 K 个时间上互不相交的 test 窗口,比走向前更易推理、比 purged k 折更轻量;代价是训练折数偏少——最早的几个块 train 为空或不够长,会被 min_train_size 挡掉。