前视偏差审计场景 1
一个日频因子在回测前先用全样本均值和标准差做 z-score 标准化。这里的主要问题是什么?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions一个日频因子在回测前先用全样本均值和标准差做 z-score 标准化。这里的主要问题是什么?
打开 →一个回测在每个月对股票排序时,使用的是今天能够拿到的最新完全重述财务数据,即便这些数据对应的是很多年前的时期。这个设定哪里有问题?
打开 →一个研究 notebook 每天用当天收盘价选出前 10% 股票,然后把同一天的收盘到收盘收益记为 PnL。这里的泄漏在哪里?
打开 →训练集里包含了一些观测,它们的标签使用了与未来测试窗口重叠的收益。切分流程里应该增加什么?
打开 →某 PM 想把今天的指数成分名单回填到整个历史样本里,然后再评估一个因子。为什么这不安全?
打开 →某个实现波动率特征被定义为最近 4 个日收益的均方根。如果这 4 个收益是 [1%, -1%, 2%, 0%],那么得到的实现波动率特征是多少?
打开 →某供应商分发的数据有固定的 2 个工作日滞后。若模型使用的键值是“Tuesday signal”,并在 close 交易,那么最早哪个交易时点可以合法使用这条观测?
打开 →某供应商分发的数据有固定的 3 个工作日滞后。若模型使用的键值是“Monday file”,并在 open 交易,那么最早哪个交易时点可以合法使用这条观测?
打开 →某供应商分发的数据有固定的 1 个工作日滞后。若模型使用的键值是“Wednesday signal”,并在 open 交易,那么最早哪个交易时点可以合法使用这条观测?
打开 →某供应商分发的数据有固定的 5 个工作日滞后。若模型使用的键值是“Friday accounting snapshot”,并在 close 交易,那么最早哪个交易时点可以合法使用这条观测?
打开 →某供应商分发的数据有固定的 2 个工作日滞后。若模型使用的键值是“Thursday borrow-fee file”,并在 open 交易,那么最早哪个交易时点可以合法使用这条观测?
打开 →时间 t 的一个特征使用了从 t-19 到 t+1 的滚动均值。即使只多看了一天,为什么也不可接受?
打开 →某个特征用原始价格,而标签用的是拆股调整后的未来收益率。这会带来什么问题?
打开 →一个标签被定义为未来 5 个交易日的前瞻收益率。若你按时间切分训练窗和测试窗,为了避免标签信息跨边界泄漏,最小需要多长的禁运间隔?
打开 →一个信号在 Tuesday 4:15pm ET 公开。一个 daily 频率的策略只能在所有输入都已知之后交易。最早可交易的时点是什么?
打开 →一个信号在 Wednesday 8:10am ET 公开。一个 daily 频率的策略只能在所有输入都已知之后交易。最早可交易的时点是什么?
打开 →一个信号在 Thursday 6:00pm ET 公开。一个 daily 频率的策略只能在所有输入都已知之后交易。最早可交易的时点是什么?
打开 →一个信号在 Friday 3:55pm ET 公开。一个 daily 频率的策略只能在所有输入都已知之后交易。最早可交易的时点是什么?
打开 →在往模型里加入一个新的收益类特征之前,第一步应该先问什么对齐问题?
打开 →因为 1 日标签看起来太噪声,你想拉长未来收益 horizon。在动手前第一步应该检查什么?
打开 →你在今天收盘前做出预测,目标是明天的 close-to-close 收益率,但某个特征使用了今天正式收盘竞价后的最终收盘价。为什么这构成泄露?
打开 →在今天收盘时,你要用最近 5 个已经完成的日收益 [1%, -2%, 0%, 3%, 2%] 构造一个无泄漏的滚动均值收益特征。这个特征值是多少?
打开 →在标准化一个收益特征之前,首先应该检查你混在一起做标准化的资产池有什么性质?
打开 →你每天都构造一个未来 5 日收益标签,然后把相邻样本当作独立样本来用。这里的结构性问题是什么?
打开 →为什么对日收益特征做因子残差化时,必须使用特征时点已知的暴露,而不是用之后的收益再估出来的暴露?
打开 →在把收益对因子做残差化、并把残差当成新特征之前,第一步应该澄清什么?
打开 →某个动量特征定义为“过去 20 天累计收益 ÷ 过去日波动率”。如果累计收益为 6%,日波动率为 1.5%,应存下什么 vol-scaled momentum 值?
打开 →一个收益特征在训练好的模型里看起来非常重要。在认定它抓住了真实 alpha 之前,第一步应该检查什么?
打开 →某只股票今天上涨 1.4%,同期基准上涨 0.5%。如果该股票相对基准的 beta 为 1.6,那么应归因给股票自身的市场调整后残差收益是多少?
打开 →你测试了 40 个彼此独立的纯噪声策略。只有先通过显著性水平为 1/20 的样本内筛选,再通过显著性水平为 1/10 的第二道独立验证,策略才会被上线。在总体原假设成立时,至少有一个噪声策略仍被上线的概率是多少?
打开 →