SciPy 与统计工具
python · scipy · stats · distributions · fit · var · descriptive-statistics · hypothesis-testing
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questionspython · scipy · stats · distributions · fit · var · descriptive-statistics · hypothesis-testing
打开 →周五上午,你在上海的一家 量化 私募 ——明汯、 幻方、 九坤、 灵均 风格 的 多 因子 私募。 L3 把 四 条 信号 正交化 完了: mom 12 1 , book to market , gross profitability , pead sue 都 残差化 通过 了 IC break even 门槛。 桌面 上 还 没有 量产 复合 信号。 投决...
打开 →machine-learning · financial-ml · cross-validation · purged-cv · cpcv · deflated-sharpe · multiple-testing · backtest-overfitting
打开 →周一上午十点,你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了,落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ,是沪深300 ETF(510300.SH)在 2024...
打开 →为什么仅仅因为最终策略只是相对基线做了很多“小修改”,就声称不存在严重过拟合,这是误导性的?
打开 →为什么把很多单独研究过的策略再组合成一个元组合,会额外引入一层过拟合风险?
打开 →为什么对于非常高换手的策略,回测过拟合会格外危险?
打开 →你卖出(写出)执行价 100 的跨式,收取看涨权利金 6 和看跌权利金 7。求最大利润、两个盈亏平衡价,以及股价到期为 118 时的盈亏。
打开 →某周三 下午,上海 量化 私募 明汯 / 幻方 风格 的 投决会。研究员 上 来 一个 动量 策略:L1 引擎 是 事件驱动(干净);L2 真实性 清单 每 一 项 都 过(PIT 数据、survivorship free 沪深300 股票池、下根 K 线 开盘 成交、双边 10 bps 成本、不 做 空)。报告 的 夏普比率 在 2014 2023 上 是...
打开 →一份多头看涨蝶式买入一张 90 看涨、卖出两张 100 看涨、买入一张 110 看涨,净支出为 2(执行价等距)。求最大利润、达到最大利润时的股价,以及最大亏损。
打开 →如果先在全量数据上拟合标准化,再去做交叉验证,而不是把标准化放到每个 fold 里重做,这个调参流程的主要问题是什么?
打开 →你买入执行价 110、权利金 7 的看跌期权,同时卖出执行价 100、权利金 3 的看跌期权,其中 110>100。求净权利金支出、到期盈亏平衡价以及最大利润。
打开 →你买入一张执行价为 100 的看涨期权,权利金为 4.5;同时卖出一张执行价为 110 的看涨期权,权利金为 1.5,其中 110>100。求该策略的净权利金支出、到期盈亏平衡价,以及最大利润。
打开 →你买入一张执行价为 95 的看涨期权,权利金为 6;同时卖出一张执行价为 105 的看涨期权,权利金为 2.2,其中 105>95。求该策略的净权利金支出、到期盈亏平衡价,以及最大利润。
打开 →周五下午两点半,浦东陆家嘴一家中型私募的风控会上,PM 把昨晚跑出来的 tear sheet 推过来:「食品饮料这只 600519.SH 的 63 日滚动 夏普比率 (Sharpe ratio)样本期均值是 0.86,银行那两只 000001.SZ 和 600036.SH 是 0.42。0.44 的差,可信吗?」你脑子里第一反应是 3.2.2 L5 那...
打开 →周三午后,浦东陆家嘴一家中型私募的研究台上,PM 把一张 252 天的样本期跑出来推过来:「 600519.SH 对沪深300 ETF( 510300.SH )的 beta 我刚才用 np.linalg.lstsq 解出来是 0.91——但 0.91 离 1 到底有多远?是抽样噪音里飘出来的一格,还是这只票就比沪深300 系统性低 beta?」3.2.1 L...
打开 →你买入一张执行价 40、权利金 3 的看跌期权。求到期盈亏平衡价,以及该头寸可能的最大利润。
打开 →做市商希望在一个交易时段内赚取至少 5.0 的总净边际,预计恰好成交 250 次。每次成交赚 (h - 损失),逆向选择损失为 0.008,并假设在相关区间内成交次数与半边价差无关。满足目标的最小半边价差是多少?
打开 →周一上午十点,浦东一家中型私募的研究台。PM 把 3.2.2 L5 那张已经稳定跑通的 tear sheet 推过来,篮子是 、252 个交易日的 NumPy 收益矩阵 returns ,形状 公式。「我现在不要单只票的 alpha 也不要 Sharpe——给我四个数:第一,这只 3 票篮子的 最小方差 长仓权重;第二,顶端主成分占多少方差,看篮子风...
打开 →你以 100 持有股票,买入执行价 90、权利金 4 的看跌期权,并卖出执行价 115、权利金 3 的看涨期权。求该领口策略到期的净权利金支出、最大利润和最大亏损。
打开 →假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少?
打开 →钩子:五十条弱 alpha 与一个总组合 你在一家中证500 中频量化私募(private fund)工作。研究团队在过去六个月里训练出了五十条独立的 ML alpha:有用 LightGBM 在 沪深300 / 中证500 因子风格暴露上做次日 alpha 的,有 1 D CNN 在分钟线上做日内动量(momentum)的,有 Transformer 在卖...
打开 →为什么组合式路径验证能改善稳健性检验,但仍无法彻底解决研究者在看到旧结果后继续发明新点子的过拟合问题?
打开 →为什么研究者在想法迭代过程中反复查看最终留出集后,它就失去了原本的证据价值?
打开 →为什么在回测热图里,一大片都不错的参数平台,往往比一个非常尖锐的最优点更有说服力?
打开 →为什么在看过回测表现之后再去调整滑点曲线、费用表或融券假设,也算额外的模型搜索?
打开 →为什么即使所有候选策略都很平庸,按样本内 Sharpe 最高者来选,也会系统性地把被选中的策略往上偏?
打开 →为什么一个声称自己只测试过 5 个“命名策略”的团队,实际搜索深度仍可能远远大于 5?
打开 →为什么在看完整段历史权益曲线之后再去选止损阈值,应该被视为回测搜索,而不是单纯的风控卫生?
打开 →为什么一段前向纸上交易期,有时会比在历史样本里再挤出一个更花哨的切片更有证据价值?
打开 →