为什么凸性会让 KKT 特别有力
为什么在很多凸优化问题里,KKT 条件不只是必要条件,而且也是充分条件?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions为什么在很多凸优化问题里,KKT 条件不只是必要条件,而且也是充分条件?
打开 →请给出一个原因,说明在非凸问题里只解 KKT 方程为什么可能找不到全局最优。
打开 →开篇场景(Hook):PM 真正想要的那个数 上海一家中型私募的 PM 周一早盘正在跟风控拉锯:当前组合的总杠杆(gross leverage)顶在 200% 的合规上限,他想申请抬到 220%。风控的问题不是「能不能」,而是「值不值」——多 20 个百分点能换多少边际信息比率(marginal information ratio)?答案其实早就躺在凸求解器...
打开 →最小化 $1x^2+3y^2$,约束为 $x+y\ge 4$。求 $(x^*,y^*)$ 以及 KKT 乘子。
打开 →在应用 KKT 时,为什么 Slater 条件这类正则性条件很重要?
打开 →最小化 $(x-2)^2$,约束为 $x\ge 0$。使用 KKT 形式 $g(x)=0-x\le 0$,求最优解 $x^*$ 与最优乘子 $\lambda$。
打开 →凸优化 · KKT · 梯度下降 · 组合约束优化
打开 →考虑最小化 $(x-1)^2+(y-1)^2$,约束为 $x+y\ge 1$。在最优点处,不等式是激活还是不激活?KKT 对乘子 $\lambda$ 有什么结论?
打开 →考虑最小化 $(x-2)^2+(y--1)^2$,约束为 $x+y\ge 0$。在最优点处,不等式是激活还是不激活?KKT 对乘子 $\lambda$ 有什么结论?
打开 →最小化 $(x--2)^2$,约束为 $x\ge -1$。使用 KKT 形式 $g(x)=-1-x\le 0$,求最优解 $x^*$ 与最优乘子 $\lambda$。
打开 →考虑最小化 $(x--1)^2+(y-3)^2$,约束为 $x+y\ge 1$。在最优点处,不等式是激活还是不激活?KKT 对乘子 $\lambda$ 有什么结论?
打开 →最小化 $x^2+y^2$,约束为 $x+y\ge 1$。对不等式 $g(x,y)=1-x-y\le 0$,求 $(x^*,y^*)$ 与最优 KKT 乘子。
打开 →某沪深300指增公募的高级量化研究员,把 4.4.1 的均值方差闭式解 w = (1/gamma) Sigma^ (mu lambda 1) 直接套到她管理的 30 只 CSI 300 成分股核心仓上。闭式解给出的结果:招商银行 600036 做空 300%、宁德时代 300750 多头 +250%、组合 78% 的仓位扎堆在前三只动量名上。她的产品合同写得...
打开 →开篇场景(Hook):一位 PM 的两份委托书 周一上午,你在一家 沪深300 指数增强 私募 基金的研究台收到两份新增的客户委托书。第一份要求满仓多头、公式、公式、行业偏离度上限 ±3%(一组线性不等式)——干净的二次规划(quadratic program, QP):二次目标 + 仿射约束,求解器十秒出结果。第二份加了一句「持仓数不得超过 50 只」,可...
打开 →周五下午三点,你在某 公募 基金管理一只 沪深300 指数增强(CSI 300 enhanced index)产品。当前基金合同把年化 跟踪误差(tracking error)上限设在 300 bp。求解器把当日再平衡的解返回过来——主仓位都合理,但对偶价格表里 跟踪误差 约束的乘子写着 公式 bp。翻译成 PM 听得懂的语言:若把上限从 300 bp 放到...
打开 →两个特征几乎重复,但在经济上都很有意义。为什么 Elastic Net 在这种情况下常常比纯 Lasso 表现更好?
打开 →为什么 ridge 与 lasso 在正则化参数设为零时都会退化成 OLS?
打开 →一个标准化 lasso 拟合的得分向量是 (4.1, 2.3, 1.7)。使所有系数都恰好变成 0 的最小 lambda 是多少?
打开 →在正交设计下的一步 lasso 更新中,某坐标的得分是 z = -3.2,惩罚参数 lambda = 0.7。软阈值之后的系数是多少?
打开 →在线性模型的高斯噪声设定下,给 beta 施加什么样的高斯先验会让 ridge 成为 MAP 估计?
打开 →为什么 ridge 解的范数通常会随着 lambda 增大而下降?
打开 →为什么实践中在选择正则化参数时,很多人会偏好 one-standard-error rule,而不是直接选交叉验证误差最小的那个点?
打开 →为什么很小的 lambda 会让正则化解贴近 OLS?
打开 →开篇场景(Hook):基数约束如何把 MVO 从 QP 推到 MIP 周二下午,你在一家百亿规模的私募(private fund)量化部门里,给沪深300 成分股做一只全仓做多组合。脚本是教科书版本的均值方差优化(mean variance optimization, MVO):最小化 公式,约束 公式、公式。CVXPY 在 80ms 内返回全局最优。你顺手...
打开 →为什么最优乘子常被解释为放松或收紧约束时的边际价值?
打开 →向 PM 用直白语言解释 complementary slackness,可以把约束理解成稀缺资源配额。
打开 →在一个正交坐标里,若 z = 7,什么样的最小 lambda 会把 lasso 系数压成零?
打开 →在正交单特征情形下,若 z = x^T y,为什么 ridge 对所有 lambda >= 0 都会保留 z 的符号?
打开 →若 ridge 在 R^p 中的最优解是 beta_hat_lambda,那么什么样的半径 t 会让它同时解出约束问题 min RSS(beta) subject to ||beta||_2 <= t?
打开 →在正交坐标里,ridge 会用 d/(d+lambda) 的比例收缩 beta_ols。若目标收缩比例是 r in (0,1),lambda 应是多少?
打开 →