log-cosh 损失的凸性 4
证明 ell(r)=ln cosh(r) 关于残差 r 是凸函数。
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions证明 ell(r)=ln cosh(r) 关于残差 r 是凸函数。
打开 →对 pinball 损失 rho_tau(r)=tau r(当 r>=0)且 (tau-1)r(当 r<0),在 r=0 处的次梯度集合是什么?
打开 →对 pseudo-Huber 损失 ell(r)=delta^2(sqrt(1+(r/delta)^2)-1),推导 d ell / d r。
打开 →某位分析师先验上有 0.3 的概率是高级分析师,否则是初级分析师。高级分析师对每天一个二元市场方向的判断正确率是 0.8,初级分析师是 0.6。现在连续两天观察到这位分析师恰好一次判断正确、一次判断错误。求其是高级分析师的后验概率。
打开 →两个候选模型本来很接近。研究员不断微调随机种子和预处理,直到其中一个在同一份验证切片上胜出。为什么这个看起来的胜利应该打折看待?
打开 →使用 delta = 1 的 Huber 损失,计算残差 0.5、-1.2、3.0 的总损失。
打开 →3 个独立训练的模型方差都为 1.8,且偏差可以忽略。它们等权平均后的方差是多少?
打开 →某公司从三家供应商采购零件:$S_1$(占 50%,不良率 2%)、$S_2$(占 30%,不良率 3%)、$S_3$(占 20%,不良率 5%)。随机抽取一个零件,经两道独立检测。第一道检出不良品的概率为 0.8,误报良品的概率为 0.05;第二道检出不良品的概率为 0.9,误报良品的概率为 0.03。若该零件被两道检测同时标记为不良,求: (a) 该零件确实是不良品的概率。 (b) 在已知该零件确实是不良品且被两道检测标记的条件下,它来自 $S_3$ 的概率。
打开 →某笔交易来自来源 A、B、C 的先验概率分别是 1/2、1/3、1/6。它们触发告警的概率分别为 0.2、0.4、0.8。在已经告警的条件下,被清除的概率分别是 0.9、0.6、0.25。若现在观察到“先告警、后未通过清除”,则该交易来自来源 C 的后验概率是多少?
打开 →一位组合经理将市场建模为三种等概率的状态之一: - **牛市**:每天上涨概率 $\frac{4}{5}$。 - **中性**:上涨概率 $\frac{1}{2}$。 - **熊市**:上涨概率 $\frac{1}{5}$。 给定状态后各天独立。三天内股票分别:涨、涨、跌。 (a) 求各状态的后验概率。 (b) 求第四天上涨的条件概率。
打开 →设 $\Omega = \{1,2,\ldots,8\}$,等概率。定义事件: $$A = \{1,2,3,4\}, \quad B = \{1,2,3,5\}, \quad C = \{1,4,6,7\}.$$ (a) 证明 $P(A \cap B \cap C) = P(A)P(B)P(C)$。(b) 检验每一对 $(A,B)$、$(A,C)$、$(B,C)$ 是否独立。(c) 这对三重乘积条件和两两独立之间的关系说明了什么?
打开 →一次假阴性的代价是 5,一次假阳性的代价是 1。若 p 是正类的预测概率,那么当 p 高于什么阈值时,应把样本判成正类?
打开 →有人辩称不存在泄漏,因为代码从未访问测试标签。给出这个辩护在真实机器学习流水线里为什么会失效的核心原因。
打开 →设 $A$、$B$、$C$ 为事件。(a) 证明:若 $A$、$B$、$C$ 相互独立,则 $A$ 与 $B \cap C^c$ 独立。(b) 设 $\Omega = \{1,2,3,4\}$,等概率,$A = \{1,2\}$,$B = \{1,3\}$,$C = \{1,4\}$。验证 $A$、$B$、$C$ 两两独立但非相互独立。(c) 计算 $P(A \cap (B \cap C^c))$ 和 $P(A) \cdot P(B \cap C^c)$。$A \perp\!\!\perp (B \cap C^c)$ 是否成立?
打开 →设 $A$ 为概率空间中的事件。(a) 写出独立性条件 $P(A \cap A) = P(A) \cdot P(A)$,推导满足条件的 $P(A)$ 值。(b) 在 $\Omega = \{1,2,3,4\}$(等概率)上,分别对 $A = \{1\}$、$A = \{1,2\}$、$A = \emptyset$、$A = \Omega$ 验证你的结论。(c) 从概率意义上解释:一个事件与自身独立意味着什么?
打开 →设 $\Omega$ 为所有含偶数个 $1$ 的长度为 $4$ 的二进制串,等概率: $$\Omega = \{0000,\, 0011,\, 0101,\, 0110,\, 1001,\, 1010,\, 1100,\, 1111\}.$$ 定义事件 $A_i = \{\omega \in \Omega : \omega_i = 1\}$,$i=1,2,3,4$。 (a) 证明每个 $P(A_i) = 1/2$。 (b) 验证所有两两独立:对所有 $i \neq j$,$P(A_i \cap A_j) = 1/4$。 (c) 验证所有三元独立:对
打开 →设样本空间 $\Omega = \{1, 2, 3, 4\}$,等概率 $P(\{i\}) = 1/4$。定义 $A = \{1, 2\}$,$B = \{1, 3\}$,$C = \{1, 4\}$。证明 $A$、$B$、$C$ 两两独立但非相互独立。
打开 →某事件确实发生了(y=1)。预测 A 给出概率 0.9,预测 B 给出概率 0.7。B 的对数损失比 A 大多少?
打开 →某分析师是高能力分析师的先验概率为 2/5。高能力分析师每次预测正确的概率为 4/5,低能力分析师则为 11/20。若两次独立预测都正确,求该分析师是高能力分析师的后验概率。
打开 →一个隐藏盒子等概率是 A 或 B。盒子 A 抽到红球的概率是 4/5,盒子 B 则是 1/3。独立有放回抽两次,结果都为红。求盒子是 A 的后验概率。
打开 →模型 A 的额外测试 MSE 是 0.04 + 18/n,而模型 B 的额外测试 MSE 是 0.16 + 4/n,其中 n 是样本量。它们在什么样本量下打平?
打开 →第一轮从 $\{1, 2, 3, 4\}$ 中独立等概率有放回抽取 3 个数;第二轮从 $\{3, 4, 5, 6\}$ 中独立等概率有放回抽取 2 个数。两个取值池在 $\{3, 4\}$ 处重叠。在全部 5 次抽取中,求 $P(\text{恰好有一个值出现多于一次,且该值恰好出现两次})$。用最简分数表示。
打开 →某候选人属于顶级档的先验概率是 1/4。顶级候选人每轮筛选通过概率为 9/10,非顶级候选人每轮通过概率为 3/5。若该候选人独立地通过了两轮筛选,求其属于顶级档的后验概率。
打开 →一笔贷款先验上有 0.3 的概率是坏账。筛查 A 对坏账的命中率是 0.8,对健康贷款的误报率是 0.1。任何被 A 标记的贷款都会再进入筛查 B;B 对坏账的通过率是 0.25,对健康贷款的通过率是 0.70。若现在观察到“被 A 标记、但未通过 B”,这笔贷款是坏账的后验概率是多少?
打开 →一个负载均衡器将 4 个独立作业分配给 3 台服务器 $\{S_1, S_2, S_3\}$。服务器 $S_1$ 已预先分配了一个作业。每个新作业的路由分两阶段进行:先抛一枚 $P(\text{正面}) = \tfrac{1}{2}$ 的硬币;若正面则分配到 $S_1$,若反面则等概率分配到 $S_2$ 或 $S_3$(即 $P(S_2) = P(S_3) = \tfrac{1}{4}$)。如果某台服务器承载 4 个或更多作业($S_1$ 需计入预分配的那个),则称其「过载」。构造 4 个路由结果的样本空间,并求 $P(\text{至少一台服务器过载})
打开 →为什么 bagging 通常被描述为降方差工具,而不是降偏差工具?
打开 →为什么 Huber 损失常被描述为“介于平方损失和绝对损失之间”?
打开 →为什么交易台可能更偏好一个略有偏差、但行为稳定的模型,而不是一个偏差更低、却在每次重训之间剧烈波动的模型?
打开 →为什么即使偏差和方差看起来都已经很小,模型改进仍可能停滞?
打开 →为什么不对称损失通常会让最优常数预测偏离目标分布的均值?
打开 →