INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 811

第 21 / 41 页

非代码面试题

显示 20 / 811 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4261为什么不同量纲下先标准化 21当原始变量的量纲差异很大时，为什么在 PCA 之前通常要先做标准化？机器学习中等essay未尝试面试订阅 4262为什么 Whitening 可能放大噪声为什么过度 whitening 可能让下游模型在数值上更嘈杂？机器学习中等essay未尝试面试订阅 4263为什么主成分符号翻转不影响本质 22为什么把主成分载荷向量整体乘以 -1，并不会改变 PCA 解的本质？机器学习中等essay未尝试面试订阅 4264什么时候 PCA 会有害什么时候 PCA 反而可能伤害预测流程？机器学习中等essay未尝试面试订阅 4265为什么第一主成分不一定最会预测 23为什么第一主成分即使解释了最多方差，也不一定最适合拿来预测标签？机器学习中等essay未尝试面试订阅 4266轮廓系数 1某个点的簇内平均距离 a=2，到最近其他簇的平均距离 b=5。它的轮廓系数是多少？机器学习简单数值题未尝试面试订阅 4267一维簇的质心更新 2一个一维簇当前包含点 [1,2,7]。在 k-means 的更新步骤里，这个簇的新质心是多少？机器学习简单数值题未尝试面试订阅 4268二维簇的质心更新 3一个二维簇包含点 (0,0)、(2,4) 和 (4,2)。在 k-means 中，这个簇的新质心是多少？机器学习简单数值题未尝试面试订阅 4269GMM 责任度 4一个两成分 GMM 的先验概率分别是 0.6 和 0.4。在点 x 上，两个成分的似然分别为 0.1 和 0.3。第二个成分的后验责任度是多少？机器学习简单数值题未尝试面试订阅 4270DBSCAN 核心点判断 5某次 DBSCAN 使用 minPts=5，并且把点自身也算作邻居。某个点在 eps 半径内一共有 5 个邻居。它是不是核心点？机器学习简单数值题未尝试面试订阅 4281single linkage 的第一步 16对一维点集 0,1,4 做 single-linkage 层次聚类，第一步会先合并哪一对？机器学习中等数值题未尝试面试订阅 4282DBSCAN 的边界点判断 17在 minPts=4 的 DBSCAN 里，点 A 有 4 个邻居，点 B 有 3 个邻居，并且 B 落在 A 的 eps 邻域中。那么 B 的状态是什么？机器学习中等数值题未尝试面试订阅 4283二维 k-means 的分配 18某次二维 k-means 的质心在 (0,0) 和 (4,0)。对于点 x=(1,2)，在分配步骤里它离哪个质心更近？机器学习中等数值题未尝试面试订阅 4284GMM 的第一次 E 步 19在一个先验相等的两成分 GMM 中，样本 x 在两个成分下的密度分别是 0.12 和 0.08。第一次 E 步里，哪个成分会得到更高的责任度？机器学习中等数值题未尝试面试订阅 4285Ward linkage 的第一步 20簇 A 的大小是 3、均值是 0；簇 B 的大小是 1、均值是 2；簇 C 的大小是 1、均值是 5。采用 Ward linkage 时，A-B 和 B-C 哪一对会先合并？机器学习中等数值题未尝试面试订阅 4286非凸簇加噪声先试什么 21如果你预期数据里是弯月形这类非凸簇，而且还混有一些噪声点，通常会先试 k-means 还是 DBSCAN？为什么？机器学习中等essay未尝试面试订阅 4287为什么尺度失衡会伤害 k-means 22为什么当某个特征的尺度明显大于其他特征时，k-means 往往会表现很差？机器学习中等essay未尝试面试订阅 4288为什么 silhouette 可能偏向更小的 k 23为什么即使更大的 k 能继续降低 SSE，silhouette score 也可能仍然偏向更小的 k？机器学习中等essay未尝试面试订阅 4289为什么直接聚类价格水平会误导 24为什么把股票的原始价格水平直接拿来聚类，往往不如聚类标准化后的收益或特征更合理？机器学习中等essay未尝试面试订阅 4290为什么随机种子会影响聚类结果 25为什么即使数据集不变，聚类结果也可能会随着随机种子的不同而变化很大？机器学习中等essay未尝试面试订阅