INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
811

21 / 41

非代码面试题

显示 20 / 811 道匹配题目

答题状态:未尝试未正确已正确
4261为什么不同量纲下先标准化 21当原始变量的量纲差异很大时,为什么在 PCA 之前通常要先做标准化?机器学习中等essay未尝试面试订阅4262为什么 Whitening 可能放大噪声为什么过度 whitening 可能让下游模型在数值上更嘈杂?机器学习中等essay未尝试面试订阅4263为什么主成分符号翻转不影响本质 22为什么把主成分载荷向量整体乘以 -1,并不会改变 PCA 解的本质?机器学习中等essay未尝试面试订阅4264什么时候 PCA 会有害什么时候 PCA 反而可能伤害预测流程?机器学习中等essay未尝试面试订阅4265为什么第一主成分不一定最会预测 23为什么第一主成分即使解释了最多方差,也不一定最适合拿来预测标签?机器学习中等essay未尝试面试订阅4266轮廓系数 1某个点的簇内平均距离 a=2,到最近其他簇的平均距离 b=5。它的轮廓系数是多少?机器学习简单数值题未尝试面试订阅4267一维簇的质心更新 2一个一维簇当前包含点 [1,2,7]。在 k-means 的更新步骤里,这个簇的新质心是多少?机器学习简单数值题未尝试面试订阅4268二维簇的质心更新 3一个二维簇包含点 (0,0)、(2,4) 和 (4,2)。在 k-means 中,这个簇的新质心是多少?机器学习简单数值题未尝试面试订阅4269GMM 责任度 4一个两成分 GMM 的先验概率分别是 0.6 和 0.4。在点 x 上,两个成分的似然分别为 0.1 和 0.3。第二个成分的后验责任度是多少?机器学习简单数值题未尝试面试订阅4270DBSCAN 核心点判断 5某次 DBSCAN 使用 minPts=5,并且把点自身也算作邻居。某个点在 eps 半径内一共有 5 个邻居。它是不是核心点?机器学习简单数值题未尝试面试订阅4281single linkage 的第一步 16对一维点集 0,1,4 做 single-linkage 层次聚类,第一步会先合并哪一对?机器学习中等数值题未尝试面试订阅4282DBSCAN 的边界点判断 17在 minPts=4 的 DBSCAN 里,点 A 有 4 个邻居,点 B 有 3 个邻居,并且 B 落在 A 的 eps 邻域中。那么 B 的状态是什么?机器学习中等数值题未尝试面试订阅4283二维 k-means 的分配 18某次二维 k-means 的质心在 (0,0) 和 (4,0)。对于点 x=(1,2),在分配步骤里它离哪个质心更近?机器学习中等数值题未尝试面试订阅4284GMM 的第一次 E 步 19在一个先验相等的两成分 GMM 中,样本 x 在两个成分下的密度分别是 0.12 和 0.08。第一次 E 步里,哪个成分会得到更高的责任度?机器学习中等数值题未尝试面试订阅4285Ward linkage 的第一步 20簇 A 的大小是 3、均值是 0;簇 B 的大小是 1、均值是 2;簇 C 的大小是 1、均值是 5。采用 Ward linkage 时,A-B 和 B-C 哪一对会先合并?机器学习中等数值题未尝试面试订阅4286非凸簇加噪声先试什么 21如果你预期数据里是弯月形这类非凸簇,而且还混有一些噪声点,通常会先试 k-means 还是 DBSCAN?为什么?机器学习中等essay未尝试面试订阅4287为什么尺度失衡会伤害 k-means 22为什么当某个特征的尺度明显大于其他特征时,k-means 往往会表现很差?机器学习中等essay未尝试面试订阅4288为什么 silhouette 可能偏向更小的 k 23为什么即使更大的 k 能继续降低 SSE,silhouette score 也可能仍然偏向更小的 k?机器学习中等essay未尝试面试订阅4289为什么直接聚类价格水平会误导 24为什么把股票的原始价格水平直接拿来聚类,往往不如聚类标准化后的收益或特征更合理?机器学习中等essay未尝试面试订阅4290为什么随机种子会影响聚类结果 25为什么即使数据集不变,聚类结果也可能会随着随机种子的不同而变化很大?机器学习中等essay未尝试面试订阅