第 23 / 32 页
非代码面试题
显示 20 / 622 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4321流式订单流局部模式你需要对实时订单流做毫秒级延迟预测。大部分有用结构都来自最近 20 到 40 个事件中的局部模式,而且模型必须在线更新,不能等整块数据。哪一类架构应当作为你的第一版 baseline?机器学习中等essay未尝试面试订阅4322在线状态型序列模型必须逐 tick 处理无限长事件流,并维护一个可持续更新的紧凑隐藏状态,不能反复回看历史输入。哪一类架构最自然契合这个要求?机器学习中等essay未尝试面试订阅4323长上下文离线交互你在做一个离线 4000 token 文档模型,答案经常依赖于跨很远段落的短语匹配。此时延迟不如长程交互建模重要。哪种架构应该成为首选?机器学习中等essay未尝试面试订阅4324小样本局部平稳你只有有限标注数据,而目标主要取决于二维信号图中的局部平移等变模式。哪类架构通常能提供最强的内建归纳偏置?机器学习中等essay未尝试面试订阅4325稀少但关键的全局联系一个序列问题大部分时候只有局部结构,但有一小部分标签会因为相隔数百步的位置之间的相互作用而翻转,而漏掉这类依赖的代价非常高。你更该偏向哪类架构?机器学习中等essay未尝试面试订阅4326序列长度翻倍的成本冲击一个局部 CNN 的交互规模约为 7L,而一个 Transformer 注意力块的分数对规模约为 L 2。若 L 从 256 翻倍到 512,两者的交互数量分别增长多少倍?哪类架构碰到更陡的扩展墙?机器学习中等essay未尝试面试订阅4327更长依赖所需的 CNN 深度一个 stride=1、kernel size=3、无 dilation 的 CNN,要覆盖 9 步依赖需要 4 层。如果所需依赖范围升到 41 步,需要多少层?这说明了什么结构压力?机器学习中等essay未尝试面试订阅4328小样本制度切换假设任务仍然强烈依赖局部且具有平移等变性,但你的标注数据量缩小到原来的十分之一。哪类架构会变得更有吸引力?为什么数据制度的变化会影响这个选择?机器学习中等essay未尝试面试订阅4329延迟预算放松一个任务原先必须完全在线处理,因此递归或因果卷积更合适。若部署方式改成离线批量打分,整段序列都可一次性获得,哪类架构会从这种放松中获益最大?机器学习中等essay未尝试面试订阅4330从局部结构变成全局结构一个预测问题原本只依赖短局部模式,但产品改版后,标签现在要看序列前四分之一和后四分之一信息是否匹配。哪类架构应当在备选排序中上升?机器学习中等essay未尝试面试订阅4331先量化什么在一个新序列任务上于 CNN、RNN 和 Transformer 之间做选择之前,最先应该量化哪两个结构量?机器学习中等essay未尝试面试订阅4332默认选 Transformer 之前同事因为上次 benchmark 是 Transformer 赢了,就想直接从 Transformer 开始。你最先应该反问什么?机器学习中等essay未尝试面试订阅4333在淘汰 RNN 之前在交易系统流水线里,为什么你不该轻易把 RNN 完全排除掉?机器学习中等essay未尝试面试订阅4334使用 CNN 之前在把 CNN 作为主要架构之前,你首先应该确认哪种结构性质?机器学习中等essay未尝试面试订阅4335混合结构思维如果你怀疑一个任务既有很强的局部模式,又有偶发的长距离依赖,那么在争论模型家族之前,你第一步应该做什么分解?机器学习中等essay未尝试面试订阅4336为什么 CNN 会赢为什么在一个小样本、标签主要取决于短局部模式的任务上,一个中等规模的 CNN 可能打败更大的 Transformer?机器学习中等essay未尝试面试订阅4337为什么 RNN 仍有价值为什么即使 Transformer 离线 benchmark 更强,生产里的事件流模型仍可能更适合用 RNN?机器学习中等essay未尝试面试订阅4338什么时候注意力值得其成本什么样的任务结构会让注意力的二次成本变得值得?机器学习中等essay未尝试面试订阅4339为什么结构错配很伤为什么在性能很差时,结构错配往往比参数量更致命?机器学习中等essay未尝试面试订阅4340混合结构还是纯结构什么时候比起坚持纯 CNN、纯 RNN 或纯 Transformer,更适合考虑混合架构?机器学习中等essay未尝试面试订阅