Tick 数据工程与清洗
某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 9 个结果
中文题目某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →周二上午 11:14,某沪上 私募 量化 团队的研究员刚跑完 沪深300 ETF(510300)上 5 秒级订单流信号的回测:样本内 Sharpe 5.2,样本外 Sharpe 4.8。基金经理盯着权益曲线只问一句:「上规模交易会发生什么?」研究员不知道——回测假设每一笔成交都按中价(mid)拿到、零市场冲击。在 200,000 份的元订单(metaorde...
打开 →某私募在 CFFEX 张江 COLO 机房的交易负责人 09:45 巡视交易室,向策略组长问一个问题:"如果我们做沪深300 ETF 510300.SH 的 mean reversion on mid 机器人因为 mid 算错而开始按 0.01 元发买单,它怎么在监管层来电话之前自己停下?"答案不在策略本身,而在策略外面的框架。每张订单到达 FIX 会话之前...
打开 →周一上午 09:24,深圳某私募的执行交易员盯着屏幕:客户要在开盘后 15 分钟内卖出 80 万股某创业板个股。她可以挂限价单进集合竞价、把单子拆给五档即时成交剩余撤销、或者等连续竞价开盘冲一把市价。挑哪一个不是「凭感觉」,而取决于交易日规则、订单簿状态、以及包括 0.05% 印花税(stamp duty, 印花税)在内的全部显性成本。本课把这套规则拆开。 ...
打开 →某 CFFEX 张江 COLO 机房里,一位延迟工程师在 SSE Level 2 行情上跑 tcpdump ,问你:一个 09:30:00.000001234 时刻穿过交换机的报文,为什么 09:30:00.000004718 才到达策略线程?这 3.5 µs 就是 L1 委托簿能消费的预算上限——而其中大部分都付给了线路到委托簿之间这一层:行情处理器。本课...
打开 →周一早盘,某上海私募的量化研究员盯着屏幕:你昨天回测的沪深300日线截面动量因子,年化收益比上周报表显示的低了 280bp。同样的标的池、同样的回看窗口、同样的代码——但 bug 不在信号里,而在数据里。供应商的「复权收盘价」字段在隔夜悄悄又重算了一轮分红复权(back adjustment),你的损益列于是双重计入了复权调整。本课要交给你的,就是看 5 分...
打开 →某 HFT 私募的低延迟负责人在周五下午走进工程间,对写出 L1 / L2 / L3 这套交易二进制的团队问一个问题:"开发机上跑得对。现在要把它放到 CFFEX 张江 COLO 撮合引擎旁边的机柜里,并对交易桌承诺端到端 P99.9 在 3 µs 以下,还要做哪些事?"这段从「能编译」到「桌子敢用」的差距,就是部署故事。四层一起出力:编译标志(PGO + ...
打开 →某 HFT 私募在 CFFEX 张江 COLO 机房的市场数据组长,把你叫到白板前,09:25 开盘前问一个问题:沪深300 ETF(510300.SH)的委托簿在线路上和内存里到底应该怎么存,才能让 SSE 推送的二级行情每秒 20 万条增量消息全部落本,同时热路径上一次 malloc 都不调?你在白板上画出的那张结构图,就是这家私募所有市场数据系统、撮合...
打开 →周三上午 9:47,某沪上 私募 的执行交易员告诉你:你在沪深300 ETF(510300)上挂的那笔 4.130 元、10000 份的买入限价委托已经躺了 10 分钟没成交,明明屏幕上的 BBO 在这十分钟里触碰 4.130 元至少一打次。他想知道为什么。答案在 L1 报价下面那一层——委托簿(order book)本身。4.130 元上排在你前面的是 1...
打开 →