Pandas
python · pandas · series · dataframe · loc-iloc · indexing · io · csv
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 29 个结果
中文题目python · pandas · series · dataframe · loc-iloc · indexing · io · csv
打开 →周一上午 9 点 40 分,浦东陆家嘴一家中型私募的研究台。PM 转过头来:「上周那个 A 股小篮子—— 600519.SH 、 000001.SZ 、 600036.SH ——把 2024 年全年的因子摘要(tear sheet)给我,按申万一级行业把夏普汇总一下,下午三点的月会要用。」你看了一眼磁盘:L4 那道时间序列流水线吐出的 closes.parq...
打开 →周二上午 9 点半,上证刚开盘。你坐在一家中型私募的研究台,手边是一段从 3.2.1 留下的 NumPy 代码:一个 (T, N) 的日对数收益矩阵, T = 244 , N = 3 ,列依次是 510300.SH、600519.SH、000001.SZ。你想把 600519.SH 在 2024 02 08(春节休市前最后一个交易日)这天的收益单独捞出来——...
打开 →周二下午两点,私募研究台。你手里堆着三张表:一张是 20 个交易日 × 3 只票( 600519.SH 、 000001.SZ 、 600036.SH )的长格式日收益,共 60 行 (date, ticker, return) ;一张是申万一级行业查找表( 600519.SH → 食品饮料 、 000001.SZ → 银行 、 600036.SH → 银行...
打开 →周一早晨九点,你在一家私募的研究台上收到上游数据团队推过来的 510300 2024.csv ——沪深300 ETF 在 2024 年 1 月的日线行情。你打算直接 df = pd.read csv(path) 然后开始写信号,结果跑出来的 DataFrame 漏洞密布: close 列的 dtype 是 object 而不是 float64 (因为有三行写...
打开 →下午两点,私募研究台。你拉到一份 510300.SH(沪深300 ETF)近 10 个 SSE 交易日的分钟 bar,存储里的时间戳是 UTC,列只有 price (这一分钟末的成交价)与 volume (这一分钟的成交股数)。任务很短:把它降到日 bar,算每天的简单收益(simple return)与 5 日年化滚动波动(rolling annualiz...
打开 →NumPy · Pandas · SciPy/sklearn · 合成市场数据
打开 →周一早盘前,你接手了一笔策略回测:沪深300 ETF(510300.SH)一年的日线,要算每日对数收益率(daily log return)。上一课你已经能把 CSV 流过来、用生成器逐行解析、再用 dataclass 装好。可一旦真要算数,你写下的还是那段熟悉的循环: 十二行能写完,对一年 252 个交易日尚可。可同样一段逻辑会出现在每一份回测脚本里——一...
打开 →周二下午两点,某上海私募的股票池经理把你叫到工位前:要 600519.SH 对沪深300 ETF(510300.SH)的市场 β,日简单收益(daily simple return),近252个交易日窗口,今晚9点前要见。教科书答案一行就能解决: beta = Cov(r stock, r mkt) / Var(r mkt) 。工程答案稍长:把 [1, r ...
打开 →周三上午十点,一家私募的研究员把上一课写好的 (252, 3) 沪深300 成分股日收益矩阵 returns 甩进 Jupyter,敲下 returns.mean() ,得到一个标量 0.00042 。他把这个数贴进周报,标题写「样本期内组合日均收益约 4 个基点」——这句话有问题。 returns.mean() 在没有 axis 参数时会把整个矩阵展平成一...
打开 →某家私募的因子研究员要演示一个多因子打分模型,需要 200 家"虚拟公司"的横截面:每家要有行业、市值、贝塔、价值/动量/质量三个因子分,且这些字段之间的相关结构得接近真实 A 股名单。另一边,执行成本组要演示成本拆解,需要一段带买卖价差与成交大小的合成 tick 流。两段需求都不能动行情数据牌照——上一课只能产价格路径,这一课要把它扩成横截面与微观结构。本...
打开 →中信建投自营 IT 团队的同事把一份 C 的期权定价库 libquant pricer.so 扔到你桌上。"我们这套是十几年前用 C 写的,封装了 Abramowitz Stegun 7.1.26 标准正态 CDF 近似;你的 Rust 引擎要在中证 510300 期权上调它,先别想着重写。"——这就是 2026 年量化 Rust 开发者面对的现实: 没...
打开 →Hook 周一下午四点收盘后,私募研究服务器上挂着两份待跑的任务:先把 100 只沪深300 成分股最近 30 个交易日的日线从米筐风格接口同步下来,再用 100 万条蒙特卡洛路径给一张 510300.SH 看涨期权定价。一颗八核 CPU 跑了二十多分钟,T+1 风控报表迟迟出不来。问题不在算法,在于代码全程单线程。这两份任务该交给的并发原语其实不同:线程池...
打开 →某私募的固定收益研究员要把过去三个月的 10 年期中国国债收益率拉成时间序列,放进久期模型的样本。AKShare 的公开接口 ak.bond china yield 不要 token、本地能跑、数据按日更新——但研究 notebook 一旦在用户面前演示时撞上 429,整场会议就要等十分钟手动 retry。本课把 AKShare 调用包成一个 fetch y...
打开 →某私募的研究员把一个 Jupyter notebook 推过来:他们在沪深300成份股上扫了 500 万个 (S, K, σ, t) 参数组合,目标是给隐含波动率曲面拟合做敏感度分析。纯 Python + scipy.stats.norm.cdf 跑了 47 分钟,他要的是把这一步压到 5 分钟以内,但策略迭代仍然由他在 notebook 里驱动——研究员不...
打开 →周三晚上九点,你在一家上海私募的策略组里,把白天调好的 A 股因子算子打包发给同事,让他在另一台机器上跑同样的回测。他 git clone 完,进到目录里直接 python main.py ,立刻就崩了: ModuleNotFoundError: No module named 'xyzprice' 。你叫他先 cd src && python main.p...
打开 →周一开盘前一刻钟,你在私募的研究服务器上 merge 了一段对 mean price 的「无害重构」——只是把 sum(...) / len(...) 拆成两步,方便在中间加日志。脚本照常跑完,回测照常出图。下午两点你才发现 PnL 报表上 XYZ001.SH 的当日均价对不上:你在重构时把 sum 与 len 的参数搞反了,函数对所有非空输入都返回 1 。...
打开 →周三下午两点。一家 A 股 私募 的资深同事打开你的 MR,标题是 feat(risk): 添加 沪深300 因子 z 列至业绩归因 。改了 12 个文件。二十秒之内审查线上铺满了「文件末尾多一个空行」「这个 import 没用到」「第 47 行行尾有空白」「import 没排序」之类的评论。你能感到审查时间正在漏走——这些评论没一条是关于你因子逻辑对不对的...
打开 →某 私募 的研究员对两位同事说:"做一个 五日 动量,行业中性化,跑在 沪深300 的大盘股上。"一周以后,三个人各自实现了完全不同的东西。同事 A 用的是连续 五日 收益率 close t / close 1 ;同事 B 用的是 五日 均线穿越 MA 5 / MA 20 ;同事 C 用的是 五日 对数收益累加 sum(log(close t / close...
打开 →周三下午,你在上海的一家 量化 私募。L1 走通了 12 1 动量 的 IC 与 IR 报告,头条 数字 是 月度 rank IC ≈ 0.03、 IR ≈ 0.5。 在 投决会 上 提交 前,合规 与 交易 部门 同时 提了 三 个 问题:这个 IC 在 多 长 视界 上 仍然 有效? 月度 跑 一遍 会 产生 多大 换手率? 等到 私募 规模 上到 5 ...
打开 →周二上午十一点。你的分支 feature/risk factor z 在本地终于跑通——沪深300 因子归因回测 Sharpe 三位小数都对上了审查者期望。你 git push ,在内网 GitLab 开了 MR,一小时内审查者要求改两处,并指出你的分支已落后 main 四个提交,因为同事刚合了另一个修同模块的 MR。第 1 课教你在一台机器上操作 git;...
打开 →某周二,上海某 量化 私募 的策略评审会上。一位 研究员 把 5 日 动量 信号 的回测报告投到屏幕上:在 沪深300 ETF 510300 上从 2014 01 01 到 2023 12 31 的回测,扣费后年化 夏普比率 1.8。曲线穿过 2015 股灾、穿过 2018 中美贸易摩擦、穿过 2022 疫情 + 房地产 双杀,姿态优雅。投资 决策 委员会 ...
打开 →周日晚上 11 点的消息 某私募的中后台周日晚上甩来一条消息:风控组明早要用你写的 summarise.py 跑一份沪深300成分股的 tick 滚动 VWAP,他们那台服务器装的是干净的 Python 3.11、没装你电脑上的任何包。你抓起脚本一看,它现在还是 notebook 里那个用 print 打日志、入口写在最后一格、依赖装在 /anaconda3...
打开 →周三晚上 11 点,你在某 私募 量化组里维护着一个内部小包 xyzprice :封装 涨跌停 价计算、复权因子拼接、T+1 持仓核算这三件每周都要做的事。组里另外两位 PM 想直接 pip install xyzprice 就能用,而不是每次复制粘贴你脚本里那几个函数。 pyproject.toml 已经写好,pytest 测试全绿——下一步只剩四件事:构...
打开 →一位 五十亿 规模 私募 多 策略 基金 的 初级 研究员 周四 下午 走 进 代码 评审 室,端 着 一 个 看 起来 像 大 胜 的 信号 —— 中证 500 上 的 5 日 反转 策略,夏普 2.8,最 大 回撤 4%,2014 2023 年 区间 上 的 净 值 曲线 漂亮 得 不 像 话。资深 研究员 翻 着 notebook,问 了 一 个 问题...
打开 →周四早上,你在上海的一家 量化 私募 的 因子 评估 会 上。 桌面 上 堆 着 K 条 信号 的 L1 + L2 诊断 包: 12 1 动量、 账面市值比、 毛利率 质量、 PEAD (post earnings announcement drift) ——每 一条 都 通过 了 L2 的 break even IC 门槛、 每 一条 月度 IC 都 在 ...
打开 →一位 私募 量化 团队 的 资深 研究员 在 原 研究 PR 上 线 半 年 之后 把 报告 递 给 一 位 初级 队友。"重新 跑 一 遍。基金 经理 在 问 这 个 信号 在 2024 年 数据 上 是否 还 work。" 初级 从 共享 盘 拉 出 notebook 打 开,第一 个 错误 立 刻 撞 上 来: ImportError: cannot ...
打开 →某 HFT 私募的低延迟负责人在周五下午走进工程间,对写出 L1 / L2 / L3 这套交易二进制的团队问一个问题:"开发机上跑得对。现在要把它放到 CFFEX 张江 COLO 撮合引擎旁边的机柜里,并对交易桌承诺端到端 P99.9 在 3 µs 以下,还要做哪些事?"这段从「能编译」到「桌子敢用」的差距,就是部署故事。四层一起出力:编译标志(PGO + ...
打开 →某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...
打开 →