第 17 课：在线学习与策略进化

目标：理解为什么静态模型必然衰退，掌握让策略持续进化的核心机制。

一个典型场景（示意）

注：以下为合成示例，用于说明常见现象；数字为示意，不对应任何具体个人/账户。

2018 年，一位量化交易者开发了一个基于随机森林的 A 股选股模型。回测年化 35%，夏普 1.8，各项指标优秀。

前 6 个月，模型表现稳定，与回测相符。然后，业绩开始缓慢下滑。不是突然失效，而是像温水煮青蛙——每个月少赚一点，回撤多一点。

12 个月后，年化收益从 35% 降到 8%，勉强跑赢指数。

他检查了代码，没有 bug。检查了数据，没有错误。模型完全按照设计运行，只是不再赚钱。

问题出在哪里？ 市场变了，但模型没变。2018 年初，市场由散户主导，动量因子有效。2018 年底，机构资金入场，动量因子被套利殆尽。模型学到的规律，是那个特定时期的规律，不是永恒的真理。

这就是概念漂移（Concept Drift）——模型学习的数据分布与实际交易的数据分布不再一致。不是模型错了，是世界变了。

17.1 为什么静态模型必然衰退

市场的非平稳性

金融市场有一个本质特征：非平稳性。这意味着：

统计特性会变化：均值、方差、相关性都不是常数
规律会失效：有效的 alpha 会被发现、套利、消失
参与者会适应：你的策略赚钱 → 别人模仿 → alpha 衰减

衰退类型	表现	原因	典型周期
突变型	某天突然失效	政策变化、黑天鹅事件	无法预测
渐变型	收益缓慢下降	Alpha 被套利、市场结构变化	6-18 个月
周期型	时好时坏	市场状态切换（牛熊转换）	与经济周期相关

纸上练习：计算 Alpha 衰减

场景：你的因子 IC = 0.05，假设市场效率提升导致 IC 每月衰减 5%。

计算：

月份    IC        预期年化（IC×√252×σ，假设σ=20%）
0      0.050      15.8%
6      0.050×0.95^6 = 0.037      11.7%
12     0.050×0.95^12 = 0.027      8.5%
18     0.050×0.95^18 = 0.020      6.3%
24     0.050×0.95^24 = 0.015      4.7%

结论：即使每月只衰减 5%，2 年后你的策略收益只剩原来的 30%。

自检：计算你当前策略的 IC，假设月衰减 3%、5%、10%，分别多久会降到不可接受的水平？

为什么"定期重训"不够

很多人的解决方案是"每个月重新训练模型"。这比静态模型好，但有三个问题：

问题	解释	后果
信息延迟	月度重训意味着最多滞后 30 天	市场变化后一个月才反应
样本不足	新数据只有 20 个交易日	训练数据太少，过拟合风险高
灾难遗忘	完全重训会"忘记"历史规律	遇到类似历史情况时无法应对

正确思路：不是"重新学习"，而是"持续适应"——在保留历史知识的同时，逐步调整以适应新环境。

17.2 在线学习的核心机制

批量学习 vs 在线学习

维度	批量学习 (Batch)	在线学习 (Online)
数据处理	收集所有数据，一次性训练	每来一条数据，更新一次
更新频率	周期性（如月度）	连续（如每日、每笔交易）
计算资源	集中消耗	分散消耗
适应速度	慢（最多滞后一个周期）	快（实时适应）
过拟合风险	较低（数据量大）	较高（需要正则化）

在线学习的三种模式

纸上练习：选择遗忘因子

场景：你的策略在两种市场环境下测试。

环境	平均持续时间	建议遗忘因子 λ	有效回看天数（权重>10%）
快速切换	20 天	0.90	~22 天
中等切换	60 天	0.95	~44 天
缓慢切换	180 天	0.99	~230 天

公式：有效回看天数 ≈ ln(0.1) / ln(λ)

自检：根据你策略的市场环境，选择合适的 λ 值。如果选错会发生什么？

λ 太大（遗忘太慢）：适应不及时，新环境下亏损
λ 太小（遗忘太快）：过度拟合近期噪声，稳定性差

💻 代码实现（工程师参考）

class ExponentialMovingModel:
    """指数遗忘的在线学习模型"""

    def __init__(self, decay_factor: float = 0.95):
        self.lambda_ = decay_factor
        self.weights = None
        self.cumulative_weight = 0

    def update(self, X: np.ndarray, y: float, learning_rate: float = 0.01):
        """增量更新模型"""
        if self.weights is None:
            self.weights = np.zeros(X.shape[0])

        # 预测
        pred = np.dot(self.weights, X)
        error = y - pred

        # 更新权重（带遗忘的梯度下降）
        self.weights = self.lambda_ * self.weights + learning_rate * error * X
        self.cumulative_weight = self.lambda_ * self.cumulative_weight + 1

        return pred, error

    def get_effective_lookback(self, threshold: float = 0.1) -> int:
        """计算有效回看天数"""
        return int(np.log(threshold) / np.log(self.lambda_))

17.3 策略进化的四个层次

在线学习只是策略进化的一部分。完整的进化系统有四个层次：

Level 1: 信号适应（最快）

信号适应是最快速的进化层次，不需要重新训练模型。

示例：动态阈值调整

静态阈值：信号 > 0.5 则买入

动态阈值：
- 计算过去 N 天信号的分布
- 阈值 = 信号均值 + k × 信号标准差
- 市场波动大时，阈值自动提高，减少交易
- 市场波动小时，阈值自动降低，增加交易

纸上练习：

场景	信号均值	信号标准差	k=1.5 时阈值	解读
正常市场	0.3	0.15	0.525	适中
高波动市场	0.35	0.25	0.725	更严格，减少交易
低波动市场	0.28	0.08	0.40	更宽松，增加交易

Level 2: 模型进化（中等速度）

模型进化涉及参数更新和特征工程。

关键机制：特征重要性监控

┌─────────────────────────────────────────────────┐
│           特征重要性变化监控                       │
├──────────────┬───────────┬───────────┬─────────┤
│ 特征         │ 6个月前   │ 现在      │ 趋势    │
├──────────────┼───────────┼───────────┼─────────┤
│ 动量_20D     │ 0.25      │ 0.08      │ ↓ 衰减  │
│ 波动率_30D   │ 0.15      │ 0.22      │ ↑ 增强  │
│ 成交量比     │ 0.18      │ 0.05      │ ↓ 失效  │
│ 财报意外度   │ 0.12      │ 0.18      │ ↑ 有效  │
└──────────────┴───────────┴───────────┴─────────┘

→ 决策：降低动量权重，剔除成交量比，增加波动率权重

进化触发条件：

触发信号	阈值	动作
特征重要性下降 > 50%	连续 3 个月	降低权重或剔除
新特征 IC 显著	p-value < 0.05	候选加入
模型整体 IC 下降 > 30%	连续 2 个月	触发模型重训

Level 3: 策略进化（较慢）

策略进化涉及策略组合的重新配置。

策略生命周期管理：

                    孵化期          验证期          成熟期          衰退期
收益/风险比    ▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪  ▪▪▪▪▪▪▪▪▪▪▪  ▪▪▪▪▪▪▪▪▪▪▪▪▪  ▪▪▪▪▪▪▪▪
               纸上交易          小仓位实盘       主力策略         逐步淘汰
               3-6个月           3-6个月         不定            不定

进入条件：      回测通过         夏普>1.0        夏普>1.5         夏普<0.8
               Quality Gate     实盘回撤<15%    连续6月正收益    连续3月亏损

资金分配：      0%              5-10%           20-40%          逐步归零

策略组合的动态权重：

权重方法	原理	优点	缺点
等权重	每个策略 1/N	简单，分散	不区分好坏
波动率倒数	权重 ∝ 1/σ	风险均衡	忽略收益差异
夏普比例	权重 ∝ 夏普	奖励好策略	历史不代表未来
Kelly 权重	权重 = μ/σ²	理论最优	对估计误差敏感
滑动窗口	基于近 N 天表现	适应性强	可能追涨杀跌

纸上练习：策略权重分配

策略	近 3 月收益	近 3 月波动率	夏普	波动率倒数权重	夏普比例权重
A	8%	5%	1.6	0.40 (1/5 ÷ 总和)	0.44 (1.6/3.6)
B	6%	8%	0.75	0.25 (1/8 ÷ 总和)	0.21 (0.75/3.6)
C	10%	8%	1.25	0.25	0.35 (1.25/3.6)

计算过程：

波动率倒数：1/5 = 0.20, 1/8 = 0.125, 1/8 = 0.125，总和 = 0.45
- A: 0.20/0.45 = 0.44, B: 0.125/0.45 = 0.28, C: 0.28
夏普比例：总和 = 1.6 + 0.75 + 1.25 = 3.6
- A: 1.6/3.6 = 0.44, B: 0.75/3.6 = 0.21, C: 1.25/3.6 = 0.35

Level 4: 架构进化（最慢）

架构进化是最根本的变化，通常需要人工介入。

典型的架构进化路径：

阶段 1: 单策略
└── 一个简单的趋势跟随策略

阶段 2: 策略组合
└── 趋势 + 均值回归 + 动量，固定权重

阶段 3: 动态组合
└── 根据市场状态动态调整策略权重

阶段 4: 多智能体
└── 专家 Agent + Meta Agent + Risk Agent

阶段 5: 自进化系统
└── 能自动发现、测试、部署新策略的系统

架构进化的触发条件：

信号	说明	建议动作
所有策略同时失效	不是单个策略问题，是架构问题	检查市场状态识别是否失效
相关性结构变化	原本不相关的策略变得高度相关	重新设计策略分工
系统性回撤 > 30%	风控机制没能阻止大回撤	加强 Risk Agent 否决权
新市场状态出现	如数字货币、新监管环境	增加新的专家 Agent

17.4 实现在线学习的关键技术

1. 概念漂移检测

在更新模型之前，先确认是否真的发生了漂移。

常用检测方法：

方法	原理	适用场景
DDM (Drift Detection Method)	监控错误率，显著上升则报警	分类问题
ADWIN	自适应窗口，检测分布变化	流数据
Page-Hinkley	累积偏差检测	均值漂移
特征分布监控	比较特征的 KL 散度	特征漂移

纸上练习：简单的漂移检测

监控指标：模型预测的滑动准确率

时间    准确率    5日均值    是否报警（均值<50%）
D1      55%       55%       否
D2      52%       53.5%     否
D3      48%       51.7%     否
D4      45%       50.0%     否
D5      42%       48.4%     是 ← 触发漂移检测
D6      40%       45.4%     是

当检测到漂移时，才触发模型更新，而不是盲目定期更新。

2. 防止灾难性遗忘

在线学习的一个风险是"灾难性遗忘"——学新知识时忘掉旧知识。

解决方案：

方法	原理	适用场景
Elastic Weight Consolidation (EWC)	保护重要参数，减少遗忘	深度学习模型
Memory Replay	存储代表性样本，混合训练	所有模型
渐进式网络	新任务新模块，不改旧模块	多任务学习
知识蒸馏	用旧模型教新模型	模型更替

实践建议：

保留 10-20% 的历史代表性样本
每次更新时，混合新数据 + 历史样本
监控在历史测试集上的表现，确保没有遗忘

3. 更新时机与频率

过于频繁的更新：

过拟合近期噪声
计算资源浪费
模型不稳定

过于稀疏的更新：

适应滞后
错过市场变化
累积误差

推荐策略：

市场类型	更新触发	最小间隔	最大间隔
高频交易	每 N 笔交易	1 小时	1 天
日内策略	收盘后	1 天	1 周
中频策略	漂移检测触发	1 周	1 月
低频策略	季度复盘	1 月	1 季度

💻 代码实现（工程师参考）

class AdaptiveUpdateScheduler:
    """自适应更新调度器"""

    def __init__(self, min_interval: int = 5, max_interval: int = 20):
        self.min_interval = min_interval  # 最小更新间隔（天）
        self.max_interval = max_interval  # 最大更新间隔（天）
        self.last_update = 0
        self.drift_detector = DDM()  # 漂移检测器

    def should_update(self, day: int, recent_errors: list) -> tuple[bool, str]:
        """决定是否应该更新模型"""
        days_since_update = day - self.last_update

        # 检查漂移
        drift_detected = self.drift_detector.detect(recent_errors)

        # 判断逻辑
        if days_since_update >= self.max_interval:
            return True, "达到最大间隔，强制更新"

        if drift_detected and days_since_update >= self.min_interval:
            return True, "检测到漂移，触发更新"

        return False, "无需更新"

    def record_update(self, day: int):
        self.last_update = day
        self.drift_detector.reset()

17.5 在线学习的工程实现

1. 滑动窗口重训实现

from datetime import datetime, timedelta
from typing import Optional, Tuple
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier

class SlidingWindowRetrainer:
    """滑动窗口模型重训器"""

    def __init__(self,
                 window_size_days: int = 252,
                 min_samples: int = 200,
                 retrain_interval_days: int = 20):
        """
        window_size_days: 训练窗口大小（天）
        min_samples: 最少训练样本数
        retrain_interval_days: 重训间隔（天）
        """
        self.window_size = window_size_days
        self.min_samples = min_samples
        self.retrain_interval = retrain_interval_days

        self.model = None
        self.last_train_date = None
        self.training_history = []

    def should_retrain(self, current_date: datetime) -> Tuple[bool, str]:
        """判断是否需要重训"""
        if self.model is None:
            return True, "初始训练"

        days_since_train = (current_date - self.last_train_date).days

        if days_since_train >= self.retrain_interval:
            return True, f"距上次训练已 {days_since_train} 天"

        return False, "无需重训"

    def train(self, data: pd.DataFrame,
              feature_cols: list,
              target_col: str,
              current_date: datetime) -> dict:
        """
        使用滑动窗口训练模型

        data: 必须包含 'date' 列和特征列
        """
        # 计算窗口边界
        window_end = current_date
        window_start = current_date - timedelta(days=self.window_size)

        # 筛选窗口内数据
        mask = (data['date'] >= window_start) & (data['date'] < window_end)
        train_data = data[mask]

        if len(train_data) < self.min_samples:
            return {
                'success': False,
                'reason': f'样本不足: {len(train_data)} < {self.min_samples}'
            }

        X = train_data[feature_cols].values
        y = train_data[target_col].values

        # 训练模型
        self.model = RandomForestClassifier(
            n_estimators=100,
            max_depth=5,
            min_samples_leaf=20,
            random_state=42
        )
        self.model.fit(X, y)

        # 记录训练
        self.last_train_date = current_date

        train_info = {
            'success': True,
            'date': current_date,
            'window': (window_start, window_end),
            'n_samples': len(train_data),
            'train_accuracy': self.model.score(X, y)
        }
        self.training_history.append(train_info)

        return train_info

    def predict(self, X: np.ndarray) -> np.ndarray:
        """预测"""
        if self.model is None:
            raise ValueError("模型尚未训练")
        return self.model.predict_proba(X)[:, 1]

2. 漂移检测指标实现

Population Stability Index (PSI)

PSI 是检测特征分布漂移的标准指标。

def calculate_psi(expected: np.ndarray,
                  actual: np.ndarray,
                  n_bins: int = 10) -> float:
    """
    计算 Population Stability Index

    PSI < 0.1: 无显著漂移
    0.1 <= PSI < 0.25: 中等漂移，需关注
    PSI >= 0.25: 显著漂移，需要处理
    """
    # 创建分箱
    breakpoints = np.percentile(expected,
                                np.linspace(0, 100, n_bins + 1))
    breakpoints[0] = -np.inf
    breakpoints[-1] = np.inf

    # 计算各箱占比
    expected_counts = np.histogram(expected, bins=breakpoints)[0]
    actual_counts = np.histogram(actual, bins=breakpoints)[0]

    # 转换为比例（避免除零）
    expected_pct = (expected_counts + 1) / (len(expected) + n_bins)
    actual_pct = (actual_counts + 1) / (len(actual) + n_bins)

    # 计算 PSI
    psi = np.sum((actual_pct - expected_pct) *
                 np.log(actual_pct / expected_pct))

    return psi


class FeatureDriftMonitor:
    """特征漂移监控器"""

    def __init__(self, psi_threshold: float = 0.2):
        self.baseline_distributions = {}
        self.psi_threshold = psi_threshold
        self.drift_history = []

    def set_baseline(self, feature_name: str, values: np.ndarray):
        """设置基线分布"""
        self.baseline_distributions[feature_name] = values.copy()

    def check_drift(self, feature_name: str,
                    current_values: np.ndarray,
                    date: datetime) -> dict:
        """检查单个特征的漂移"""
        if feature_name not in self.baseline_distributions:
            raise ValueError(f"未设置基线: {feature_name}")

        baseline = self.baseline_distributions[feature_name]
        psi = calculate_psi(baseline, current_values)

        result = {
            'feature': feature_name,
            'date': date,
            'psi': psi,
            'drift_detected': psi >= self.psi_threshold,
            'severity': 'high' if psi >= 0.25 else
                       ('medium' if psi >= 0.1 else 'low')
        }

        self.drift_history.append(result)
        return result

    def check_all_features(self, current_data: pd.DataFrame,
                           date: datetime) -> dict:
        """检查所有特征的漂移"""
        results = {}
        drifted_features = []

        for feature in self.baseline_distributions:
            if feature in current_data.columns:
                result = self.check_drift(
                    feature,
                    current_data[feature].values,
                    date
                )
                results[feature] = result
                if result['drift_detected']:
                    drifted_features.append(feature)

        return {
            'date': date,
            'features_checked': len(results),
            'features_drifted': len(drifted_features),
            'drifted_features': drifted_features,
            'details': results,
            'action_required': len(drifted_features) > 0
        }

Kolmogorov-Smirnov 检验

from scipy import stats

def ks_drift_test(baseline: np.ndarray,
                  current: np.ndarray,
                  significance: float = 0.05) -> dict:
    """
    使用 KS 检验检测分布漂移
    """
    statistic, p_value = stats.ks_2samp(baseline, current)

    return {
        'ks_statistic': statistic,
        'p_value': p_value,
        'drift_detected': p_value < significance,
        'interpretation':
            '分布显著不同' if p_value < significance
            else '分布无显著差异'
    }

3. 重训 vs 暂停决策框架

class RetrainDecisionEngine:
    """重训决策引擎"""

    def __init__(self,
                 psi_threshold: float = 0.2,
                 performance_drop_threshold: float = 0.3,
                 min_confidence_for_retrain: float = 0.6):
        self.psi_threshold = psi_threshold
        self.perf_threshold = performance_drop_threshold
        self.min_confidence = min_confidence_for_retrain

    def decide(self,
               drift_report: dict,
               performance_report: dict,
               data_quality_report: dict) -> dict:
        """
        决定下一步行动

        返回: 'retrain', 'pause', 'continue', 'investigate'
        """
        # 收集信号
        drift_detected = drift_report.get('action_required', False)
        perf_drop = performance_report.get('ic_change', 0)
        data_quality_ok = data_quality_report.get('quality_score', 1) > 0.8
        sample_size_ok = data_quality_report.get('n_samples', 0) > 200

        # 决策矩阵
        #
        #                    性能下降?
        #                    是        否
        #   漂移?   是    [重训]    [观察]
        #           否    [暂停]    [继续]
        #

        if drift_detected:
            if perf_drop > self.perf_threshold:
                # 漂移 + 性能下降：需要重训
                if data_quality_ok and sample_size_ok:
                    return {
                        'action': 'retrain',
                        'confidence': 0.9,
                        'reason': '检测到漂移且性能下降，数据质量充足',
                        'urgency': 'high'
                    }
                else:
                    return {
                        'action': 'investigate',
                        'confidence': 0.5,
                        'reason': '需要重训但数据质量不足，需人工介入',
                        'urgency': 'high'
                    }
            else:
                # 漂移但性能尚可：继续观察
                return {
                    'action': 'continue',
                    'confidence': 0.6,
                    'reason': '检测到漂移但性能暂未受影响，继续监控',
                    'urgency': 'low',
                    'next_check_days': 3
                }
        else:
            if perf_drop > self.perf_threshold:
                # 无漂移但性能下降：可能是过拟合或市场变化
                return {
                    'action': 'pause',
                    'confidence': 0.7,
                    'reason': '性能下降但无明显漂移，建议暂停交易并调查',
                    'urgency': 'medium'
                }
            else:
                # 无漂移且性能正常：继续运行
                return {
                    'action': 'continue',
                    'confidence': 0.95,
                    'reason': '一切正常',
                    'urgency': 'none'
                }


class OnlineLearningPipeline:
    """完整的在线学习流水线"""

    def __init__(self, model_name: str):
        self.model_name = model_name
        self.retrainer = SlidingWindowRetrainer()
        self.drift_monitor = FeatureDriftMonitor()
        self.decision_engine = RetrainDecisionEngine()
        self.state = 'running'  # running, paused, retraining

    def daily_update(self,
                     current_date: datetime,
                     new_data: pd.DataFrame,
                     feature_cols: list,
                     target_col: str) -> dict:
        """每日更新流程"""

        # Step 1: 检查漂移
        drift_report = self.drift_monitor.check_all_features(
            new_data, current_date
        )

        # Step 2: 计算近期表现
        perf_report = self._calculate_performance(new_data, target_col)

        # Step 3: 检查数据质量
        quality_report = self._check_data_quality(new_data, feature_cols)

        # Step 4: 决策
        decision = self.decision_engine.decide(
            drift_report, perf_report, quality_report
        )

        # Step 5: 执行
        if decision['action'] == 'retrain':
            train_result = self.retrainer.train(
                new_data, feature_cols, target_col, current_date
            )
            decision['train_result'] = train_result

        elif decision['action'] == 'pause':
            self.state = 'paused'

        return {
            'date': current_date,
            'drift_report': drift_report,
            'performance_report': perf_report,
            'decision': decision,
            'model_state': self.state
        }

    def _calculate_performance(self, data: pd.DataFrame,
                               target_col: str) -> dict:
        """计算近期表现"""
        # 实现具体的表现计算逻辑
        return {
            'ic': 0.03,
            'ic_change': -0.02,  # 相对于基线的变化
            'hit_rate': 0.52
        }

    def _check_data_quality(self, data: pd.DataFrame,
                            feature_cols: list) -> dict:
        """检查数据质量"""
        missing_rate = data[feature_cols].isnull().mean().mean()

        return {
            'quality_score': 1 - missing_rate,
            'n_samples': len(data),
            'missing_rate': missing_rate
        }

4. 纸上练习：何时重训 vs 暂停

场景	PSI	IC 变化	数据质量	决策	原因
A	0.05	-5%	好	继续	无显著漂移，性能正常
B	0.30	-40%	好	重训	漂移 + 性能严重下降
C	0.25	-10%	好	观察	漂移但性能尚可
D	0.08	-35%	好	暂停	无漂移但性能异常，需调查
E	0.35	-50%	差	调查	需重训但数据质量不支持

关键原则：

漂移 + 性能下降 = 重训（市场变了，模型需要适应）
无漂移 + 性能下降 = 暂停（可能是其他问题，别盲目重训）
漂移 + 性能正常 = 观察（可能是暂时性波动）
数据质量差 = 先修数据（否则重训也无效）

17.6 多智能体视角下的进化

在多智能体架构中，进化不仅是单个模型的更新，还涉及 Agent 之间的协调。

进化架构

Evolution Agent 的职责

职责	具体内容	触发条件
表现监控	追踪每个 Agent 的准确率、延迟、稳定性	持续
漂移检测	检测每个 Agent 的输出分布变化	异常检测触发
更新调度	决定哪个 Agent 需要更新，更新顺序	定期 + 事件驱动
版本管理	维护每个 Agent 的版本历史，支持回滚	更新后
A/B 测试	新版本小流量验证后再全量部署	重大更新时

Agent 级别的 A/B 测试

协调更新的挑战

挑战	说明	解决方案
更新顺序	Regime Agent 更新可能影响 Signal Agent 的输入	上游 Agent 先更新，下游观察后再更新
回滚决策	新版本表现不佳时，如何决定回滚	预设回滚阈值，如回撤 > 10%
版本兼容	不同版本的 Agent 之间接口是否兼容	版本化 API，向后兼容
全局一致性	避免部分更新导致系统状态不一致	灰度发布，逐步切换

✅ 验收标准

完成本课后，用以下标准检验学习效果：

验收项	达标标准	自测方法
理解概念漂移	能解释为什么静态模型会衰退	用自己的话向非技术人员解释
计算 Alpha 衰减	能计算给定衰减率下的收益预期	完成纸上练习：月衰减 3% 下，2 年后 IC 变化
选择遗忘因子	能根据市场环境选择合适的 λ	解释为什么高频策略需要更小的 λ
设计更新策略	能为自己的策略设计更新时机	画出你策略的更新触发条件流程图
理解进化层次	能区分四个层次的进化	举例说明每个层次的实际应用

综合练习

场景：你有一个 A 股选股策略，过去表现如下：

时期	月均收益	月波动率	IC
2022 H1	2.5%	4%	0.05
2022 H2	1.8%	5%	0.04
2023 H1	0.8%	6%	0.025
2023 H2	-0.2%	7%	0.01

问题：

这是什么类型的衰退？（突变/渐变/周期）
计算 IC 的月衰减率
应该在什么时候触发模型更新？
推荐什么样的更新策略？

💡 参考答案

渐变型衰退：收益和 IC 都在逐步下降，没有突然的断崖
月衰减率计算：
- 2022 H1 到 2023 H2 = 24 个月
- IC 从 0.05 降到 0.01
- 0.05 × (1-r)^24 = 0.01
- (1-r)^24 = 0.2
- 1-r = 0.934
- r ≈ 6.6%/月
触发时机：
- IC < 0.03（有效性阈值）时应该触发，即 2023 H1 左右
- 实际上 2022 H2 就应该开始关注（IC 下降 20%）
推荐更新策略：
- Level 1：动态调整阈值，减少交易频率
- Level 2：检查特征重要性变化，可能需要新特征
- Level 3：考虑引入新策略分散风险
- 遗忘因子 λ ≈ 0.95，每月增量更新

本课交付物

完成本课后，你将获得：

概念漂移的量化理解 - 能计算 Alpha 衰减，预估策略寿命
在线学习的实施框架 - 三种模式（滑动窗口、增量更新、指数遗忘）的适用场景
四层进化体系 - 从信号适应到架构进化的完整路径
多智能体进化机制 - Evolution Agent 的设计思路

本课要点回顾

理解静态模型衰退的必然性：概念漂移是市场的本质特征
掌握在线学习的三种模式及其适用场景
理解策略进化的四个层次及其触发条件
理解多智能体架构下的协调更新挑战

下一课预告

第 18 课：交易成本建模与可交易性

理论到此为止。下一课我们进入生产与实战阶段——首先学习如何建模交易成本，评估策略从纸上收益到真实收益的转换率。毕竟，一个 Gross Alpha 很高但 Net Alpha 为负的策略，永远只能停留在回测里。