normalize_corr

czsc.normalize_corr(df: DataFrame, fcol, ycol=None, **kwargs)[source]

标准化因子与收益相关性为正数

方法说明:对因子进行滚动相关系数计算,因子乘以滚动相关系数的符号

注意:

  1. simple 模式下,计算过程有一定的未来信息泄露,在回测中使用时需要注意

  2. rolling 模式下,计算过程依赖 window 参数,有可能调整后相关性为负数

Parameters:
  • df – pd.DataFrame, 必须包含 dt、symbol、price 列,以及因子列

  • fcol – str 因子列名

  • kwargs

    dict

    • window: int, 滚动窗口大小

    • min_periods: int, 最小计算周期

    • mode: str, 计算方法, rolling 表示使用滚动调整相关系数,simple 表示使用镜像反转相关系数

    • copy: bool, 是否复制 df

Returns:

pd.DataFrame