normalize_feature
- czsc.normalize_feature(df, x_col, **kwargs)[source]
因子标准化:缩尾,然后标准化
函数计算逻辑:
首先,检查因子列x_col是否存在缺失值,如果存在缺失值,则抛出异常,提示缺失值的数量。
从kwargs参数中获取缩尾比例q的值,默认为0.05。
对因子列进行缩尾操作,首先根据 dt 分组,然后使用lambda函数对每个组内的因子进行缩尾处理, 将超过缩尾比例的值截断,并使用scale函数进行标准化。
将处理后的因子列重新赋值给原始DataFrame对象的对应列。
- Parameters:
df – pd.DataFrame,数据
x_col – str,因子列名
kwargs –
q: float,缩尾比例, 默认 0.05
- Returns:
pd.DataFrame,处理后的数据