woodwork_utils#
Woodwork 工具方法。
模块内容#
函数#
将 IntegerNullable、BooleanNullable 类型降级为 Double、Boolean,以便支持 ARIMA、CatBoost 和 LightGBM 等特定估计器。 |
|
从给定的列表、pandas 或 numpy 输入创建 Woodwork 结构,并指定列的类型。如果未指定列的类型,则将由 Woodwork 推断。 |
内容#
- evalml.utils.woodwork_utils.downcast_nullable_types(data, ignore_null_cols=True)[源码]#
将 IntegerNullable、BooleanNullable 类型降级为 Double、Boolean,以便支持 ARIMA、CatBoost 和 LightGBM 等特定估计器。
- 参数
data (pd.DataFrame, pd.Series) – 特征数据。
ignore_null_cols (bool) – 是否忽略包含空值的列的向下转型。默认为 True。
- 返回
返回 DataFrame 或 Series,其中包含逻辑类型信息,BooleanNullable 被转换为 Double。
- 返回类型
data
- evalml.utils.woodwork_utils.infer_feature_types(data, feature_types=None)[源码]#
从给定的列表、pandas 或 numpy 输入创建 Woodwork 结构,并指定列的类型。如果未指定列的类型,则将由 Woodwork 推断。
- 参数
data (pd.DataFrame, pd.Series) – 要转换为 Woodwork 数据结构的输入数据。
feature_types (string, ww.logical_type obj, dict, optional) – 如果 data 是二维结构,则 feature_types 必须是一个字典,将列名映射到列中表示的数据类型。如果 data 是一维结构,则 feature_types 必须是 Woodwork 逻辑类型或表示 Woodwork 逻辑类型的字符串(“Double”、“Integer”、“Boolean”、“Categorical”、“Datetime”、“NaturalLanguage”)。
- 返回
返回 Woodwork 数据结构,其中每列的数据类型已指定或推断。
- 抛出
ValueError – 如果 dataframe 与 woodwork schema 不匹配。
- evalml.utils.woodwork_utils.numeric_and_boolean_ww#