woodwork_utils#

Woodwork 工具方法。

模块内容#

函数#

downcast_nullable_types

将 IntegerNullable、BooleanNullable 类型降级为 Double、Boolean,以便支持 ARIMA、CatBoost 和 LightGBM 等特定估计器。

infer_feature_types

从给定的列表、pandas 或 numpy 输入创建 Woodwork 结构,并指定列的类型。如果未指定列的类型,则将由 Woodwork 推断。

内容#

evalml.utils.woodwork_utils.downcast_nullable_types(data, ignore_null_cols=True)[源码]#

将 IntegerNullable、BooleanNullable 类型降级为 Double、Boolean,以便支持 ARIMA、CatBoost 和 LightGBM 等特定估计器。

参数
  • data (pd.DataFrame, pd.Series) – 特征数据。

  • ignore_null_cols (bool) – 是否忽略包含空值的列的向下转型。默认为 True。

返回

返回 DataFrame 或 Series,其中包含逻辑类型信息,BooleanNullable 被转换为 Double。

返回类型

data

evalml.utils.woodwork_utils.infer_feature_types(data, feature_types=None)[源码]#

从给定的列表、pandas 或 numpy 输入创建 Woodwork 结构,并指定列的类型。如果未指定列的类型,则将由 Woodwork 推断。

参数
  • data (pd.DataFrame, pd.Series) – 要转换为 Woodwork 数据结构的输入数据。

  • feature_types (string, ww.logical_type obj, dict, optional) – 如果 data 是二维结构,则 feature_types 必须是一个字典,将列名映射到列中表示的数据类型。如果 data 是一维结构,则 feature_types 必须是 Woodwork 逻辑类型或表示 Woodwork 逻辑类型的字符串(“Double”、“Integer”、“Boolean”、“Categorical”、“Datetime”、“NaturalLanguage”)。

返回

返回 Woodwork 数据结构,其中每列的数据类型已指定或推断。

抛出

ValueError – 如果 dataframe 与 woodwork schema 不匹配。

evalml.utils.woodwork_utils.numeric_and_boolean_ww#