data_check_message_code#

数据检查消息代码的枚举。

模块内容#

类摘要#

DataCheckMessageCode

数据检查消息代码的枚举。

目录#

class evalml.data_checks.data_check_message_code.DataCheckMessageCode[source]#

数据检查消息代码的枚举。

属性

CLASS_IMBALANCE_BELOW_FOLDS

当每个目标值数量低于 2 * CV 折叠数时的消息代码。

CLASS_IMBALANCE_BELOW_THRESHOLD

当类别平衡低于阈值时的消息代码。

CLASS_IMBALANCE_SEVERE

当类别平衡低于阈值且最小类别数量低于最小接受样本数时的消息代码。

COLS_WITH_NULL

包含空值的列的消息代码。

DATETIME_HAS_MISALIGNED_VALUES

当日期时间信息包含与推断频率不一致的值时的消息代码。

DATETIME_HAS_NAN

当输入日期时间列包含 NaN 值时的消息代码。

DATETIME_HAS_REDUNDANT_ROW

当日期时间信息包含每个日期时间多于一行时的消息代码。

DATETIME_HAS_UNEVEN_INTERVALS

当日期时间值间隔不均匀时的消息代码。

DATETIME_INFORMATION_NOT_FOUND

当找不到日期时间信息或格式不受支持时的消息代码。

DATETIME_IS_MISSING_VALUES

当日期时间特征在开始日期和结束日期之间缺少值时的消息代码。

DATETIME_IS_NOT_MONOTONIC

当日期时间值非单调递增时的消息代码。

DATETIME_NO_FREQUENCY_INFERRED

当无法通过 Woodwork 的 infer_frequency 推断日期时间值的频率时的消息代码。

HAS_ID_COLUMN

包含 ID 列的数据的消息代码。

HAS_ID_FIRST_COLUMN

包含 ID 列作为第一列的数据的消息代码。

HAS_OUTLIERS

检测到异常值时的消息代码。

HIGH_VARIANCE

交叉验证检测到高方差时的消息代码。

HIGHLY_NULL_COLS

空值率高的列的消息代码。

HIGHLY_NULL_ROWS

空值率高的行的消息代码。

INVALID_SERIES_ID_COL

给定 series_id 无效时的消息代码

IS_MULTICOLLINEAR

数据可能存在多重共线性时的消息代码。

MISMATCHED_INDICES

输入目标和特征索引不匹配时的消息代码。

MISMATCHED_INDICES_ORDER

输入目标和特征索引顺序不匹配时的消息代码。两个输入的索引值相同,但顺序被打乱。

MISMATCHED_LENGTHS

输入目标和特征长度不同时的消息代码。

MISMATCHED_SERIES_LENGTH

多序列数据集中一个或多个唯一序列的长度与其他序列不同时的消息代码

NATURAL_LANGUAGE_HAS_NAN

输入自然语言列包含 NaN 值时的消息代码。

NO_VARIANCE

数据没有方差(1个唯一值)时的消息代码。

NO_VARIANCE_WITH_NULL

数据有一个唯一值和 NaN 值时的消息代码。

NO_VARIANCE_ZERO_UNIQUE

数据没有方差(0个唯一值)时的消息代码

NOT_UNIQUE_ENOUGH

数据没有足够的唯一值时的消息代码。

TARGET_BINARY_NOT_TWO_UNIQUE_VALUES

二元分类问题的目标数据没有两个唯一值时的消息代码。

TARGET_HAS_NULL

包含空值的目标数据的消息代码。

TARGET_INCOMPATIBLE_OBJECTIVE

目标数据的值与指定目标不兼容时的消息代码

TARGET_IS_EMPTY_OR_FULLY_NULL

目标数据为空或全部为 null 值时的消息代码。

TARGET_IS_NONE

目标为 None 时的消息代码。

TARGET_LEAKAGE

检测到目标泄漏时的消息代码。

TARGET_LOGNORMAL_DISTRIBUTION

具有对数正态分布的目标数据的消息代码。

TARGET_MULTICLASS_HIGH_UNIQUE_CLASS

多类别分类问题的目标数据具有相对于目标值数量异常大的唯一类别数时的消息代码。

TARGET_MULTICLASS_NOT_ENOUGH_CLASSES

多类别分类问题的目标数据没有多于两个唯一类别时的消息代码。

TARGET_MULTICLASS_NOT_TWO_EXAMPLES_PER_CLASS

多类别分类问题的目标数据没有每类两个示例时的消息代码。

TARGET_UNSUPPORTED_PROBLEM_TYPE

对照不支持的问题类型检查目标数据时的消息代码。

TARGET_UNSUPPORTED_TYPE

目标数据类型不受支持时的消息代码。

TARGET_UNSUPPORTED_TYPE_REGRESSION

目标数据与回归不兼容时的消息代码

TIMESERIES_PARAMETERS_NOT_COMPATIBLE_WITH_SPLIT

当时间序列参数对于最小数据分割过大时的消息代码。

TIMESERIES_TARGET_NOT_COMPATIBLE_WITH_SPLIT

当时间序列目标的任何训练和验证分割不包含所有类别时的消息代码。

TOO_SPARSE

当多类别数据的值过于稀疏时的消息代码。

TOO_UNIQUE

数据包含过多唯一值时的消息代码。

方法

name

枚举成员的名称。

value

枚举成员的值。

name(self)#

枚举成员的名称。

value(self)#

枚举成员的值。