data_check_message_code#
数据检查消息代码的枚举。
模块内容#
类摘要#
数据检查消息代码的枚举。 |
目录#
- class evalml.data_checks.data_check_message_code.DataCheckMessageCode[source]#
数据检查消息代码的枚举。
属性
CLASS_IMBALANCE_BELOW_FOLDS
当每个目标值数量低于 2 * CV 折叠数时的消息代码。
CLASS_IMBALANCE_BELOW_THRESHOLD
当类别平衡低于阈值时的消息代码。
CLASS_IMBALANCE_SEVERE
当类别平衡低于阈值且最小类别数量低于最小接受样本数时的消息代码。
COLS_WITH_NULL
包含空值的列的消息代码。
DATETIME_HAS_MISALIGNED_VALUES
当日期时间信息包含与推断频率不一致的值时的消息代码。
DATETIME_HAS_NAN
当输入日期时间列包含 NaN 值时的消息代码。
DATETIME_HAS_REDUNDANT_ROW
当日期时间信息包含每个日期时间多于一行时的消息代码。
DATETIME_HAS_UNEVEN_INTERVALS
当日期时间值间隔不均匀时的消息代码。
DATETIME_INFORMATION_NOT_FOUND
当找不到日期时间信息或格式不受支持时的消息代码。
DATETIME_IS_MISSING_VALUES
当日期时间特征在开始日期和结束日期之间缺少值时的消息代码。
DATETIME_IS_NOT_MONOTONIC
当日期时间值非单调递增时的消息代码。
DATETIME_NO_FREQUENCY_INFERRED
当无法通过 Woodwork 的 infer_frequency 推断日期时间值的频率时的消息代码。
HAS_ID_COLUMN
包含 ID 列的数据的消息代码。
HAS_ID_FIRST_COLUMN
包含 ID 列作为第一列的数据的消息代码。
HAS_OUTLIERS
检测到异常值时的消息代码。
HIGH_VARIANCE
交叉验证检测到高方差时的消息代码。
HIGHLY_NULL_COLS
空值率高的列的消息代码。
HIGHLY_NULL_ROWS
空值率高的行的消息代码。
INVALID_SERIES_ID_COL
给定 series_id 无效时的消息代码
IS_MULTICOLLINEAR
数据可能存在多重共线性时的消息代码。
MISMATCHED_INDICES
输入目标和特征索引不匹配时的消息代码。
MISMATCHED_INDICES_ORDER
输入目标和特征索引顺序不匹配时的消息代码。两个输入的索引值相同,但顺序被打乱。
MISMATCHED_LENGTHS
输入目标和特征长度不同时的消息代码。
MISMATCHED_SERIES_LENGTH
多序列数据集中一个或多个唯一序列的长度与其他序列不同时的消息代码
NATURAL_LANGUAGE_HAS_NAN
输入自然语言列包含 NaN 值时的消息代码。
NO_VARIANCE
数据没有方差(1个唯一值)时的消息代码。
NO_VARIANCE_WITH_NULL
数据有一个唯一值和 NaN 值时的消息代码。
NO_VARIANCE_ZERO_UNIQUE
数据没有方差(0个唯一值)时的消息代码
NOT_UNIQUE_ENOUGH
数据没有足够的唯一值时的消息代码。
TARGET_BINARY_NOT_TWO_UNIQUE_VALUES
二元分类问题的目标数据没有两个唯一值时的消息代码。
TARGET_HAS_NULL
包含空值的目标数据的消息代码。
TARGET_INCOMPATIBLE_OBJECTIVE
目标数据的值与指定目标不兼容时的消息代码
TARGET_IS_EMPTY_OR_FULLY_NULL
目标数据为空或全部为 null 值时的消息代码。
TARGET_IS_NONE
目标为 None 时的消息代码。
TARGET_LEAKAGE
检测到目标泄漏时的消息代码。
TARGET_LOGNORMAL_DISTRIBUTION
具有对数正态分布的目标数据的消息代码。
TARGET_MULTICLASS_HIGH_UNIQUE_CLASS
多类别分类问题的目标数据具有相对于目标值数量异常大的唯一类别数时的消息代码。
TARGET_MULTICLASS_NOT_ENOUGH_CLASSES
多类别分类问题的目标数据没有多于两个唯一类别时的消息代码。
TARGET_MULTICLASS_NOT_TWO_EXAMPLES_PER_CLASS
多类别分类问题的目标数据没有每类两个示例时的消息代码。
TARGET_UNSUPPORTED_PROBLEM_TYPE
对照不支持的问题类型检查目标数据时的消息代码。
TARGET_UNSUPPORTED_TYPE
目标数据类型不受支持时的消息代码。
TARGET_UNSUPPORTED_TYPE_REGRESSION
目标数据与回归不兼容时的消息代码
TIMESERIES_PARAMETERS_NOT_COMPATIBLE_WITH_SPLIT
当时间序列参数对于最小数据分割过大时的消息代码。
TIMESERIES_TARGET_NOT_COMPATIBLE_WITH_SPLIT
当时间序列目标的任何训练和验证分割不包含所有类别时的消息代码。
TOO_SPARSE
当多类别数据的值过于稀疏时的消息代码。
TOO_UNIQUE
数据包含过多唯一值时的消息代码。
方法
- name(self)#
枚举成员的名称。
- value(self)#
枚举成员的值。