回归目标#
所有回归目标的基类。
模块内容#
内容#
- class evalml.objectives.regression_objective.RegressionObjective[来源]#
所有回归目标的基类。
属性
问题类型
[问题类型.回归, 问题类型.时间序列回归, 问题类型.多元时间序列回归]
方法
计算分数之间的百分比差异。
返回目标的预期范围,不一定是可能的范围。
返回一个布尔值,表示分数越大是否表明模型性能越好。
返回此目标是否介于 0 到 1 之间(含)有界。
返回某个目标是否针对某种问题类型定义。
返回描述目标的名称。
根据指定的指标,计算提供的预测与实际标签相比的相对值。
返回通过在完美模型上评估此目标获得的分数。
如果为 True,此目标仅对正数据有效。默认为 False。
返回一个数值分数,根据预测值和实际值之间的差异来指示性能。
对于使用预测概率的目标(如对数损失或 AUC),这应为 true;对于比较预测类别标签与实际标签的目标(如 F1 或相关性),这应为 false。
根据几个简单检查验证输入。
- classmethod calculate_percent_difference(cls, score, baseline_score)#
计算分数之间的百分比差异。
- 参数
score (float) – 一个分数。此目标的分数方法的输出。
baseline_score (float) – 一个分数。此目标的分数方法的输出。实际上,这是使用基准估计器在此目标上获得的分数。
- 返回
- 分数之间的百分比差异。注意,对于可以解释为百分比的目标,这将是参考分数和分数之间的差异。
对于所有其他目标,差异将由参考分数归一化。
- 返回类型
float
- property expected_range(cls)#
返回目标的预期范围,不一定是可能的范围。
例如,我们预期的 R2 范围是 [-1, 1],尽管实际范围是 (-inf, 1]。
- property greater_is_better(cls)#
返回一个布尔值,表示分数越大是否表明模型性能越好。
- property is_bounded_like_percentage(cls)#
返回此目标是否介于 0 到 1 之间(含)有界。
- classmethod is_defined_for_problem_type(cls, problem_type)#
返回某个目标是否针对某种问题类型定义。
- property name(cls)#
返回描述目标的名称。
- abstract classmethod objective_function(cls, y_true, y_predicted, y_train=None, X=None, sample_weight=None)#
根据指定的指标,计算提供的预测与实际标签相比的相对值。
- 参数
y_predicted (pd.Series) – 长度为 [n_samples] 的预测值
y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签
y_train (pd.Series) – 长度为 [n_samples] 的观察训练值
X (pd.DataFrame 或 np.ndarray) – 计算分数所需的形状为 [n_samples, n_features] 的额外数据
sample_weight (pd.DataFrame 或 np.ndarray) – 用于计算目标值结果的样本权重
- 返回
用于计算分数的数值
- property perfect_score(cls)#
返回通过在完美模型上评估此目标获得的分数。
- positive_only(cls)#
如果为 True,此目标仅对正数据有效。默认为 False。
- score(self, y_true, y_predicted, y_train=None, X=None, sample_weight=None)#
返回一个数值分数,根据预测值和实际值之间的差异来指示性能。
- 参数
y_predicted (pd.Series) – 长度为 [n_samples] 的预测值
y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签
y_train (pd.Series) – 长度为 [n_samples] 的观察训练值
X (pd.DataFrame 或 np.ndarray) – 计算分数所需的形状为 [n_samples, n_features] 的额外数据
sample_weight (pd.DataFrame 或 np.ndarray) – 用于计算目标值结果的样本权重
- 返回
分数
- property score_needs_proba(cls)#
对于使用预测概率的目标(如对数损失或 AUC),这应为 true;对于比较预测类别标签与实际标签的目标(如 F1 或相关性),这应为 false。
对于使用预测概率的目标(如对数损失或 AUC),这应为 true;对于比较预测类别标签与实际标签的目标(如 F1 或相关性),这应为 false。
- validate_inputs(self, y_true, y_predicted)#
根据几个简单检查验证输入。
- 参数
y_predicted (pd.Series 或 pd.DataFrame) – 长度为 [n_samples] 的预测值。
y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签。
- 引发
ValueError – 如果输入格式不正确。