sensitivity_low_alert#

低警报率下的灵敏度目标。

模块内容#

类摘要#

SensitivityLowAlert

低警报率下的灵敏度。

属性摘要#

内容#

evalml.objectives.sensitivity_low_alert.logger#
class evalml.objectives.sensitivity_low_alert.SensitivityLowAlert(alert_rate=0.01)[源代码]#

低警报率下的灵敏度。

参数

alert_rate (float) – 属于高风险的最高分数的百分比。

属性

expected_range

[0, 1]

greater_is_better

True

is_bounded_like_percentage

True

name

低警报率下的灵敏度

perfect_score

1.0

problem_types

[ProblemTypes.BINARY, ProblemTypes.TIME_SERIES_BINARY]

score_needs_proba

False

方法

calculate_percent_difference

计算分数之间的百分比差异。

can_optimize_threshold

返回一个布尔值,确定我们是否可以优化二分类目标阈值。

decision_function

给定警报率,判断一个观测值是否是高风险。

is_defined_for_problem_type

返回一个目标是否针对特定问题类型定义。

objective_function

计算所有预测的灵敏度,将排名前 alert_rate 百分比的观测值归类为预测的正类。

optimize_threshold

学习一个二分类阈值,该阈值可以优化当前目标。

positive_only

如果为 True,则此目标仅对正向数据有效。默认为 False。

score

根据预测值与实际值之间的差异返回一个数值分数,表示性能。

validate_inputs

验证评分输入。

classmethod calculate_percent_difference(cls, score, baseline_score)#

计算分数之间的百分比差异。

参数
  • score (float) – 分数。此目标的 score 方法的输出。

  • baseline_score (float) – 分数。此目标的 score 方法的输出。实践中,这是使用基准估计器在此目标上获得的分数。

返回

分数之间的百分比差异。请注意,对于可以解释为百分比的目标,

这将是参考分数与分数之间的差异。对于所有其他目标,差异将通过参考分数归一化。

返回类型

float

property can_optimize_threshold(cls)#

返回一个布尔值,确定我们是否可以优化二分类目标阈值。

对于直接处理预测概率(如对数损失和 AUC)的任何目标,这将为 false。否则为 true。

返回

一个目标是否可以优化。

返回类型

bool

decision_function(self, ypred_proba, **kwargs)[源代码]#

给定警报率,判断一个观测值是否是高风险。

参数
  • ypred_proba (pd.Series) – 预测概率。

  • **kwargs – 其他任意参数。

返回

给定警报率,判断一个观测值是否是高风险。

返回类型

pd.Series

classmethod is_defined_for_problem_type(cls, problem_type)#

返回一个目标是否针对特定问题类型定义。

objective_function(self, y_true, y_predicted, **kwargs)[源代码]#

计算所有预测的灵敏度,将排名前 alert_rate 百分比的观测值归类为预测的正类。

参数
  • y_true (pd.Series) – 真实标签。

  • y_predicted (pd.Series) – 基于警报率的预测标签。

  • **kwargs – 其他任意参数。

返回

使用具有最高分数的观测值作为预测的正类的灵敏度。

返回类型

float

optimize_threshold(self, ypred_proba, y_true, X=None)#

学习一个二分类阈值,该阈值可以优化当前目标。

参数
  • ypred_proba (pd.Series) – 分类器的预测概率。

  • y_true (pd.Series) – 预测的地面真相标签。

  • X (pd.DataFrame, optional) – 从训练数据中需要的任何额外列。

返回

此目标的最佳阈值。

抛出

RuntimeError – 如果目标无法优化。

positive_only(cls)#

如果为 True,则此目标仅对正向数据有效。默认为 False。

score(self, y_true, y_predicted, y_train=None, X=None, sample_weight=None)#

根据预测值与实际值之间的差异返回一个数值分数,表示性能。

参数
  • y_predicted (pd.Series) – 长度为 [n_samples] 的预测值

  • y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签

  • y_train (pd.Series) – 长度为 [n_samples] 的观测训练值

  • X (pd.DataFramenp.ndarray) – 形状为 [n_samples, n_features],计算分数所需的额外数据

  • sample_weight (pd.DataFramenp.ndarray) – 计算目标值结果时使用的样本权重

返回

score

validate_inputs(self, y_true, y_predicted)#

验证评分输入。