sensitivity_low_alert#

低警报率下的灵敏度目标。

模块内容#

类摘要#

SensitivityLowAlert

低警报率下的灵敏度。

属性摘要#

logger

内容#

evalml.objectives.sensitivity_low_alert.logger#

class evalml.objectives.sensitivity_low_alert.SensitivityLowAlert(alert_rate=0.01)[源代码]#

低警报率下的灵敏度。

参数: alert_rate (float) – 属于高风险的最高分数的百分比。

属性

expected_range	[0, 1]
greater_is_better	True
is_bounded_like_percentage	True
name	低警报率下的灵敏度
perfect_score	1.0
problem_types	[ProblemTypes.BINARY, ProblemTypes.TIME_SERIES_BINARY]
score_needs_proba	False

方法

`calculate_percent_difference`	计算分数之间的百分比差异。
`can_optimize_threshold`	返回一个布尔值，确定我们是否可以优化二分类目标阈值。
`decision_function`	给定警报率，判断一个观测值是否是高风险。
`is_defined_for_problem_type`	返回一个目标是否针对特定问题类型定义。
`objective_function`	计算所有预测的灵敏度，将排名前 alert_rate 百分比的观测值归类为预测的正类。
`optimize_threshold`	学习一个二分类阈值，该阈值可以优化当前目标。
`positive_only`	如果为 True，则此目标仅对正向数据有效。默认为 False。
`score`	根据预测值与实际值之间的差异返回一个数值分数，表示性能。
`validate_inputs`	验证评分输入。

classmethod calculate_percent_difference(cls, score, baseline_score)#

计算分数之间的百分比差异。

参数

score (float) – 分数。此目标的 score 方法的输出。
baseline_score (float) – 分数。此目标的 score 方法的输出。实践中，这是使用基准估计器在此目标上获得的分数。

返回

分数之间的百分比差异。请注意，对于可以解释为百分比的目标，: 这将是参考分数与分数之间的差异。对于所有其他目标，差异将通过参考分数归一化。

返回类型

float

property can_optimize_threshold(cls)#

返回一个布尔值，确定我们是否可以优化二分类目标阈值。

对于直接处理预测概率（如对数损失和 AUC）的任何目标，这将为 false。否则为 true。

返回: 一个目标是否可以优化。
返回类型: bool

decision_function(self, ypred_proba, **kwargs)[源代码]#

给定警报率，判断一个观测值是否是高风险。

参数

ypred_proba (pd.Series) – 预测概率。
**kwargs – 其他任意参数。

返回

给定警报率，判断一个观测值是否是高风险。

返回类型

pd.Series

classmethod is_defined_for_problem_type(cls, problem_type)#: 返回一个目标是否针对特定问题类型定义。

objective_function(self, y_true, y_predicted, **kwargs)[源代码]#

计算所有预测的灵敏度，将排名前 alert_rate 百分比的观测值归类为预测的正类。

参数

y_true (pd.Series) – 真实标签。
y_predicted (pd.Series) – 基于警报率的预测标签。
**kwargs – 其他任意参数。

返回

使用具有最高分数的观测值作为预测的正类的灵敏度。

返回类型

float

optimize_threshold(self, ypred_proba, y_true, X=None)#

学习一个二分类阈值，该阈值可以优化当前目标。

参数

ypred_proba (pd.Series) – 分类器的预测概率。
y_true (pd.Series) – 预测的地面真相标签。
X (pd.DataFrame, optional) – 从训练数据中需要的任何额外列。

返回

此目标的最佳阈值。

抛出

RuntimeError – 如果目标无法优化。

positive_only(cls)#: 如果为 True，则此目标仅对正向数据有效。默认为 False。

score(self, y_true, y_predicted, y_train=None, X=None, sample_weight=None)#

根据预测值与实际值之间的差异返回一个数值分数，表示性能。

参数

y_predicted (pd.Series) – 长度为 [n_samples] 的预测值
y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签
y_train (pd.Series) – 长度为 [n_samples] 的观测训练值
X (pd.DataFrame 或 np.ndarray) – 形状为 [n_samples, n_features]，计算分数所需的额外数据
sample_weight (pd.DataFrame 或 np.ndarray) – 计算目标值结果时使用的样本权重

返回

score

validate_inputs(self, y_true, y_predicted)#: 验证评分输入。