sensitivity_low_alert#
低警报率下的灵敏度目标。
模块内容#
类摘要#
低警报率下的灵敏度。 |
内容#
- evalml.objectives.sensitivity_low_alert.logger#
- class evalml.objectives.sensitivity_low_alert.SensitivityLowAlert(alert_rate=0.01)[源代码]#
低警报率下的灵敏度。
- 参数
alert_rate (float) – 属于高风险的最高分数的百分比。
属性
expected_range
[0, 1]
greater_is_better
True
is_bounded_like_percentage
True
name
低警报率下的灵敏度
perfect_score
1.0
problem_types
[ProblemTypes.BINARY, ProblemTypes.TIME_SERIES_BINARY]
score_needs_proba
False
方法
计算分数之间的百分比差异。
返回一个布尔值,确定我们是否可以优化二分类目标阈值。
给定警报率,判断一个观测值是否是高风险。
返回一个目标是否针对特定问题类型定义。
计算所有预测的灵敏度,将排名前 alert_rate 百分比的观测值归类为预测的正类。
学习一个二分类阈值,该阈值可以优化当前目标。
如果为 True,则此目标仅对正向数据有效。默认为 False。
根据预测值与实际值之间的差异返回一个数值分数,表示性能。
验证评分输入。
- classmethod calculate_percent_difference(cls, score, baseline_score)#
计算分数之间的百分比差异。
- 参数
score (float) – 分数。此目标的 score 方法的输出。
baseline_score (float) – 分数。此目标的 score 方法的输出。实践中,这是使用基准估计器在此目标上获得的分数。
- 返回
- 分数之间的百分比差异。请注意,对于可以解释为百分比的目标,
这将是参考分数与分数之间的差异。对于所有其他目标,差异将通过参考分数归一化。
- 返回类型
float
- property can_optimize_threshold(cls)#
返回一个布尔值,确定我们是否可以优化二分类目标阈值。
对于直接处理预测概率(如对数损失和 AUC)的任何目标,这将为 false。否则为 true。
- 返回
一个目标是否可以优化。
- 返回类型
bool
- decision_function(self, ypred_proba, **kwargs)[源代码]#
给定警报率,判断一个观测值是否是高风险。
- 参数
ypred_proba (pd.Series) – 预测概率。
**kwargs – 其他任意参数。
- 返回
给定警报率,判断一个观测值是否是高风险。
- 返回类型
pd.Series
- classmethod is_defined_for_problem_type(cls, problem_type)#
返回一个目标是否针对特定问题类型定义。
- objective_function(self, y_true, y_predicted, **kwargs)[源代码]#
计算所有预测的灵敏度,将排名前 alert_rate 百分比的观测值归类为预测的正类。
- 参数
y_true (pd.Series) – 真实标签。
y_predicted (pd.Series) – 基于警报率的预测标签。
**kwargs – 其他任意参数。
- 返回
使用具有最高分数的观测值作为预测的正类的灵敏度。
- 返回类型
float
- optimize_threshold(self, ypred_proba, y_true, X=None)#
学习一个二分类阈值,该阈值可以优化当前目标。
- 参数
ypred_proba (pd.Series) – 分类器的预测概率。
y_true (pd.Series) – 预测的地面真相标签。
X (pd.DataFrame, optional) – 从训练数据中需要的任何额外列。
- 返回
此目标的最佳阈值。
- 抛出
RuntimeError – 如果目标无法优化。
- positive_only(cls)#
如果为 True,则此目标仅对正向数据有效。默认为 False。
- score(self, y_true, y_predicted, y_train=None, X=None, sample_weight=None)#
根据预测值与实际值之间的差异返回一个数值分数,表示性能。
- 参数
y_predicted (pd.Series) – 长度为 [n_samples] 的预测值
y_true (pd.Series) – 长度为 [n_samples] 的实际类别标签
y_train (pd.Series) – 长度为 [n_samples] 的观测训练值
X (pd.DataFrame 或 np.ndarray) – 形状为 [n_samples, n_features],计算分数所需的额外数据
sample_weight (pd.DataFrame 或 np.ndarray) – 计算目标值结果时使用的样本权重
- 返回
score
- validate_inputs(self, y_true, y_predicted)#
验证评分输入。