sequential_engine#

SequentialEngine(一个顺序计算提交的作业的引擎)创建的作业的 Future-like API。

模块内容#

类摘要#

SequentialComputation

SequentialEngine(一个顺序计算提交的作业的引擎)创建的作业的 Future-like API。

SequentialEngine

Automl 搜索的默认引擎。

目录#

class evalml.automl.engine.sequential_engine.SequentialComputation(work, **kwargs)[源代码]#

SequentialEngine(一个顺序计算提交的作业的引擎)创建的作业的 Future-like API。

为了将引擎与 AutoMLSearch 循环分离,我们需要使顺序计算从 AutoMLSearch 的角度看与并发计算行为相同。一种方法是在调用 get_result 时延迟顺序引擎中的计算。由于 AutoMLSearch 只会在计算“完成”时调用 get_result,通过在 done() 中始终返回 True,我们确保按照提交作业的顺序调用 get_result。这样计算就会顺序发生!

参数

work (callable) – 引擎应完成的计算。

方法

cancel

取消当前计算。

done

计算是否完成。

get_result

获取计算结果。将阻塞直到计算完成。

cancel(self)[源代码]#

取消当前计算。

done(self)[源代码]#

计算是否完成。

返回

始终返回 True。

返回类型

bool

get_result(self)[源代码]#

获取计算结果。将阻塞直到计算完成。

抛出

Exception – 如果计算失败。返回追溯信息。

返回

计算结果。

class evalml.automl.engine.sequential_engine.SequentialEngine[源代码]#

Automl 搜索的默认引擎。

在本地顺序训练和评估管线。

方法

close

空操作。

setup_job_log

为作业设置日志记录器。

submit_evaluation_job

提交评估管线的作业。

submit_scoring_job

提交评估管线分数的作业。

submit_training_job

提交训练管线的作业。

close(self)[源代码]#

空操作。

static setup_job_log()#

为作业设置日志记录器。

submit_evaluation_job(self, automl_config, pipeline, X, y, X_holdout=None, y_holdout=None)[源代码]#

提交评估管线的作业。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据的结构。

  • pipeline (pipeline.PipelineBase) – 要评估的管线。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

  • X_holdout (pd.Series) – 用于留置评分的留置输入数据。

  • y_holdout (pd.Series) – 用于留置评分的留置目标数据。

返回

计算结果。

返回类型

SequentialComputation

submit_scoring_job(self, automl_config, pipeline, X, y, objectives, X_train=None, y_train=None)[源代码]#

提交评估管线分数的作业。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据的结构。

  • pipeline (pipeline.PipelineBase) – 要训练的管线。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

  • X_train (pd.DataFrame) – 训练特征。用于时间序列中的特征工程。

  • y_train (pd.Series) – 训练目标。用于时间序列中的特征工程。

  • objectives (list[ObjectiveBase]) – 要评分的目标列表。

返回

计算结果。

返回类型

SequentialComputation

submit_training_job(self, automl_config, pipeline, X, y)[源代码]#

提交训练管线的作业。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据的结构。

  • pipeline (pipeline.PipelineBase) – 要评估的管线。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

返回

计算结果。

返回类型

SequentialComputation