cf_engine#

自定义 CFClient API 以匹配 Dask 的 CFClient 并允许上下文管理。

模块内容#

类摘要#

CFClient

自定义 CFClient API 以匹配 Dask 的 CFClient 并允许上下文管理。

CFComputation

CFEngine 创建的任务的类似 Future 的包装器。

CFEngine

concurrent.futures (CF) 引擎。

内容#

class evalml.automl.engine.cf_engine.CFClient(pool)[source]#

自定义 CFClient API 以匹配 Dask 的 CFClient 并允许上下文管理。

参数

pool (cf.ThreadPoolExecutor or cf.ProcessPoolExecutor) – 要执行 Future 工作的资源池。

方法

close

关闭底层执行器。

is_closed

确定引擎客户端资源是否已关闭的属性。

submit

透传以模仿 Dask 的 Client API。

close(self)[source]#

关闭底层执行器。

property is_closed(self)#

确定引擎客户端资源是否已关闭的属性。

submit(self, *args, **kwargs)[source]#

透传以模仿 Dask 的 Client API。

class evalml.automl.engine.cf_engine.CFComputation(future)[source]#

CFEngine 创建的任务的类似 Future 的包装器。

参数

future (cf.Future) – 期望执行的 concurrent.futures.Future 对象。

方法

cancel

取消当前计算。

done

返回计算是否完成。

get_result

获取计算结果。将阻塞直到计算完成。

is_cancelled

返回计算是否被取消。

cancel(self)[source]#

取消当前计算。

返回

如果调用当前正在执行或已完成运行

并且无法取消,则返回 False。如果可以取消调用,则返回 True。

返回类型

bool

done(self)[source]#

返回计算是否完成。

get_result(self)[source]#

获取计算结果。将阻塞直到计算完成。

引发
  • Exception – 如果计算失败。返回追溯信息。

  • cf.TimeoutError – 如果计算耗时超过默认超时时间。

  • cf.CancelledError – 如果计算在完成前被取消。

返回

请求任务的结果。

property is_cancelled(self)#

返回计算是否被取消。

class evalml.automl.engine.cf_engine.CFEngine(client=None)[source]#

concurrent.futures (CF) 引擎。

参数

client (None or CFClient) – 如果为 None,则创建线程池进行处理。默认为 None。

方法

close

用于正确关闭引擎客户端资源的函数。

is_closed

确定引擎客户端资源是否已关闭的属性。

setup_job_log

为任务设置日志记录器。

submit_evaluation_job

将评估任务发送到集群。

submit_scoring_job

将评分任务发送到集群。

submit_training_job

将训练任务发送到集群。

close(self)[source]#

用于正确关闭引擎客户端资源的函数。

property is_closed(self)#

确定引擎客户端资源是否已关闭的属性。

static setup_job_log()#

为任务设置日志记录器。

submit_evaluation_job(self, automl_config, pipeline, X, y, X_holdout=None, y_holdout=None)[source]#

将评估任务发送到集群。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据结构。

  • pipeline (pipeline.PipelineBase) – 要评估的 Pipeline。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

  • X_holdout (pd.Series) – 用于留出集评分的留出输入数据。

  • y_holdout (pd.Series) – 用于留出集评分的留出目标数据。

返回

包装对资源池中进行中的类似 Future 计算引用的对象

出现在资源池中

返回类型

CFComputation

submit_scoring_job(self, automl_config, pipeline, X, y, objectives, X_train=None, y_train=None)[source]#

将评分任务发送到集群。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据结构。

  • pipeline (pipeline.PipelineBase) – 要训练的 Pipeline。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

  • X_train (pd.DataFrame) – 训练特征。用于时间序列的特征工程。

  • y_train (pd.Series) – 训练目标。用于时间序列的特征工程。

  • objectives (list[ObjectiveBase]) – 用于评分的目标列表。

返回

包装对资源池中进行中的类似 Future 计算引用的对象

在资源池中进行中的对象。

返回类型

CFComputation

submit_training_job(self, automl_config, pipeline, X, y)[source]#

将训练任务发送到集群。

参数
  • automl_config – 包含从 AutoMLSearch 实例传递的数据结构。

  • pipeline (pipeline.PipelineBase) – 要训练的 Pipeline。

  • X (pd.DataFrame) – 用于建模的输入数据。

  • y (pd.Series) – 用于建模的目标数据。

返回

包装对资源池中进行中的类似 Future 计算引用的对象

出现在资源池中

返回类型

CFComputation