示例#

示例数据集。

包内容#

函数#

load_breast_cancer

加载乳腺癌数据集。二元分类问题。

load_churn

加载流失数据集,可用于二元分类问题。

load_diabetes

加载糖尿病数据集。用于回归问题。

load_fraud

加载信用卡欺诈数据集。

load_weather

加载澳大利亚日最低气温天气数据集。

load_wine

加载葡萄酒数据集。多类别问题。

目录#

evalml.demos.load_breast_cancer()[source]#

加载乳腺癌数据集。二元分类问题。

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)

evalml.demos.load_churn(n_rows=None, verbose=True)[source]#

加载流失数据集,可用于二元分类问题。

参数
  • n_rows (int) – 从数据集中返回的行数

  • verbose (bool) – 是否打印关于特征和标签的信息

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)

evalml.demos.load_diabetes()[source]#

加载糖尿病数据集。用于回归问题。

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)

evalml.demos.load_fraud(n_rows=None, verbose=True)[source]#

加载信用卡欺诈数据集。

欺诈数据集可用于二元分类问题。

参数
  • n_rows (int) – 从数据集中返回的行数

  • verbose (bool) – 是否打印关于特征和标签的信息

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)

evalml.demos.load_weather()[source]#

加载澳大利亚日最低气温天气数据集。

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)

evalml.demos.load_wine()[source]#

加载葡萄酒数据集。多类别问题。

返回值

X 和 y

返回类型

(pd.Dataframe, pd.Series)