# 准备数据
data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)
## 数据基本信息
cat_cols = [col for col in df.columns if df[col].dtype == "object"] # 类别型变量名
num_cols = [col for col in df.columns if df[col].dtype != "object"] # 数值型变量名
# 提取目标变量和特征变量
target = 'target'
features = df.columns.drop(target)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(df[features], df[target], test_size=0.2, random_state=0)
2.2 模型训练与保存
利用训练集进行训练模型:
# 模型的构建与训练
model = RandomForestClassifier()
model.fit(X_train, y_train)
# 使用 pickle 保存模型
with open('./random_forest_model.pkl', 'wb') as file:
pickle.dump(model, file)
模型保存为pkl文件:

2.3 模型推理与评价
加载训练好的模型(文件),输入测试集进行预测:
# 加载保存的模型
with open('./random_forest_model.pkl', 'rb')

本文介绍了如何使用Python的sklearn库训练机器学习模型并使用pickle进行保存。接着,展示了如何加载保存的模型进行推理与评价。内容包括模型训练、保存为pkl文件以及加载模型进行预测的步骤。此外,文章还分享了作者的个人经历及一份全面的Python开发学习资源,供读者提升技能。

1006

被折叠的 条评论
为什么被折叠?



