torch中train,eval实际对是model.training的控制

最新推荐文章于 2026-06-05 09:08:34 发布

原创最新推荐文章于 2026-06-05 09:08:34 发布 · 1.7k 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#pytorch #python

收录于

机器学习同时被 2 个专栏收录

48 篇文章

订阅专栏

python

30 篇文章

订阅专栏

这篇博客介绍了PyTorch中模型的训练和评估模式。默认情况下，模型处于训练模式，model.training属性为True。当切换到eval模式时，model.training变为False，这在验证或预测阶段是必要的，因为某些层（如dropout或batch normalization）的行为会有所不同。

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

模型在默认情况下是train模型，所以model.training为True
模型在eval情况下，model.training为False

#-*- coding:utf-8 -*-
#Author LJB Create on 2021/8/27
# -*- coding: utf-8 -*-
import torch

class TestModel(torch.nn.Module):
    def __init__(self):
        super(TestModel,self).__init__()
    def forward(self,x):
        return x

model = TestModel()

#默认为model.train()
print(model.training) #True

model.eval()
print(model.training) #False

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。