说明:本篇文章整理Transfer Learning tutorial上的知识点;关于迁移学习,请移步:cs231n notes
简要说明为何需要迁移学习:
在实际中,我们很少会训练一整个卷积神经网络(所有的参数从随机初始值开始训练),因为我们很难找到足够大的数据集。实际上,我们会用一个非常大的数据集(如ImageNet)来预训练一个卷积神经网络,然后使用这个神经网络来作为初始化权重或者是特征提取器。
迁移学习的两个基本操作:
· 使用预训练网络的权重作为训练模型的初始权重,而不是随机初始化的参数。
· 固定卷积层的参数不动,训练、微调全连接层(分类器);全连接层的参数是随机初始化的。
需要用到的库:
from __future__ import print_function, division
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
from torch.autograd import Variable
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy
plt.ion() # interactive mode
加载数据,将数据集放在脚本文件的相对目录下:


2万+

被折叠的 条评论
为什么被折叠?



