Python深度学习笔记(三)二分类模型

这篇博客详细介绍了Python深度学习中二分类模型的应用,包括数据预处理、网络架构和模型训练验证。作者使用IMDB数据集,通过Keras库构建了含有ReLU激活函数的全连接网络,并用Sigmoid激活的输出层进行二分类任务,选择了二元交叉熵作为损失函数。

Python深度学习笔记(三)二分类模型

继续来写我的学习笔记 -----二分类问题
我从数据的处理,模型的构架,训练过程,验证模型及损失和精度的比较这几个方面来介绍。

一,数据的处理

一个典型的二分类问题的例子:根据电影的评论的文字内容将评论的文字划分为正面和负面。
我们使用IMDB数据集,它包含50000条严重两极分化的评论,数据集被分为用于训练和测试的数据各25000条。数据集和测试集都包含50%的正面评论和50%的负面评论。
下列代码将会加载IMDB数据集:

from keras.datasets import  imdb

(train_data,train_labels),(test_data,test_labels) = imdb.load_data(num_words=10000)

参数num_words=10000的意思是仅保留训练数据前10000个常见的单词。低频单词将被舍弃。
train_data和test_data这两个变量是评论组成的列表,每条评论又是单词索引组成的列表。train_labels和test_labels都是0和1组成的列表。0代表负面,1代表正面。这一步是下载数据,接下来我们要做的是准备数据。
我们要将数据输入网络,必须进行将列表向张量的转换。
下面这段代码是将数据向量化.

import numpy as np
def vectorize_sequences(sequences,dimension=10000):
    results = np.zeros((len(sequences),dimension))
    for i,sequence in enumerate(sequences):
        results[i,sequence]=1.
        return  results
x_train=vectorize_sequences(train_data)
x_test=vectorize_sequences(test_data)
y_train=np.asarray(train_labels).astype('float32')
y_test =np.asarray(test_labels).astype('float32')

构建网络

我们可以发现输入数据是向量,而标签是标量。对于这种情况,我们可以选用带有relu激活的全连接层(Dense)的简单堆叠,比如Dense(16,activation=‘relu’)。所以我们选择的网络构架为:两个中间层,每层都有16个隐藏单元。第三层输出一个标量,预测当前评论的情感。中间层使用relu作为激活函数,最后一层使用sigmoid激活以输出一个0~1范围内的概率值(表示样本的目标值等于1的可能性,即评论为正面性)。relu函数将所有负值归零,而sigmoid函数则将任意值“压缩”到[0,1]区间内,其输出值可以看作概率值。下图为Relu函数图像:
Relu函数图像
该图为Sigmoid激活函数图像:
sigmoid激活函数

from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(16,activation='relu',input_shape=(10000,)))
model.add(layers.Dense(16,activation='relu'))
model.add(layers.Dense(1,activation='sigmoid'))

最后,我们选择损失函数和优化器。由于网络输出是一个概率值,那么我们选择二元交叉熵损失是一个比较好的选择,下面代码是配置损失函数和优化器:

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

训练和验证模型

下面给出代码:

from keras.datasets import  imdb
import numpy as np
from keras import models
from keras import layers
import matplotlib.pyplot as plt


(train_data,train_labels),(test_data,test_labels) = imdb.load_data(num_words=10000)

def vectorize_sequences(sequences,dimension=10000):
    results = np.zeros((len(sequences),dimension))
    for i,sequence in enumerate(sequences):
        results[i,sequence]=1.
        return  results

x_train=vectorize_sequences(train_data)
x_test=vectorize_sequences(test_data)
y_train=np.asarray(train_labels).astype('float32')
y_test =np.asarray(test_labels).astype('float32')
print(x_train[0])
x_val=x_train[:10000]
partial_x_train=x_train[10000:]

y_val = y_train[:10000]
partial_y_train=y_train[10000:]


model = models.Sequential()
model.add(layers.Dense(16,activation='relu',input_shape=(10000,)))
model.add(layers.Dense(16,activation='relu'))
model.add(layers.Dense(1,activation='sigmoid'))

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

history=model.fit(partial_x_train,
                  partial_y_train,
                  epochs=20,
                  batch_size=512,
                  validation_data=(x_val,y_val))

history_dict=history.history
loss_values=history_dict['loss']
val_loss_values=history_dict['val_loss']

epochs=range(1,len((loss_values)+1))

plt.plot(epochs,loss_values,'bo',label='Training loss')
plt.plot(epochs,val_loss_values,'b',label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值