适用于深度学习初学者的深度学习模板

bigegpt 2024-11-10 08:27 41 浏览

深度学习备忘单（图片来自我的网站）

什么是深度学习？

深度学习是使用神经网络的机器学习模型的一个子类别。简而言之，神经网络连接多层节点，每个节点都可以被视为迷你机器学习模型。然后，模型的输出作为后续节点的输入进给。

深度学习模型（图片由作者提供）

TensorFlow是一个Python库，主要专注于提供深度学习框架。要安装和导入TensorFlow库：

pip install tensorflow
import tensorflow as tf

如何构建TensorFlow深度神经网络

深度学习模型的骨架通常遵循以下结构，我们可以使用Keras API来实现一个对初学者友好的深度学习模型。我们可以在每个阶段添加很多变化，使模型更加复杂。

准备数据集：数据准备和特征工程技术
定义模型：模型类型、层数和单位数、激活函数
编译模型：优化器、学习率、损失函数、指标
适合模型：批量大小，纪元
评估和预测：评估指标

从我网站上的代码片段部分获取代码模板。

1.准备数据集

深度学习从根本上说是一种机器学习算法，由监督学习和无监督学习组成。对于监督学习，它需要将数据集拆分为训练和测试集（有时也涉及验证集），如下所示。

从sklearn.model_selection导入train_test_split
X = df.drop(['user-definedlabeln'], axis=1)
y = df['user-definedlabeln']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

您可以使用原始数据集做更多事情，例如预处理和功能工程，但让我们在本文中保持简单。

2.定义模型

深度学习神经网络最简单的形式之一是顺序模型，它由单个层组成，每层只有一个输入张量和一个输出张量。我们可以通过传递多个密集层来创建顺序模型。

顺序模型（作者的图像）

model = tf.keras.models.Sequential([
keras.layers.Dense(units=32, activation="sigmoid"),
keras.layers.Dense(units=16, activation="sigmoid"),
keras.layers.Dense（单位=1，激活="ReLU"）
】）

层数和单元数：深度学习模型必须有一个输入层和一个输出层。输入和输出之间的隐藏层数量可能会有所不同。每层的单位数也是我们可以实验的超参数。文章“如何配置神经网络中的层数和节点数”提供了有关如何实验和执行搜索以确定层数和节点数的指南。

激活功能：模型的每一层都需要一个激活功能。您可以将其视为将节点输入转换为输出的迷你统计模型。激活函数有助于神经网络的非线性。隐藏层通常应用相同的激活功能，输出层可以具有不同的功能，这取决于它是分类还是回归预测。

以下是常见的激活功能，每个功能都有其优点和缺点。

Sigmoid：从0到1不等，sigmoid适合二进制分类
ReLU：它保留了线性行为，并解决了Sigmoid和Tanh中消失的梯度问题，但当输入为负时，它可能会遇到其他问题，如饱和或死单位
Tanh：更强的梯度使其对微小差异更敏感，但它存在极端值的饱和度和缓慢学习率的问题
线性：它适用于具有连续数字输出的回归问题

激活功能（作者图片）

推荐阅读：如何选择深度学习的激活功能

3.编译模型

深度学习模型使用反向扩展来学习。简而言之，它从预测错误中学习，并调整分配给每个节点的权重，以尽量减少预测错误。在编译模型的阶段，我们需要指定用于测量误差的损失函数，以及用于减少损失的优化器算法。

from tensorflow.keras.optimizers import RMSprop
model.compile(optimizer= RMSprop(learning_rate=0.001), loss="binary_crossentropy", metrics=['accuracy'])

优化器：优化器定义了用于优化模型的优化算法，以减少误差。简要介绍一些优化器的例子：

梯度下降：它通过根据函数的梯度更新参数来最小化损失函数
随机梯度下降：一种流行的梯度下降变体，更新每个训练示例的参数
RMSProp：它计算自适应学习率，通常用于循环神经网络
动量：它借鉴了物理学的想法，即学习速度根据梯度方向进行适应，从而导致更快的收敛
Adam：它结合了RMSProp和Momentum的优势，并且在处理大型数据集时效率高

4.适合模型

model.fit()函数将训练数据集X_train和训练标签y_train适合于模型。培训过程的复杂性也受到纪元和批次大小的控制。

model.fit（X_train，y_train，epochs = 15，batch_size = 10）

批次和纪元（图片由作者提供）

纪元：它控制完成培训所需的整个培训集的迭代次数。

batch_size：它决定了更新模型参数需要多少训练样本。如果batch_size与训练集的大小相同，模型将使用整个训练数据集来更新模型参数。如果batch_size = 1，它将使用每个数据点来更新模型参数。

推荐阅读：大纪元vs批量大小vs迭代

5.评估和预测

请记住，我们最初将整个数据集拆分为训练和测试。测试集已从整个模型构建过程中被遗漏。这是因为我们需要使用持有测试数据集来评估其在看不见的数据上的性能。只需通过以下测试数据集，它就会返回在模型编译阶段指定的模型评估指标。

model.evaluate（X_test，y_test）

一旦你对模型性能感到满意，你就可以部署它进行预测。

model.predict（predict_data）

当前模型只能被视为基线模型，并且仍然可以进行许多改进来提高其准确性。本文提供了提高深度学习基线模型性能的有用指南：如何提高深度学习性能。

谢谢你走到尽头。如果您想阅读更多我在Medium上的文章，我将非常感谢您的支持，注册Medium会员??

带回家留言

本文介绍了初学者的深度学习模板。在每个阶段，我们可以通过对超参数进行实验来增加神经网络模型的变异和复杂性：

准备数据集：数据预处理和特征工程技术
定义模型：模型类型、层数和单位数、激活函数
编译模型：优化器、学习率、损失函数、指标
适合模型：批量大小，纪元
评估和预测

layers.dense

上一篇：深度学习的学习率调节实践深度学习提高精度
下一篇：从头开始可视化神经网络的工作方式

适用于深度学习初学者的深度学习模板

什么是深度学习？

如何构建TensorFlow深度神经网络

1.准备数据集

2.定义模型

3.编译模型

4.适合模型

5.评估和预测

带回家留言

相关推荐

idea本地配置连接远程hadoop集群的一些网络问题解决汇总

无缓存不行?例行升级的入门级阿斯加特AN2 SSD装机点评

Ceph运维手册(基于P版本)

大数据开发前要做什么准备?8台Hadoop服务器进行集群规划前配置

Tensorflow分类loss函数总结 tensorflow绘制loss曲线

R语言学习笔记(七) -离散型数据的模型预测2

iOS Runtime详解

7 个对 Java 意义重大的性能指标，你知道几个?

PHP 远程调试最佳实践

Laravel框架使用图片处理简单教程