深度学习基础——循环神经网络的结构及参数更新方式
深度学习领域的一大重要分支是循环神经网络(Recurrent Neural Networks,简称RNN),它是一种用于处理序列数据的神经网络结构。与传统的前馈神经网络不同,循环神经网络能够利用序列中的时间信息,从而更好地建模序列数据的依赖关系。
1. 概述
循环神经网络是一种具有循环连接的神经网络结构,用于处理序列数据,如文本、时间序列等。其主要特点是可以将过去的信息传递到当前时间步,从而在处理序列数据时具有记忆性。
循环神经网络的基本结构如下图所示:
其中,xtx_txt表示时间步 ttt的输入数据,hth_tht 表示时间步 ttt 的隐藏状态,用于存储过去的信息,yty_tyt表示时间步ttt的输出数据。 UUU表示输入层到隐藏层的权重矩阵,WWW表示上一时间步隐藏状态到当前时间步隐藏状态的权重矩阵,VVV表示隐藏层到输出层的权重矩阵。
2. 公式介绍及详细推导
基本结构
循环神经网络的基本结构如下所示:
ht=σ(Uxt+W