PyTorch教程之从零开始的递归神经网络实现-电子发烧友网

我们现在准备好从头开始实施 RNN。特别是，我们将训练此 RNN 作为字符级语言模型（参见第 9.4 节），并按照第 9.2 节中概述的数据处理步骤，在由 HG Wells 的《时间机器》的整个文本组成的语料库上对其进行训练. 我们首先加载数据集。

						%matplotlib inline
import math
import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

						 

						%matplotlib inline
import math
from mxnet import autograd, gluon, np, npx
from d2l import mxnet as d2l

npx.set_np()

						 

						%matplotlib inline
import math
import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						%matplotlib inline
import math
import tensorflow as tf
from d2l import tensorflow as d2l

						 

9.5.1. 循环神经网络模型

我们首先定义一个类来实现 RNN 模型（第 9.4.2 节）。请注意，隐藏单元的数量num_hiddens是一个可调的超参数。

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = nn.Parameter(
      torch.randn(num_inputs, num_hiddens) * sigma)
    self.W_hh = nn.Parameter(
      torch.randn(num_hiddens, num_hiddens) * sigma)
    self.b_h = nn.Parameter(torch.zeros(num_hiddens))

							 

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = np.random.randn(num_inputs, num_hiddens) * sigma
    self.W_hh = np.random.randn(
      num_hiddens, num_hiddens) * sigma
    self.b_h = np.zeros(num_hiddens)

							 

							class RNNScratch(nn.Module): #@save
  """The RNN model implemented from scratch."""
  num_inputs: int
  num_hiddens: int
  sigma: float = 0.01

  def setup(self):
    self.W_xh = self.param('W_xh', nn.initializers.normal(self.sigma),
                (self.num_inputs, self.num_hiddens))
    self.W_hh = self.param('W_hh', nn.initializers.normal(self.sigma),
                (self.num_hiddens, self.num_hiddens))
    self.b_h = self.param('b_h', nn.initializers.zeros, (self.num_hiddens))

							 

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = tf.Variable(tf.random.normal(
      (num_inputs, num_hiddens)) * sigma)
    self.W_hh = tf.Variable(tf.random.normal(
      (num_hiddens, num_hiddens)) * sigma)
    self.b_h = tf.Variable(tf.zeros(num_hiddens))

							 

下面的方法forward定义了如何计算任何时间步的输出和隐藏状态，给定当前输入和模型在前一个时间步的状态。请注意，RNN 模型循环遍历的最外层维度inputs，一次更新隐藏状态。这里的模型使用了tanh激活函数（第 5.1.2.3 节）。

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = torch.zeros((inputs.shape[1], self.num_hiddens),
             device=inputs.device)
  else:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = torch.tanh(torch.matmul(X, self.W_xh) +
             torch.matmul(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = np.zeros((inputs.shape[1], self.num_hiddens),
             ctx=inputs.ctx)
  else:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = np.tanh(np.dot(X, self.W_xh) +
             np.dot(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def __call__(self, inputs, state=None):
  if state is not None:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = jnp.tanh(jnp.matmul(X, self.W_xh) + (
      jnp.matmul(state, self.W_hh) if state is not None else 0)
             + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = tf.zeros((inputs.shape[1], self.num_hiddens))
  else:
    state, = state
    state = tf.reshape(state, (-1, self.num_hiddens))
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = tf.tanh(tf.matmul(X, self.W_xh) +
             tf.matmul(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

我们可以将一小批输入序列输入 RNN 模型，如下所示。

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = torch.ones((num_steps, batch_size, num_inputs))
outputs, state = rnn(X)

							 

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = np.ones((num_steps, batch_size, num_inputs))
outputs, state = rnn(X)

							 

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = jnp.ones((num_steps, batch_size, num_inputs))
(output
						

PyTorch教程之从零开始的递归神经网络实现

9.5.1. 循环神经网络模型

PyTorch教程10.4之双向递归神经网络

PyTorch教程10.3之深度递归神经网络

PyTorch教程16.3之情感分析:使用卷积神经网络

PyTorch教程16.2之情感分析:使用递归神经网络

PyTorch教程8.1之深度卷积神经网络(AlexNet)

PyTorch教程9.6之递归神经网络的简洁实现

PyTorch教程之循环神经网络

人工神经网络的原理及仿真实例

神经网络基础问题的整理

基于FPGA的神经网络硬件实现方法

基于进化计算的神经网络设计与实现

基于神经网络的优化计算实验

神经网络的基本原理

人工神经网络控制

人工智能-BP神经网络算法的简单实现

基于剪枝与量化的卷积神经网络压缩算法

基于不同神经网络的文本分类方法研究对比

基于FPGA的RBF神经网络硬件实现

图文详解：从零开始学电源资源下载

MATLAB实现卷积神经网络CNN的源代码

3小时学习神经网络与深度学习课件下载

神经网络图像压缩算法的FPGA实现技术研究论文免费下载

神经网络的最新发展如何

神经网络的方法学习课件免费下载

基于深度神经网络的文本分类分析

如何使用FPGA实现BP神经网络的仿真线设计

如何使用FPGA实现神经网络硬件的设计方法

神经网络与神经网络控制的学习课件免费下载

如何使用递归神经网络进行纳税评估预警模型概述

基于多尺度时间递归神经网络的人群异常事件检测和定位方法

PyTorch如何实现多层全连接神经网络

pytorch中有神经网络模型吗

递归神经网络和循环神经网络的模型结构

递归神经网络的实现方法

PyTorch神经网络模型构建过程

rnn是递归神经网络还是循环神经网络

递归神经网络结构形式主要分为

简述递归神经网络的计算过程

递归神经网络与循环神经网络一样吗

递归神经网络主要应用于哪种类型数据

递归神经网络是循环神经网络吗

递归神经网络的结构、特点、优缺点及适用场景

循环神经网络和递归神经网络的区别

使用PyTorch构建神经网络

卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

PyTorch教程-9.6. 递归神经网络的简洁实现

PyTorch教程-9.5. 从零开始的递归神经网络实现

三个最流行神经网络

什么是神经网络？什么是卷积神经网络？

使用PyTorch深度解析卷积神经网络

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

如何使用numpy库从零开始创建循环神经网络模型

从零开始建立一个神经网络

fireflyNCC S1--PLAI神经网络量化工具介绍

BP神经网络概述

从零开始学习用Python构建神经网络

基于Numpy实现神经网络：如何加入和调整dropout？

下载排行榜

开关电源设计原理手册

FS5080E 5V升压充电两串锂电池充电管理IC中文手册

DMT0660数字万用表产品说明书

UC3842/3/4/5电源管理芯片中文手册

ST7789V2单芯片控制器/驱动器英文手册

STM32F101x8/STM32F101xB手册

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别