以TensorFlow教机器人作曲

消耗积分:1 | 格式:rar | 大小:0.8 MB | 2017-10-09

分享资料个

　今天想来看看 AI 是怎样作曲的。
　　本文会用 TensorFlow 来写一个音乐生成器。
　　当你对一个机器人说：我想要一种能够表达出希望和奇迹的歌曲时，发生了什么呢？
　　计算机会首先把你的语音转化成文字，并且提取出关键字，转化成词向量。然后会用一些打过标签的音乐的数据，这些标签就是人类的各种情感。接着通过在这些数据上面训练一个模型，模型训练好后就可以生成符合要求关键词的音乐。程序最终的输出结果就是一些和弦，他会选择最贴近主人所要求的情感关键词的一些和弦来输出。当然你不只是可以听，也可以作为创作的参考，这样就可以很容易地创作音乐，即使你还没有做到刻意练习1万小时。
　　机器学习其实是为了扩展我们的大脑，扩展我们的能力。
　　DeepMind 发表了一篇论文，叫做WaveNet，这篇论文介绍了音乐生成和文字转语音的艺术。
　　通常来讲，语音生成模型是串联。这意味着如果我们想从一些文字的样本中来生成语音的话，是需要非常大量的语音片段的数据库，通过截取它们的一部分，并且再重新组装到一起，来组成一个完整的句子。
　　生成音乐也是同样的道理，但是它有一个很大的难点：就是当你把一些静止的组件组合到一起的时候，生成声音需要很自然，并且还要有情感，这一点是非常难的。
　　一种理想的方式是，我们可以把所有生成音乐所需要的信息存到模型的参数里面。也就是那篇论文里讲的事情。
　　我们并不需要把输出结果传给信号处理算法来得到语音信号，而是直接处理语音信号的波。
　　他们用的模型是 CNN。这个模型的每一个隐藏层中，每个扩张因子，可以互联，并呈指数型的增长。每一步生成的样本，都会被重新投入网络中，并且用于产生下一步。
　　我们可以来看一下这个模型的图。输入的数据，是一个单独的节点，它作为粗糙的音波，首先需要进行一下预处理，以便于进行下面的操作。
　　接着我们对它进行编码，来产生一个 Tensor，这个 Tensor 有一些 sample 和 channel。然后把它投入到 CNN 网络的第一层中。这一层会产生 channel 的数量，为了进行更简单地处理。然后把所有输出的结果组合在一起，并且增加它的维度。再把维度增加到原来的 channel 的数量。把这个结果投入到损失函数中，来衡量我们的模型训练的如何。最后，这个结果会被再次投入到网络中，来生成下一个时间点所需要的音波数据。重复这个过程就可以生成更多的语音。这个网络很大，在他们的 GPU 集群上需要花费九十分钟，并且仅仅只能生成一秒的音频。
　　接下来我们会用一个更简单的模型在 TensorFlow 上来实现一个音频生成器。
　　1.引入packaGEs：
　　数据科学包 Numpy ，数据分析包 Pandas，tqdm 可以生成一个进度条，显示训练时的进度。
　　import numpy as np
　　import pandas as pd
　　import msgpack
　　import glob
　　import tensorflow as tf
　　from tensorflow.python.ops import control_flow_ops
　　from tqdm import tqdm
　　import midi_manipulation
　　我们会用到一种神经网络的模型 RBM-Restricted Boltzmann Machine 作为生成模型。
　　它是一个两层网络：第一层是可见的，第二层是隐藏层。同一层的节点之间没有联系，不同层之间的节点相互连接。每一个节点都要决定它是否需要将已经接收到的数据发送到下一层，而这个决定是随机的。
　　2.定义超参数：
　　先定义需要模型生成的 note 的 range
　　lowest_note = midi_manipulation.lowerBound #the index of the lowest note on the piano roll
　　highest_note = midi_manipulation.uPPerBound #the index of the highest note on the piano roll
　　note_range = highest_note-lowest_note #the note range
　　接着需要定义 timestep ，可见层和隐藏层的大小。
　　num_timesteps = 15 #This is the number of timesteps that we will create at a time
　　n_visible = 2note_rangenum_timesteps #This is the size of the visible layer.
　　n_hiDDen = 50 #This is the size of the hidden layer
　　训练次数，批量处理的大小，还有学习率。
　　num_epochs = 200 #The number of training epochs that we are going to run. For each epoch we go through the entire data set.
　　BAtch_size = 100 #The number of training examples that we are going to send through the RBM at a time.
　　lr = tf.constant（0.005， tf.float32） #The learning rate of our model
　　3.定义变量：
　　x 是投入网络的数据
　　w 用来存储权重矩阵，或者叫做两层之间的关系
　　此外还需要两种 bias，一个是隐藏层的 bh，一个是可见层的 bv
　　x = tf.placeholder（tf.float32，［None， n_visible］， name=”x”） #The placeholder variable that holds our data
　　W = tf.Variable（tf.random_normal（［n_visible， n_hidden］， 0.01）， name=”W”） #The weightMATrix that stores the edge weights
　　bh = tf.Variable（tf.zeros（［1， n_hidden］， tf.float32， name=”bh”）） #The bias vector for the hidden layer
　　bv = tf.Variable（tf.zeros（［1， n_visible］， tf.float32， name=”bv”）） #The bias vector for the visible layer
　　接着，用辅助方法 gibbs_sample 从输入数据 x 中建立样本，以及隐藏层的样本：
　　gibbs_sample 是一种可以从多重概率分布中提取样本的算法。
　　它可以生成一个统计模型，其中，每一个状态都依赖于前一个状态，并且随机地生成符合分布的样本。
　　#The sample of x
　　x_sample = gibbs_sample（1）
　　#The sample of the hidden nodes， starting from the visible state of x
　　h = sample（tf.sigmoid（tf.matMUl（x， W） + bh））
　　#The sample of the hidden nodes， starting from the visible state of x_sample
　　h_sample = sample（tf.sigmoid（tf.matmul（x_sample， W） + bh））
　　4.更新变量：
　　size_bt = tf. CA
　　st（tf.shape（x）［0］， tf.float32）
　　W_adder = tf.mul（lr/size_bt， tf.sub（tf.matmul（tf.transpose（x）， h）， tf.matmul（tf.transpose（x_sample）， h_sample）））
　　bv_adder = tf.mul（lr/size_bt， tf.reduce_sum（tf.sub（x， x_sample）， 0， True））
　　bh_adder = tf.mul（lr/size_bt， tf.reduce_sum（tf.sub（h， h_sample）， 0， True））
　　#When we do sess.run（updt）， TensorFlow will run all 3 update steps
　　updt = ［W.assign_add（W_adder）， bv.assign_add（bv_adder）， bh.assign_add（bh_adder）］
　　5.运行 Graph 算法图：
　　先初始化变量
　　with tf.Session（） as sess：
　　#First， we train the model
　　#initialize the variables of the model
　　init = tf.initialize_all_variables（）
　　sess.run（init）
　　首先需要 reshape 每首歌，以便于相应的向量表示可以更好地被用于训练模型。
　　for epoch in tqdm（range（num_epochs））：
　　for song in sonGS：
　　#The songs are stored in a time x notes format. The size of each song is timesteps_in_song x 2*note_range
　　#Here we reshape the songs so that each training example is a vector with num_timesteps x 2*note_range elements
　　song = np.array（song）
　　song = song［：np.floor（song.shape［0］/num_timesteps）*num_timesteps］
　　song = np.reshape（song，［song.shape［0］/num_timesteps， song.shape［1］*num_timesteps］）
　　接下来就来训练 RBM 模型，一次训练一个样本
　　for i in range（1， len（song）， batch_size）：
　　tr_x = song［i:i+batch_size］
　　sess.run（updt， feed_dict={x： tr_x}）
　　模型完全训练好后，就可以用来生成 music 了。
　　需要训练 Gibbs chain
　　其中的 visible nodes 先初始化为0，来生成一些样本。
　　然后把向量 reshape 成更好的格式来 playback。
　　sample = gibbs_sample（1）.eval（session=sess， feed_dict={x： np.zeros（（10， n_visible））}）
　　for i in range（sample.shape［0］）：
　　if not any（sample［i，：］）：
　　continue
　　#Here we reshape the vector to be time x notes， and then save the vector as a midi file
　　S = np.reshape（sample［i，：］，（num_timesteps， 2*note_range））
　　最后，打印出生成的和弦
　　midi_manipulation.noteStateMatrixToMidi（S， “generatedchord{}”.format（i））1212
　　综上，就是用 CNN 来参数化地生成音波，用 RBM 可以很容易地根据训练数据生成音频样本，Gibbs 算法可以基于概率分布帮我们得到训练样本。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

暂无相关数据

以TensorFlow教机器人作曲

节卡机器人APP使用手册

使用TensorFlow对自平衡机器人进行手势控制

瞳步迎宾讲解机器人

瞳步消毒机器人方案

ABB机器人CP中级应用培训

库卡机器人有限公司培训资料之库卡机器人编程C4教程

了解机器人电子教材下载

WorkVisual4.0机器人软件手册下载

基于深度学习的机器人示教系统设计与实现

六足仿生巡检机器人的设计方案

机场视觉移动服务机器人的设计方案

机器人无线充电威廉希尔官方网站 设计

机器人关节用什么电机

基于Matlab的机构与机器人分析资料下载

机器人原理与应用之机器人动力学

基于DSP和PC的农业机器人控制系统

基于DSP的排险机器人车体控制系统

基于DSP芯片的足球机器人实现与设计

机器人PID控制概述

机器人技术及其应用说明

发那科机器人示教手册DeviceNet配置流程详细说明

如何分析新型二自由度平动并联机器人的结构和运动学

机器人的运动规划详细论文说明

怎么样才能设计仿人双足机器人的机构

Arduino教学机器人的使用教程免费下载

工业机器人的详细资料和应用编程等培训资料概述

如何进行简易避障机器人的设计

机器人控制系统编程手册的详细资料免费下载

机器人设计教程之机器人控制和决策子系统

机器人Rt800示教器的操作用户手册资料免费下载

面向ABB IRB4600机器人的虚拟示教系统研究

什么是拖动示教？机器人拖动示教方式分析

协作机器人拽拖示教详解

基于导纳控制的机器人拖动示教原理和实现步骤

焊接机器人示教模式怎么设置

工业机器人示教器按钮功能介绍

工业机器人常用的编程方式

工业机器人示教器可以通用吗?给你5点建议

基于导纳控制的机器人拖动示教原理和实现步骤

机器人示教器专家，赋能智造

RK3568智能主板助力机器人产业高速发展

焊接机器人示教操作流程

海默机器人全新机器人编程系统EngSign 5.0重磅发布

焊接机器人示教器有哪些作用？

ARM工业平板在机器人示教器控制系统的应用

「智科特案例」用VR，我们人类手把手教机器人做事情

新松机器人东北地区产教融合示范基地正式揭牌

协作机器人发展新方向

工业机器人示教编程与离线编程的区别

拖动示教喷涂机器人的应用将比人工喷涂更具有优势

机器人编程是学的什么_机器人编程有什么前景

轻松掌握FANUC机器人编程 维护与外围集成

AI如何教机器人摔倒后如何站起来

如何提高数控机床机器人的使用寿命？

六种共享智能机器人浅析

拖动示教测试在并联机器人应用领域实现零突破

机器人的问题早被书写，以机器人出名的酒店开始摆脱机器人

什么是机器人示教器，及使用方法介绍

如何通过按示教器上的按钮，来改变机器人的速度倍率和个性化设置

没有示教器，还能控制机器人吗？

工业机器人这两种编程区别你知道吗？(示教编程与离线编程的区别)

下载排行榜

机器人无线充电威廉希尔官方网站设计

轻松掌握FANUC机器人编程维护与外围集成