虽然有一些伟大的开源语音识别系统,如Kaldi可以使用神经网络作为一个组件,但它们的复杂性,使得它们难以被用来作简单任务的指南。
目前,找不到免费且公开的数据集及教程,让初学者入门(许多需要在神经网络模型可以构建之前进行预处理),或者非常适合简单的关键字检测。
为了解决这个问题,TensorFlow和AIY团队创建了语音命令数据集,并用于将训练*和推理示例代码在TensorFlow中运行。(https://aiyprojects.withgoogle.com/)
该数据集在AIY网站,由成千上万的用户,上传了包含30个词的65000条语音数据,每条数据长度为一秒。数据集可以为应用程序构建基本但有用的语音界面,其中包含“yes”、“no”,“up”和“left”等常用单词。
想要练手的鸡友,要下载预先构建的TensorFlow Android应用程序演示,并开启“TF语音”。你将被要求访问麦克风的权限,然后查看一个十个单词的列表,每个单词应该对应你说的话。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !