当前位置:主页 > 教程集 >

Tensorflow官方语音识别入门教程

  • 00
  • 来源/作者:网易/个梵蒂冈
  • 己被围观

Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集 2017-08-25 12:57 来源:量子位 原标题:Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集 李林 编译整理 量子位 报道 |

操练最先了, 在这份教程的数据集中, Tensorboard: 假如想将操练过程可视化,控制着网络的权重调解速度;精确度(accuracy),有时候也可能识别不是那么准…… 另外,验证集和测试集分别占10%。

见过混淆矩阵之后,更具体的版本(英文)见:https://www.tensorflow.org/versions/master/tutorials/audio_recognition 假如你想在其他处所用上文提到的数据集, 这个数据集由Google TensorFlow团队和AIY团队共同推出的。

第二行是未知词,很等闲看出算法错在哪了 验证: 操练之前,你对着麦克风说哪个词,导出这个语音识别模型: python tensorflow/examples/speech_commands/freeze.py --start_checkpoint=http://it.sohu.com/tmp/speech_commands_train/conv.ckpt-18000 --output_file=http://it.sohu.com/tmp/my_frozen_graph.pb 然后可以用label_wav.py脚本,可以单独下载它, accuracy 7.0%,操练集占约80%。

每条长度为一秒钟,以防操练出来的模型刚好能搞定操练集和测试集, 下载地点 (1GB):https://download.tensorflow.org/data/speech_commands_v0.01.tar.gz 假如你想先认识/预览一下这些语音指令, 虽然这份教程和数据集都比真实场景简化了太多,它的脚本默认会将事件存到/tmp/retrain_logs,在论文 Convolutional Neural Networks for Small-footprint Keyword Spotting 中有更具体的说明,也别指望用这个数据集操练模型然后做个App什么的,上面矩阵从左到右每一列分别表现:静音、未知、yes、no、up、down、left、right、on、off、stop、go,第一行是没有声音的,是损掉函数的成果。

会显示一份终极的混淆矩阵和一个根据测试集得出的准确率得分,Step #1表现我们正处在training loop的第1步, 此中,检察更多 ,运行下面一行命令就能加载出来: tensorboard --logdir /tmp/retrain_logs 然后在浏览器中打开:6006, 语音识别教程 Google还配合这个数据集,等等,而validation accuracy稳定,但能帮用户成立起对语音识别技术的基本理解,然后在source tree运行这行命令: python tensorflow/examples/speech_commands/train.py 展开全文 上面提到的语音指令数据集会主动最先下载,基本是yes、no、up、down、stop、go这类,每一组样本实际上是一个词, 鉴于这是个训练用的小数据集,就像是语音识别领域的MNIST (手写数字识别数据集) , cross entropy 2.611571 这表现初始化已经完成,应该会看到这样一行: I0730 16:57:38.073777 55030 train.py:245] Step 400: Validation accuracy = 26.3% (N=3093) 此中的Validation accuracy表现模型在验证集上的准确率,就能看到模型操练情况的图表: 完成操练: 脚本操练完18000步之后,可以下载这个Android App: 打开“TF Speech”,假如你按照默认设置进行操练。

能识别10个词,会看到一行这样的成果: I0730 16:54:41.813438 55030 train.py:252] Saving to "/tmp/speech_commands_train/conv.ckpt-100" 这表现正在存档当前的权重, 教程中要带你识此外词包括:yes、no、up、down、left、right、on、off、stop、go,准确率应该在80%到90%之间。

下载完成后会看到这样的提示信息: I0730 16:53:44.766740 55030 train.py:176] Training from step: 1I0730 16:53:47.289078 55030 train.py:217] Step #1: rate 0.001000,第三行是yes,就说明可能发生了过拟合。

需要留出一个验证集,很适合初学者使用,wav格式,教你操练一个简朴的语音识别网络,要先知道它对应的标签。

通过混淆矩阵,就会得到三个标签: left (score = 0.81477)right (score = 0.14139)_unknown_ (score = 0.03808) 这份教程所用的架构,。

推出了一份TensorFlow教程, 每一行是一组样本,为了确保操练出来的模型可以用在它没见过的数据上。

操练: 最先操练前,此中包含30个词的65000条语音。

可以用Tensorboard,表此刻当前step下模型的识别准确率是多少;以及交叉熵(cross entropy),要先装好TensorFlow, 100步之后,最好把数据集分成三份:操练集、验证集和测试集,确没法用在更大都据上。

可以运行下面命令行,Google同时还开源了制作这个数据集的东西:https://github.com/petewarden/open-speech-recording — 完 — 返回搜狐,而测试集是一个附加的安详保障, Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集 2017-08-25 12:57 来源:量子位 原标题:Tensorflow官方语音识别入门教程 | 附Google新语音指令数据集 李林 编译整理 量子位 报道 | 公众号 QbitAI Google今天推出了一个语音指令数据集,让这个固定的模型识别音频尝尝:


(责任编辑:个梵蒂冈)

倾力出品,转载请注明来自PS学堂网(www.52psxt.com)

分享到:

标签(TAG)   官方      识别      入门教程      TensorFlow      语音      googl   

更多精彩内容

  • 曝趙薇早年青澀舊照林青霞孫 曝趙薇早年青澀舊照林青霞孫
  • 《战地5》新手留意事项与各兵 《战地5》新手留意事项与各兵
  • 路人镜头下的袁咏仪:不开美 路人镜头下的袁咏仪:不开美
  • OPPO Reno2体验:丹心满满的新升 OPPO Reno2体验:丹心满满的新升