Cloud Speech API支持哪些类型的音频?

时间:2016-07-20 16:04:56

标签: google-cloud-speech

存在许多音频格式(例如,mp3,m4a),源(例如,听写,命令,电话,会议)和设备(例如,电话,PC,IoT设备)。哪些最适合使用Cloud Speech API?

1 个答案:

答案 0 :(得分:4)

  

哪些最适合使用Cloud Speech API?

支持的应该是最好的:

  • LINEAR16未压缩的16位带符号小端样本。这是 speech.asyncrecognize可能使用的唯一编码。
  • FLAC这是speech.syncrecognize和的推荐编码 StreamingRecognize因为它使用无损压缩;因此 识别准确性不会受到有损编解码器的影响。
  • 使用G.711 PCMU / mu-law压缩14位音频样本的MULAW 8位样本。
  • AMR自适应多速率窄带编解码器。 sampleRate必须为8000 Hz。
  • AMR_WB自适应多速率宽带编解码器。 sampleRate必须是16000 赫兹。

https://cloud.google.com/speech/reference/rest/v1beta1/RecognitionConfig#AudioEncoding