使用基于视频的音频连接到语音API的过程?

时间:2018-08-07 06:21:20

标签: speech-recognition speech-to-text google-speech-api

我尝试了多次,并在博客中找到一种与API crednetials建立联系的方法。您能否在以下几点上帮助我:

  1. 我们是否可以直接连接到Google语音中基于视频的音频选项的API密钥?如果是这样,那么任何链接都对我们有很大帮助。我尝试了google链接,我们必须通过命令提示符并说“无效的JWT令牌”。

  2. 我们为什么要创建一个环境然后定义流程,我从来没有说过这种使事情变得复杂的方式。要求您帮助进行正确的流程

以下是我遵循的过程: 1.在Console中创建一个项目。 2.启用语音API 3.下载json凭证。 4.在命令提示符下创建Env变量 5.创建虚拟环境并设置为激活 6.然后执行代码。

此过程非常详尽,并显示错误消息“无效的JWT令牌”。

下面是代码:

# [START speech_quickstart]
import io
import os

# Imports the Google Cloud client library
# [START migration_import]
from google.cloud import speech
from google.cloud.speech import enums
from google.cloud.speech import types
from google.oauth2 import service_account
# [END migration_import]
#this part of credential mapping i tried to define manually .but not luck 
credentials = service_account.Credentials.from_service_account_file('C:/Users/Sashank/Speech Recog/api-key.json')
# Instantiates a client
# [START migration_client]
client = speech.SpeechClient(credentials = credentials)
# [END migration_client]

# The name of the audio file to transcribe
file_name = os.path.join(os.path.dirname(__file__),'tempaudio.wav')

# Loads the audio into memory
with io.open(file_name, 'rb') as audio_file:
    content = audio_file.read()
    audio = types.RecognitionAudio(content=content)

config = types.RecognitionConfig(
    encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=16000,
    language_code='en-US')

# Detects speech in the audio file
response = client.recognize(config, audio)

#for result in response.results:
    #print('Transcript: {}'.format(result.alternatives[0].transcript))
# [END speech_quickstart]

谢谢你, 萨尚克·帕普。

0 个答案:

没有答案