본문 바로가기
Cloud/Google Cloud Study Jam

Speech to Text Transcription with the Cloud Speech API

by 사향낭 2022. 3. 28.
 

Cloud Speech API를 사용한 음성 텍스트 변환 | Google Cloud Skills Boost

Cloud Speech API를 사용하면 80개 이상의 언어로 된 오디오 파일에서 음성 텍스트 변환을 수행할 수 있습니다. 이 실습에서는 직접 오디오 파일을 녹음하고, 텍스트 변환을 위해 이를 Speech API로 전달

www.cloudskillsboost.google

 

 

Speech-to-Text API를 이용해서 음성 파일을 텍스트 파일로 변환하여보자.

 

80개 이상의 언어가 지원된다.

 

 

Navigation menu -> APIs & Services -> Credentials

 

 

CREATE CREDENTIALS -> API key

 

 

Navigation menu -> Compute Engine

 

 

linux-instance에 SSH로 접속

 

 

터미널에 다음 명령어 입력

 

export API_KEY=<YOUR_API_KEY>

 

 

request.json 파일 생성

 

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "en-US"
  },
  "audio": {
      "uri":"gs://cloud-samples-data/speech/brooklyn_bridge.flac"
  }
}

 

request

 

curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

 

result.json

 

{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "how old is the Brooklyn Bridge",
          "confidence": 0.98216057
        }
      ],
      "resultEndTime": "1.770s",
      "languageCode": "en-us"
    }
  ],
  "totalBilledTime": "15s"
}

 

 

다른 언어도 해보자!

 

request.json

 

 {
  "config": {
      "encoding":"FLAC",
      "languageCode": "fr"
  },
  "audio": {
      "uri":"gs://cloud-samples-data/speech/corbeau_renard.flac"
  }
}

 

request

 

curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

 

result

 

{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "maître corbeau sur un arbre perché Tenait dans son bec un fromage maître Renard par l'odeur alléché lui tint à peu près ce langage et bonjour monsieur du corbeau",
          "confidence": 0.93855613
        }
      ],
      "resultEndTime": "12.630s",
      "languageCode": "fr-fr"
    }
  ],
  "totalBilledTime": "15s"
}

 

 

전에 했던 실습과 너무 비슷한데;;

댓글