GDSC SungShin Women's University 23-24/Story

[Winter Blog Challenge] text를 말로 읽어주는 api 구현하기(Member 김민주)

GDSC SungShin Team 2024. 2. 13. 16:19

안녕하세요. GDSC SungShin Member 김민주입니다. 😸
이번에는 text를 말로 읽어주는 기능 구현하는 방법을 알아보겠습니다.

이 기능은 음성만 듣고 정보를 획득하거나, 부득이하게 조작을 하지 못할 경우 자동으로 읽어주는 기능을 다양하게 활용이 됩니다.

물론, 직접 눈으로 볼 수도 있겠지만 시각장애인 분들에게도 많은 도움이 될 것 입니다.

또한 문맹률이 낮은 나라의 경우 의사소통은 되지만 읽지를 못해서 정보 획득에 어려움이 생길 수 있다 생각했습니다. 이러한 이유로 이번 solution challenge에서 이 기능을 사용하게 되어 소개 해드리려 합니다.

이는 전세계의 문맹 지도입니다.
현재는 한글 교육을 많이 받아서 문맹률이 거의 세계 꼴찌로 글을 못 읽는 사람이 없습니다.
하지만 1945년 광복 직후만 봐도 문맹률은 78%일 정도로 문맹률이 매우 높았습니다.
문맹률이 그저 다른 나라 일이 아니라는 것 입니다.

이 기능은 google에서 google text-to-speech(TTS) 라는 기능으로 제공을 합니다.

Google Cloud Platform(GCP)의 Text-to-Speech API를 활성화하고 API 키를 생성해야 합니다. 그런 다음 Python 코드를 사용하여 Text-to-Speech API를 호출하여 텍스트를 음성으로 변환할 수 있습니다.

pip install google-cloud-texttospeech

이 코드를 이용해 install을 해줍니다.

from gtts import gTTS

tts = gTTS(
  text='안녕하세요? 만나서 반가워요',
  lang='ko',
  slow=False
)

tts.save('test.mp3')

이런 식으로 gTTS를 사용하면 text를 입력하고, lang을 설정해줍니다. slow는 False, True로 할 수 있는데 미세한 속도 조절은 못합니다.

언어별로 성별이 다른데, ko(한국어)는 남자 목소리, en(영어)는 여자 목소리로 설정 되어 있습니다.
안타깝게도 성별을 따로 조작 못합니다.

이 기능은 여러 주제에 필요한 기능이라 생각합니다😃
이번 기회에 구현을 하고 다시 한번 정리를 해보니 다음엔 바로 코드를 작성 할 수 있을 것 같습니다🤩