파이썬 실습/GUI, 음성파일 텍스트 추출기

파이썬 GUI 음성파일 텍스트 추출기 - 1. 소개

파기차차 2023. 3. 19. 20:36
728x90
반응형
SMALL

ㅁ 개요

 

O 프로그램 소개

 

 - 이번 프로그램은 파이썬으로 GUI기반 음성파일(.mp3, .wav, .m4a)에서 텍스트를 추출하는 기능의 프로그램을 만드는 방법에 대하여 알아 보겠습니다.

 

O 향후 진행 순서

 

이후 글부터 진행되는 세부적인 내용은 다음과 같습니다.

 

 

1.파일 변환

 -우리는 음성인식을 위해 구글의 speech_recognition 모듈을 사용할 예정이며, 해당 모듈은 기본적으로 .wav파일만 인식합니다. 따라서 타입이 다른 음성파일(.mp3, .m4a 등)은 wav파일로 변환해 주어야 하므로 여기서는 형식이 다른 음성파일을 wav파일로 변환하는 방법에 대하여 알아보겠습니다.

 

 

2.음성을 텍스트로 변환

 -위에서 wav파일로 변환 후 구글의 speech_recognition 모듈을 이용하여 음성을 텍스트로 변환하는 방법에 대하여 살펴보겠습니다.

 

 

O 완성된 프로그램 실행 화면

 - 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

 

1.프로그램을 실행하면 아래와 같이 실행됩니다.

 

 

 

 

 2.음성파일(wav, mp3, m4a 중 택1)을 선택 후 열기 버튼을 클릭합니다.

 

 

 

 3. 아래와 같이 '변환' 버튼을 클릭하면 음성파일이 텍스트로 변환되고, '실행 결과' 아래에 출력됩니다.

(여기서 음성파일 bbb.mp3파일의 내용은 '안녕하세요' 만 포함되어 있습니다.)

 

 

 

 

 4.실제 실행 폴더에 가서 확인 결과 아래와 같이 'bbb.mp3 -> bbb.wav' 파일로 잘 변환되었고, 'memo.txt' 파일이 새로 생성되었습니다.

 

 

 

 

 

 5. 'memo.txt' 파일을 열어보면 음성내용이 텍스트로 잘 저장된 것을 확인할 수 있습니다.

 

 

 

 

 

 

 

이후 글부터 위의 '향후 진행 순서'에서 말씀 드린 내용대로 하나씩 자세해 설명 드리겠습니다.

 

 

오늘은 여기까지이며, 댓글하트는 제가 이글을 지속할 수 있게 해주는 힘이 됩니다.

 

 

 

감사합니다.

 

 

 

 

※ 추가적인 정보는 아래 유튜브 영상에서 해당 내용을 더욱 자세히 보실 수 있습니다.

 

 

728x90
반응형
LIST