퀵포스팅/기타

60분 오디오 1초만에 요약하기

파기차차 2025. 5. 18. 11:06
728x90
반응형
SMALL

ㅁ 개요

 

O 프로그램 소개

 

 - 이번 내용은 5월 6일 올라온 아래 기사와 같이 엔비디아에서 공개한 오픈소스 모델을 사용하여 60분짜리 오디오가 1초만에 스크립트로 만들어지는지 확인해 보도록 하겠습니다.

 

 

 

결론 : 파일 사이즈, 운영 환경에 따라 다 다르겠지만, 17분짜리 wav파일 음성 50MB로 실제 해본 결과 1초는 어렵고요, 약 10초 정도소요됩니다. 그래도 어마 무시하게 빠른 건 맞는것 같습니다.

 

 

 

 

 

 


 

 

1.테스트 방법

 

 

 

 

1. 아래 사이트에 접속합니다.(먼저 허깅페이스에 로그인 하셔야 합니다.)

https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2

 

 

테스트 음성파일 : 필요하신 분은 아래에서 다운로드 하시기 바랍니다.

https://drive.google.com/file/d/1Glfp51KAmmR1J28fqLNlzxk91zP-sySd/view?usp=sharing

 

 

 

아래와 같이 나오면 음성파일을 업로드 합니다.

 

 

 

2. 조금 기다리면 음성파일이 업로드 되고, 아래와 같이 화면이 나타납니다.

 

 

 

 

3.아래 (1)번 버튼을 누르면 약 10초 정도 후에 음성->텍스트로 변환되는 과정을 거쳐 하단에 스크립트로 나타납니다.

 

 

 

4.위의 3번에서 'Download Transcript (SRT)'를 누르면 아래와 같이 다운로드 된 srt파일을 볼 수 있으며,

 

 

 

5.마찬가지로 위의 3번에서 'Download Transcript (CSV)'를 누르면 아래와 같이 다운로드 된 csv파일을 열어 볼 수 있습니다.

 

 

 

 

이제 아무리 큰 음성파일(wav, mp3 등)도 수초면 바로 텍스트로 변환이 가능할 것 같고, 이를 이용하여 아래와 같은 것들이 가능해 질 것 같습니다.

 

 

================================================

  1. 실시간 회의 자동 요약 서비스
    • 대기업 회의나 컨퍼런스콜을 실시간으로 텍스트 변환 → 핵심 내용 요약 및 회의록 자동 생성
  2. 콜센터 대화 품질 분석
    • 상담사와 고객의 수천 개 통화 녹음을 빠르게 텍스트화 → 불만 키워드 탐지, 품질 모니터링 자동화
  3. 법정/청문회 기록 자동화
    • 재판이나 국회 청문회의 긴 오디오도 빠르게 텍스트화 → stenographer 없이도 속기 가능
  4. 유튜브 영상 대량 자막 생성
    • 대용량 유튜브 채널의 영상들에 자막을 자동 생성하고 다국어 번역까지 자동화 가능
  5. 팟캐스트 콘텐츠 검색 플랫폼
    • 수천 시간 분량의 팟캐스트를 텍스트로 변환하여 주제별로 인덱싱 → 키워드 기반 검색 서비스
  6. 도청/보안 감청 자동 분석
    • 보안기관의 대량 음성 수집 파일을 실시간으로 텍스트화 → 특정 키워드 자동 탐지 및 경고
  7. 방송국 뉴스 아카이브 자동화
    • 수십 년 분량의 라디오/TV 뉴스 오디오를 텍스트화 → 검색 가능한 뉴스 아카이브 구축
  8. 청각장애인 실시간 보조 도구
    • 실시간 회의나 수업 중 음성을 빠르게 자막으로 보여주는 서비스
  9. AI 법률/의료 기록 분석 도우미
    • 의사/변호사와 환자/고객 간의 대화 녹음을 빠르게 기록 → 전자차트나 진술 분석 자동화
  10. 언어 학습/연구용 음성 코퍼스 구축
  • 외국어 말뭉치, 방언, 억양 등을 대규모로 수집하고 빠르게 분석하여 교육 콘텐츠 제작

================================================

 

 

 

오늘은 여기까지이며, 댓글하트는 제가 이글을 지속할 수 있게 해주는 힘이 됩니다.

 

 

 

감사합니다.

 

728x90
반응형
LIST

'퀵포스팅 > 기타' 카테고리의 다른 글

유료 사이트 기사 보는 방법  (0) 2025.05.18