한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터

본문 바로가기
사이트 내 전체검색

한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터

한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터

 

본문

  • 설명 : 한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다.

    ㅁ 구축방법 및 환경: 한국어- 한국어 자연어 발성 문장, 영어- 한국인이 발성한 영어 문장
    ㅁ 적용포맷: 공히 16kHz 샘플링 주파수로 녹음된 16-비트 선형(linear) PCM 파일이며, 부가 정보로서 파일별로 단어 단위의 전사 정보 및 발성자의 성별 정보가 제공됨.

    세부내용: 폴더 2개(GSF03031LJH0_영어, GSF03031LJH0_한국어), 각 폴더 내 PCM 파일 10개, SEG 파일 10개, TXT 파일 10개
  • 분류체계 : 과학기술
  • 기관명 : 한국전자통신연구원
  • 바로가기 : https://www.data.go.kr/data/15073486/fileData.do
  • 키워드 : 정보/통신,정보이론 ,인공지능
2024-09-21 18:42:17
한국전자통신연구원 한국어 및 영어 음향모델 훈련용 음성 데이터

Copyright © www.academic.kr All rights reserved. 문의 : da942133@gmail.com