subvisual


인공지능학과 박정균 석사과정생(지도교수 전자공학과 박형민),

국제 최대 신호처리 학술대회 ‘ICASSP 2024’ 논문 채택


▲ 전자공학과 박형민 교수인공지능학과(DHE트랙박정균 석사과정생

 

인공지능학과(DHE트랙박정균 석사과정생(지도교수 전자공학과 박형민)이 국제 최대 신호처리 학술대회 ‘ICASSP 2024’에 발표한 논문이 최종 채택되었다.

 

논문 제목은 ‘OLKAVS: AN OPEN LARGE-SCALE KOREAN AUDIO-VISUAL SPEECH DATASET’으로연구팀은 시청각 음성인식을 위한 대용량 한국어 데이터셋을 최초로 공개하였다이는 세계 최대 규모의 시청각 음성 데이터셋으로해당 연구는 이를 활용하여 음성인식 딥러닝 모델의 성능을 향상시킬 수 있음을 검증하고 그 우수성을 인정받았다.


▲ 연구팀이 구축한 OLKAVS 데이터셋의 견본 영상

 

한편 ICASSP는 100여 개국 2만여 명의 회원이 가입되어 있는 음성신호처리 분야 세계 최대 규모 학회이다주관인 미국 전기전자협회(IEEE) 소속 학회 중에서도 규모가 크고 오래된 학회로 알려져 있다오는 2024년에 열리는 ICASSP 2024는 4월 14~19일 서울 강남구 코엑스에서 개최된다.

 


▶ 논문 제목: OLKAVS: AN OPEN LARGE-SCALE KOREAN AUDIO-VISUAL SPEECH DATASET

▶ 실험 코드 및 데이터셋 링크https://github.com/IIP-Sogang/olkavs-avspeech



첨부파일