[축하] 세계 최우수 인공지능 학회 ‘NeurIPS 2024’ 논문 채택
2024.10.16 17:22
지능정보처리연구실에서 최우수 인공지능 학회인 ‘Neural Information Processing Systems, NeurIPS 2024’에 논문을 발표하게 되었습니다.
신의협 박사과정의 주도하에 이상윤, 김태한 석사과정이 함께 연구를 진행하였으며, 논문 제목은 “Separate and Reconstruct: Asymmetric Encoder-Decoder for Speech Separation”으로 해당 연구를 통해서 여러 화자가 동시에 발화하는 혼합 음성에서 개별 화자의 음성을 분리하는 새로운 딥러닝 네트워크 구조를 설계하였습니다.
음성 분리(Speech Separation)는 여러 화자의 음성이 섞인 오디오에서 개별 화자의 음성을 분리해내는 과제이며 이를 위해서 역할이 구분 되는 분리 인코더 – 재구성 디코더의 비대칭 네트워크를 설계하였습니다.
<분리 인코더 – 재구성 디코더의 비대칭 네트워크를 제안한 SepReformer 네트워크 구조>
연구자는 기존 음성 분리 분야에서 사용되고 있는 딥러닝 네트워크의 설계에서 실제 음원의 분리가 네트워크의 가장 후반부에서 진행되는 것의 한계점을 고려하여 모델을 디자인하였습니다.
한편 NeurIPS는 인공지능(AI) 및 기계 학습 분야에서 가장 권위 있는 국제 학회 중 하나로, 매년 전 세계의 연구자와 기업들이 참여하여 최신 연구 성과와 혁신 기술이 발표되고 논의되는 자리입니다. GAN, AlphaGo, Transformer, Diffusion 등 인공지능에 큰 영향을 끼친 기술이 해당 학회에서 발표되었으며 NeurIPS 2024는 오는 2024년 12월 9~15일 캐나다 벤쿠버에서 개최될 예정입니다.
▶ 논문제목: Separate and Reconstruct: Asymmetric Encoder-Decoder for Speech Separation
▶ 저자 정보: 신의협(제 1저자), 이상윤(제 2저자), 김태한(제 3저자), 박형민 교수(교신저자, 서강대)