발화 상상 시 뇌파 기반 음성 합성 방법 및 장치
본 발명은 발화 상상 시 뇌파 기반 음성 합성 방법 및 장치에 관한 것이다. 본 발명의 일 실시 예에 따른 발화 상상 시 뇌파 기반 음성 합성 방법은, 사용자의 발화 상상 뇌파를 획득하는 단계 획득된 상기 발화 상상 뇌파를 임베딩 벡터로 변환하는 단계, 상기 임베딩 벡터를 기반으로 mel-spectrogram을 생성하는 단계, 상기 mel-spectrogram을 이용하여 음성을 생성하는 단계 및 생성된 상기 음성을 출력하는 단계를 포함할 수 있다.
상세 설명
기술분야
본 발명은 발화 상상 시 뇌파 기반 음성 합성 방법 및 장치에 관한 것이다. 보다 상세하게는, 단어 또는 문장 등에 대한 발화 상상을 수행할 때의 뇌 신호를 측정하여 사용자의 뇌파로부터 사용자의 목소리를 합성하는 것을 가능케 하는 방법 및 장치에 관한 것이다.
해결하려는 과제
뇌 신호로부터 사용자의 의도를 인식하는 기술은 최근 많이 개발되고 있고, 분류 인식 성능을 높이기 위한 딥러닝 기반의 방법론들이 많이 개발되고 있다. 그 중에 발화 상상 기반의 사용자 의도 인식 기술은 클래스의 수를 늘릴 수 있다는 점에서 장점이 있다. 하지만, 분류 기반의 사용자 의도 인식은 분류 클래스 수로 자유도가 한정된다는 점에서 한계가 있다. 따라서, 본 발명에서는 뇌 신호로부터 음성을 합성하는 음성 합성 방법론을 제안한다.
발명의 효과
본 발명의 다양한 실시 예들에 따르면, 생성 모델과 음성 인식의 방법론을 사용함으로써 뇌파로부터 자유도 높게 사용자의 음성을 합성하여 자유도 높은 의사소통이 가능한 효과가 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.