조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법 및 이를 위한 장치
본 발명의 일 실시 예에 따른 조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법은 (a) 제N(N은 임의의 양의 정수) 학습 데이터를 입력하여 이미지 생성 모델을 학습시키는 단계, (b) 의미론적 이미지를 생성하고자 하는 입력 데이터를 상기 학습시킨 이미지 생성 모델에 입력하는 단계 및 (c) 상기 입력한 입력 데이터에 따라 상기 이미지 생성 모델이 생성한 하나 이상의 의미론적 이미지를 출력하는 단계를 포함하고, 상기 입력 데이터는, 입력 조건 데이터인 조건 이미지 틀(Layout)을 포함하며, 상기 조건 이미지 틀은, 생성하고자 하는 의미론적 이미지가 포함하는 하나 이상의 대상인 클래스(Class)가 대상별로 각각의 카테고리로 분류되며, 상기 클래스가 차지하고 있는 픽셀 영역에 상기 분류된 카테고리 별로 상이한 숫자가 부여된 이미지 틀이다.
상세 설명
기술분야
본 발명은 조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법 및 이를 위한 장치에 관한 것이다. 보다 자세하게는 이미지 틀만을 입력 받은 인공지능 기반의 이미지 생성 모델이 해당 이미지 틀에 부합하는 고품질 이미지를 다양하게 생성할 수 있는 방법 및 이를 위한 장치에 관한 것이다.
해결하려는 과제
본 발명이 해결하고자 하는 기술적 과제는 의미론적 이미지 생성 기술의 이미지 생성 모델로 디퓨전 모델을 적용함으로써 안정적인 학습이 가능한 조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 의미론적 이미지 생성 기술의 이미지 생성 모델로 디퓨전 모델을 적용함으로써 고품질 이미지를 다양하게 생성할 수 있는 조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 인공지능 기반의 이미지 생성 모델로 디퓨전 모델을 적용하되, 모델이 처음 접하는 이미지 틀에 대해서도 이미지를 생성할 수 있는 조건 이미지 디퓨전을 활용한 의미론적 이미지 생성 방법 및 이를 위한 장치를 제공하는 것이다.
발명의 효과
상기와 같은 본 발명에 따르면, 이미지 생성 기술의 이미지 생성 모델로 디퓨전 모델을 적용하되, 메모리 자원의 부담 경감, 연산 시간 등의 요소를 실시간으로 고려하여 제1 노이즈 추가 방식 내지 제4 노이즈 추가 방식 중 어느 하나를 적절하게 선택하여 학습을 진행함으로써 안정적인 학습이 가능해짐과 동시에 고품질 이미지를 생성할 수 있다는 효과가 있다.
또한, 최빈값 붕괴 현상으로 인해 생성된 의미론적 이미지의 다양성이 떨어지는 종래 기술의 문제점을 해결하여 하나의 입력 데이터에 대하여 다양한 의미론적 이미지를 생성할 수 있는바, 결과물의 다양성을 확보할 수 있다는 효과가 있다.