생성 모델을 대상으로 멤버십 추론 공격을 수행하는 방법 및 이를 위한 장치
본 발명의 일 실시 예에 따른 프로세서 및 메모리를 포함하는 장치가 생성 모델을 대상으로 멤버십 추론 공격을 수행하는 방법은 (a) 공격 대상인 타겟(Target) 모델로서 상기 생성 모델의 출력 데이터(Xreal)를 무작위로 수집하는 단계, (b) 상기 수집한 생성 모델의 출력 데이터(Xreal)를 K(K는 2 이상의 자연수)개로 분리하여(Partitioning) K개의 개별 출력 데이터(Xreal, 1 ~ Xreal, K)를 생성하는 단계, (c) 상기 생성 모델의 출력 데이터(Xreal)를 모방한 모방 출력 데이터(Xfake)를 생성하는 단계, (d) 상기 생성한 K개의 개별 출력 데이터(Xreal, 1 ~ Xreal, K) 각각과 상기 생성한 모방 출력 데이터(Xfake)를 1:1로 매칭하여, 이들 매칭한 데이터 중에서 상기 K개의 개별 출력 데이터(Xreal, 1 ~ Xreal, K)를 각각 판별한 결과인 예측값을 출력하는 단계, (e) 상기 K개의 개별 출력 데이터(Xreal, 1 ~ Xreal, K)를 각각 판별한 결과인 예측값을 이용하여 상기 출력 데이터(Xreal)가 상기 생성 모델의 학습에 사용된 데이터인지 여부에 대한 예측값을 산출하여 출력하는 단계를 포함한다.
상세 설명
기술분야
본 발명은 생성 모델을 대상으로 멤버십 추론 공격을 수행하는 방법 및 이를 위한 장치에 관한 것이다. 보다 자세하게는 생성 모델의 대표적인 단점인 조기 수렴 현상 발생을 원천적으로 방지함으로써 공격 모델의 학습 성능을 향상시킬 수 있는 방법 및 이를 위한 장치에 관한 것이다.
해결하려는 과제
본 발명이 해결하고자 하는 기술적 과제는 멤버쉽 추론 공격을 구현한 공격 모델이 GAN 모델의 구조적인 특징을 갖는다 할지라도 조기 수렴 현상이 발생하지 않아 학습 성능을 향상시킬 수 있는 생성 모델을 대상으로 멤버십 추론 공격을 수행하는 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 학습 과정에서 조기 수렴 현상이 발행하지 않아 학습 성능을 향상시킴으로써 전체 공격 모델 자체의 성능까지 향상시킬 수 있는 생성 모델을 대상으로 멤버십 추론 공격을 수행하는 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
발명의 효과
상기와 같은 본 발명에 따르면, 공격 대상인 타겟 모델로서 생성 모델의 출력 데이터(Xreal)를 장치가 포함하는 GAN 모델의 판별자의 개수인 K개로 분리하여 개별 출력 데이터(Xreal, 1 ~ Xreal, K)를 생성하고, 각각의 판별자가 이를 학습하고 다른 데이터를 학습할 수 없는바, 판별자의 학습 속도가 생성자의 학습 속도보다 빠름으로 인해 발생하는 조기 수렴 현상의 발생 가능성 자체를 차단함으로써 장치의 학습 성능 향상을 이룰 수 있다는 효과가 있다.
또한, 장치의 학습 성능 향상이 이루어지는 만큼, 장치 자체의 성능 향상이 이루어지기에 멤버십 추론 공격 성공률까지 향상시킬 수 있다는 효과가 있다.