문서 파일의 마지막 저장 프로그램을 분류하는 방법 및 이를 위한 장치
본 발명의 일 실시 예에 따른 프로세서 및 메모리를 포함하는 장치가 문서 파일의 마지막 저장 프로그램을 분류하는 방법은 (a) N(N은 2 이상의 정수)개의 문서 파일을 포함하는 데이터셋을 구축하는 단계, (b) 상기 구축한 데이터셋을 분류 모델에 입력하여 학습하는 단계, (c) 마지막 저장 프로그램을 분류하고자 하는 문서 파일을 수신하는 단계, (d) 상기 수신한 마지막 저장 프로그램을 분류하고자하는 문서 파일에 대한 전처리를 수행하는 단계 및 (e) 상기 전처리를 수행한 마지막 저장 프로그램을 분류하고자 하는 문서 파일을 상기 분류 모델에 입력하여 마지막 저장 프로그램 분류 결과를 출력하는 단계를 포함하며, 상기 N개의 파일은, OOXML(Office Open XML) 기반 문서 파일이다.
상세 설명
기술분야
본 발명은 문서 파일의 마지막 저장 프로그램을 분류하는 방법 및 이를 위한 장치에 관한 것이다. 보다 자세하게는 문서 파일의 내부 데이터를 분석하여 디지털포렌식 활동을 위한 마지막 저장 프로그램을 분류할 수 있는 방법 및 장치에 관한 것이다.
해결하려는 과제
본 발명이 해결하고자 하는 기술적 과제는 디지털포렌식 활동에 있어서 문서 파일의 근원지를 파악할 때 용이하게 활용될 수 있는 문서 파일의 마지막 저장 프로그램을 분류하는 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 인공지능 모델의 학습 데이터의 크기가 크지 않고, 문서 파일의 마지막 저장 프로그램 분류시 활용하는 데이터의 양을 적게 함으로써 수사관이 현장에서 활용할 수 있는 이동형 디지털포렌식 분석 시스템에 탑재할 수 있는 문서 파일의 마지막 저장 프로그램을 분류하는 방법 및 이를 위한 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
발명의 효과
상기와 같은 본 발명에 따르면, 데이터셋을 구축하여 분류 모델에 학습시킨 이후, 마지막 저장 프로그램을 분류하고자 하는 문서 파일을 수신하여 분류 모델에 입력하기만 하면 분류 결과가 손쉽게 출력되는바, 과제는 디지털포렌식 활동에 있어서 문서 파일의 근원지를 파악할 때 용이하게 활용할 수 있다는 효과가 있다.
또한, 500개 정도의 문서 파일을 통해 분류 모델의 학습이 가능하기에 학습에 필요한 데이터의 크기가 크지 않고, 문서 파일의 마지막 저장 프로그램 분류시 활용하는 데이터의 양까지 적게할 수 있는바, 수사관이 현장에서 활용할 수 있는 이동형 디지털포렌식 분석 시스템에 손쉽게 탑재함으로서 편의성을 향상시킬 수 있다는 효과가 있다.