마이크로소프트가 개인정보를 보호하기 위한 방안으로 인공지능(AI) 기억을 제어하는 프로그램을 연구하고 있다는 소식이다. 이 회사 연구팀은 최근 인공 일반 지능의 물리학적 이해를 기반으로 개인정보 보호 문제를 기술적으로 해결하는 방법을 찾고 있다고 밝혔다.
이른바 연구 프로젝트 <Physics of AGI>이 그것으로, 인공지능의 거대 언어 모델인 LLM이 특정 정보를 잊어버리게 만드는 방법이다.
이와 관련해 연구팀은 최근 “포터가 누구지?: LLM으로 하여금 잊어버리게 하기(Who’s Harry Potter? Making LLMs Forget)라는 주제로 개발 과정을 소개하고 있어 눈길을 끈다.
LLM은 대용량의 데이터셋을 학습하는데, 이 과정에서 해당 데이터에는 우리의 개인정보나 민감한 정보가 포함될 수 있다. 이는 개인정보 침해라는 문제를 일으킬 수 있기 때문에 이러한 정보를 효과적으로 제거하기 위해 “후이즈포터(해리포터)?”라는 예시를 들어 연구 팀은 설명하고 있다.
이 방법은 LLM이 특정 정보를 기억하지 않도록 만들어주는 것이다. 엄밀히 말하면 특정정보를 유사한 정보로 대체하여 기억시키는 방법이다.
“후이즈포터” 방법은 의외로 아주 간단한 원리로 작동하는데 먼저, LLM에게 잊어야 할 정보를 입력하고, 그런 다음, 해당 정보와 관련된 새로운 대체 정보를 함께 제공한다. 이 새로운 정보는 기존의 정보를 희석시켜 잊게 만드는 역할을 한다.
결국 이렇게 입력된 정보를 바탕으로 LLM은 훈련 데이터에서 해당 정보를 잊게 되고 개인정보 보안에 위배되는 정보를 다른 정보로 대체한다.
이 방법은 향후 LLM의 파라미터(매개변수)를 업데이트하지 않고도 특정 정보를 희석시킬 수 있어서 단순 정보를 잊게 하는 것은 물론 개인정보와 관련된 중요한 문제를 즉각적으로 해결할 수 있어 귀추가 주목된다.