한 줄 정의
기계 비학습은 이미 학습된 AI 모델에서 특정 데이터나 지식을 선택적으로 제거하는 기술로, 개인정보 보호·저작권·AI 안전 규정 준수에 활용됩니다.
기계 비학습의 특성
기계 비학습은 모델 전체를 처음부터 다시 학습시키지 않고 특정 데이터의 영향만 선택적으로 지우는 기술입니다. 책 전체를 다시 쓰는 대신 특정 페이지만 교체하는 방식이라고 보면 됩니다. GDPR 같은 개인정보 보호 규정이 강화되면서, AI를 운영하는 기업에게 이 기능은 단순한 기술적 선택이 아닌 법적 필수 요건이 되어가고 있습니다.
기계 비학습이 필요한 이유
- 규정 준수
GDPR 등 개인정보 보호 규정 준수를 위해 특정 데이터의 AI 학습 영향을 선별 제거할 수 있습니다.
- 비용 절감
모델 전체를 재학습하지 않아도 되어 시간과 비용을 크게 절약할 수 있습니다.
- 모델 신뢰도 유지
편향된 데이터나 잘못된 정보를 AI에서 제거해 모델 품질과 신뢰도를 유지합니다.
실제 업무 적용 사례
한 기업은 고객이 개인정보 삭제를 요청했지만, 해당 데이터가 이미 AI 모델 학습에 포함돼 있어 빼내기 어려웠습니다. 기존에는 모델 전체를 처음부터 다시 학습해야 해 시간과 비용이 막대했습니다. 특정 데이터의 영향만 선택적으로 제거하는 기계 비학습을 적용하자, 전체 재학습 없이 해당 정보를 지워 개인정보 보호 규정을 준수하면서 모델 성능도 유지할 수 있었습니다.
자주 묻는 질문
모델 재학습은 전체 데이터셋에서 문제 데이터를 제거하고 처음부터 다시 학습시키는 방식입니다. 시간과 비용이 크게 듭니다. 기계 비학습은 이미 학습된 모델에서 특정 데이터의 영향만 수술하듯 제거합니다. 규모가 큰 모델일수록 재학습 비용이 막대하기 때문에, 기계 비학습의 실용적 가치가 더욱 높아집니다.
불량 판정 AI에 잘못 라벨링된 데이터가 포함됐거나, 특정 직원의 작업 데이터 삭제 요청이 있을 때, 또는 단종 제품의 학습 데이터를 제거해야 할 때 필요합니다. 품질 기준이 변경되거나 신규 규격이 도입될 때 기존 학습 데이터의 일부를 빠르게 업데이트하는 용도로도 활용됩니다.
고객이 데이터 삭제를 요청했을 때, 해당 데이터가 이미 학습에 포함됐더라도 그 영향만 선택적으로 제거할 수 있습니다. 전체 모델을 재학습하지 않고도 특정 정보를 지울 수 있어, 개인정보 보호 규정을 준수하는 데 도움이 됩니다.
관련 용어
- AI/ML (인공지능·머신러닝) — 데이터로부터 패턴을 학습해 예측·판단을 수행하는 인공지능과 머신러닝 기술
- AI 안전 (AI Safety) — AI 시스템이 안전하고 의도대로 작동하도록 위험을 관리하는 분야
- 전이 학습 (Transfer Learning) — 사전 학습된 모델의 지식을 새로운 도메인에 맞게 재활용·재학습하는 기법
© SAIGE All Rights Reserved.