[가명정보 지원 플랫폼] 5차시 : 가명처리 이해

2026. 5. 10. 23:09·개인정보보호/개인정보보호 강의 수강

지난 시간 복습

가명정보 처리에 관한 설명으로 옳지 않은 것은?

① 통계 목적에서는 동의 없이 활용 가능하다

② 가명정보는 개인정보에 해당하지 않는다

③ 특정 개인 식별 목적 처리는 금지된다

④ 과학적 연구 목적 활용 가능하다

-> 2번

 

가명정보 결합에 대한 설명으로 옳은 것은?

① 기업이 자유롭게 결합할 수 있다

② 반드시 결합전문기관을 통해 수행해야 한다

③ 결합정보는 자유롭게 반출 가능하다

④ 개인 식별 가능 정보를 포함할 수 있다

-> 2번

 

다음 중 가명정보 처리 시 안전조치로 옳지 않은 것은?

① 추가정보 분리 보관

② 처리 기록 보관

③ 재식별 허용

④ 기술적 보호조치

-> 3번

 

가명정보 처리 시 동의 없이 활용 가능한 목적을 서술하시오.

-> 통계 작성, 과학적 연구, 공익적 기록 보존

 

가명정보 결합 시 반드시 필요한 조건을 설명하시오.

-> 반드시 결합전문기관을 통해 수행해야 하며, 결합정보 반출 시에도 추가 승인을 받아야만 한다!!

 


1. 가명처리 이해

가명 처리  : 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 과정

가명정보 처리 : 가명처리를 통해 생성된 가명정보를 이용/제공 등 활용하는 행위

 

가명정보처리 가이드라인 5단계 절차

 

가명정보를 처리함에 있어 안전조치 의무와 처리 시 금지의무(재식별 금지 원칙) 준수

직무 개인정보 처리 추가정보 처리 (추가)가명처리 적정성검토 가명정보처리
가명처리 수행자 O O O X X
가명정보 결합자 O O O X X
적정성 검토자 X X X O X
가명정보 취급자 X X X X O

 

취급자와 '다른정보' 기준으로 재식별 가능성 검토

구분 익명정보 가명정보
취급자 불특정 다수(통제 불가) 개인정보보호법 제28조의4
(가명정보에 대한 안전조치 의무 등) 준수
'다른 정보' 합법적 '다른정보' 활용(통제 불가) 개인정보보호법 제28조의5
(가명정보 처리 시 금지 의무 등) 준수

 

가명 정보의 필요성!

-> 서로 다른 이종간 데이터들을 가명처리한 가명정보를 결합하여 새로운 인사이트를 도출하거나 서비스 개발 등에 이용 및 활용

금융-치안-통신-지역경제-라이프로그-교통-헬스케어-환경-농식품-감염병-공간정보-보건의료 등등

 

2. 가명처리 기술에 대한 이해

전통적인 비식별 기술의 한계

데이터 유용성과 개인정보 보호 수준이 Trade Off 요소 존재 

개인정보 속성 분류 목적

가명정보를 처리하는 환경과 데이터의 위험을 분석하여 적절한 가명처리 수준을 결정한다!

개인정보란?

: 살아있는 개인에 관한 정보로서 개인을 알아볼 수 있는 정보. 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보 -> 가명처리된 가명정보

개인정보 속성 분류 식별에 대한 영향 프라이버시 침해 가능성
고유식별자 매우 높음 일부 있음
준식별자 높음 일부 있음
민감정보 거의 없음(단, 특이치의 경우 높음) 매우 높음
일반정보 거의 없음(단, 특이치의 경우 높음) 거의 없음

개인정보를 포함한 일반적 자료 형태

Raw Data, Micro Data, Macro Data 자료의 3가지 속성

 

  • Raw Data(원시 자료): 수집된 그대로의 가공되지 않은 자료입니다.
  • Micro Data(미세 자료): 개별 단위(개인, 개별 사업체 등)의 정보가 그대로 살아있는 상세 자료입니다. 가명처리 시 주요 대상이 됩니다.
  • Macro Data(거시 자료): 미세 자료를 집계하여 통계표 등으로 요약한 자료입니다.

범주속성 (Categorical Attribute):

  • 의미: 데이터를 구분하는 '기준'입니다. (예: 성별, 지역, 연령대, 직업)

요약속성 (Summary Attribute):

  • 의미: 실제 관찰된 '값'이나 '수치'입니다. (예: 매출액, 키, 몸무게, 인원수)

메타 데이터 (Data for Data)

: 데이터를 올바르게 해석하기 위해 필요한 '데이터에 대한 설명서'

자료형태별 데이터 분석 특징

데이터가 어떤 성질을 가졌느냐에 따라 분석 방법과 계산 가능 여부가 달라질 수 있다.

특이 정보 관찰 방법 개요

가명정보를 취급하는 담당자가 데이터에서 구별, 연결, 추론이 가능한 대상을 찾아내기 위한 전체적인 분석 프레임워크를 보여준다.

  • k-익명성: 비슷한 속성을 가진 사람들을 묶어(동질 그룹) 최소 인원 이상이 되도록 관리하는 방식.
  • Outlier(특이치): 평균적인 분포에서 크게 벗어난 수치를 찾아내는 방법.
  • 도수분포표: 특정 항목이 너무 적게 나타나는 경우(빈도 분석)를 확인.

k-익명성과 재식별 위험

데이터 세트에서 특정 레코드가 얼마나 쉽게 구별되는지를 보여주는 실례

 

  • 주요 개념: k-익명성은 개인정보 보호의 대표적인 모델로, 같은 속성을 가진 사람이 최소 $k$명 이상 존재하게 만들어 누가 누구인지 모름
  • 표 분석: 14번 행(서울 양천구, 직장인, 여자)처럼 전체 데이터에서 혼자만 튀는 특성을 가진 경우, 연결 위험이 높다고 판단하여 조치 대상으로 분류

수치형 데이터 관찰방법

숫자로 된 데이터(연봉, 나이, 자산 등)에서 특이치를 찾아내는 통계적 기법

  • 3시그마 규칙 ($68-95-99.7$ 규칙): 정규분포에서 평균으로부터 표준편차($\sigma$)의 3배를 벗어나는 값(전체의 $0.3\%$ 미만)을 특이치
    • $1.5 \times IQR$ 방식 (Box Plot 방식): 데이터를 4등분 했을 때 중간 $50\%$ 구간($IQR = Q3 - Q1$)의 1.5배 범위를 넘어서는 상하단 값을 특이치로 판단

 

범주형 데이터 관찰방법

숫자가 아닌 범주(지역, 직업, 혈액형 등) 데이터에서 희귀 사례를 찾는 방법입니다.

  • 빈도 분석: 막대그래프나 표를 그려서 빈도수가 너무 적은 항목을 찾음.
  • 예시: '지역-직업' 결합 데이터에서 "강원 지역의 국회의원"이 단 1명뿐이라면, 이 데이터는 가명처리를 하더라도 누군지 쉽게 유추될 수 있어 위험 정보로 간주.

퀴즈

1. 다음 중 개인정보 속성 분류에서 프라이버시 침해 가능성이 가장 높은 속성은?

①고유식별자
②준식별자
③민감정보
④일반정보
 

2. 가명정보처리 가이드라인의 직무별 역할 중, 적정성 검토만 수행할 수 있고 가명처리나 가명정보 처리는 할 수 없는 직무는?

①가명처리 수행자
②가명정보 결합자
③적정성 검토자
④가명정보 취급자
 

3. k-익명성 모델에서 k값이란, 동일한 속성을 가진 레코드가 데이터셋 내에 최소 k개 이상 존재하도록 보장하여 개인을 특정하기 어렵게 만드는 기준이다.( O/X )

 

4. Micro Data(미세 자료)는 개별 단위의 상세 정보가 살아있는 자료로, 가명처리의 주요 대상이 된다. Macro Data(거시 자료)는 이를 집계·요약한 통계 형태의 자료이다.( O/X )

 

5. 수치형 데이터에서 특이치를 탐지하는 방법 중, 데이터를 4등분했을 때 중간 50% 구간(Q3-Q1)의 1.5배 범위를 벗어나는 값을 특이치로 판단하는 통계 기법의 이름은? ___________


해설

문제 1 (객관식) 개인정보 속성 분류에서 프라이버시 침해 가능성이 가장 높은 속성은?

정답: ③ 민감정보

속성별 특성을 정리하면, 고유식별자와 준식별자는 식별에 대한 영향이 높지만 프라이버시 침해 가능성은 일부에 그칩니다. 반면 민감정보는 식별 영향은 거의 없으나 프라이버시 침해 가능성이 매우 높습니다. 일반정보는 두 가지 모두 거의 없습니다. 단, 민감정보와 일반정보 모두 특이치(Outlier)인 경우 식별 영향이 높아질 수 있습니다.


문제 2 (객관식) 적정성 검토만 수행할 수 있고 가명처리·가명정보처리는 할 수 없는 직무는?

정답: ③ 적정성 검토자

직무별 수행 가능 업무를 정리하면 다음과 같습니다.

  • 가명처리 수행자·가명정보 결합자: 개인정보 처리, 추가정보 처리, 가명처리 가능 (O) / 적정성 검토·가명정보처리 불가 (X)
  • 적정성 검토자: 적정성 검토만 가능 (O) / 나머지 모두 불가 (X)
  • 가명정보 취급자: 가명정보처리만 가능 (O) / 나머지 모두 불가 (X)

문제 3 (OX) k-익명성은 동일 속성을 가진 레코드가 최소 k개 이상 존재하도록 보장하는 모델이다.

정답: O

k-익명성은 대표적인 개인정보 보호 모델로, 동일한 속성 조합을 가진 사람이 데이터셋 내에 최소 k명 이상 존재하도록 만들어 특정 레코드만으로는 개인을 구별하기 어렵게 합니다. 블로그 예시에서 14번 행(서울 양천구·직장인·여자)처럼 혼자만 해당되는 경우 연결 위험이 높아 조치 대상으로 분류됩니다.


문제 4 (OX) Micro Data는 가명처리의 주요 대상이며, Macro Data는 이를 집계·요약한 통계 형태 자료이다.

정답: O

자료 형태는 세 가지로 구분됩니다. Raw Data는 수집된 그대로의 가공되지 않은 원시 자료, Micro Data는 개인·개별 사업체 단위의 상세 정보가 담긴 자료로 가명처리의 핵심 대상, Macro Data는 Micro Data를 집계하여 통계표 등으로 요약한 자료입니다.


문제 5 (단답형) 수치형 데이터에서 중간 50% 구간(Q3-Q1)의 1.5배를 벗어나는 값을 특이치로 판단하는 기법은?

정답: IQR (Box Plot 방식)

IQR(Interquartile Range)은 데이터를 4등분했을 때 Q3에서 Q1을 뺀 중간 50% 구간을 의미합니다. 이 값의 1.5배 범위를 상하로 벗어나는 값을 특이치(Outlier)로 판단합니다. 수치형 특이치 탐지에는 이 방식 외에도 평균으로부터 표준편차의 3배를 벗어나는 값을 특이치로 보는 3시그마(68-95-99.7) 규칙도 함께 사용됩니다.

'개인정보보호 > 개인정보보호 강의 수강' 카테고리의 다른 글

[가명정보 지원 플랫폼] 4차시 - 가명정보 활용에 대한 이해  (0) 2026.05.17
[개인정보배움터] 개인정보 처리 단계별 절차 이해 - 수집/동의  (0) 2026.05.17
[개인정보배움터] 개인정보 처리 단계별 절차 이해 - 이용/제공  (0) 2026.05.10
[가명정보 지원 플랫폼] 가명정보 관련 제도에 대한 이해  (0) 2026.04.12
[개인정보 배움터] 사례로 보는 개인정보 이슈  (1) 2026.04.11
'개인정보보호/개인정보보호 강의 수강' 카테고리의 다른 글
  • [가명정보 지원 플랫폼] 4차시 - 가명정보 활용에 대한 이해
  • [개인정보배움터] 개인정보 처리 단계별 절차 이해 - 수집/동의
  • [개인정보배움터] 개인정보 처리 단계별 절차 이해 - 이용/제공
  • [가명정보 지원 플랫폼] 가명정보 관련 제도에 대한 이해
maysokuli
maysokuli
성실히 열심히 꾸준히 / 디지털 포렌식 공부 중
  • maysokuli
    정보보호 소쿠리
    maysokuli
  • 공지사항

    • 분류 전체보기
      • 디지털 포렌식
        • 기술 스터디
        • 인프런 [기초부터 따라하는 디지털포렌식]
        • 드림핵 [Digital Forensics Basi..
        • 디스크포렌식(이별)
        • 심화팀 - 클라우드
        • 워게임 풀이
        • 기타 추가 공부
      • 개인정보보호
        • 기술 스터디
        • 개인정보보호 강의 수강
        • 동향 스터디
        • 기타 추가 공부
  • 최근 글

  • 전체
    오늘
    어제
  • hELLO· Designed By정상우.v4.10.6
maysokuli
[가명정보 지원 플랫폼] 5차시 : 가명처리 이해
상단으로

티스토리툴바