K-익명성
From CS Wiki
Revision as of 03:45, 8 March 2020 by Itwiki (talk | contribs) (문자열 찾아 바꾸기 - "분류:데이터 분석" 문자열을 "분류:데이터/통계학" 문자열로)
- K-anonymity
- 특정 개인을 식별할 수 없도록 전체 데이터셋에 동일 값 레코드 k개 이상 존재하도록 하는 비식별 모델
예시
- 비식별 전 데이터
구분 | 지역 코드 | 연령 | 성별 | 질병 |
---|---|---|---|---|
1 | 13053 | 28 | 남 | 전립선염 |
2 | 13068 | 21 | 남 | 전립선염 |
3 | 13068 | 29 | 여 | 고혈압 |
4 | 13053 | 23 | 남 | 고혈압 |
5 | 14853 | 50 | 여 | 위암 |
6 | 14853 | 47 | 남 | 전립선염 |
7 | 14850 | 55 | 여 | 고혈압 |
8 | 14850 | 49 | 남 | 고혈압 |
9 | 13053 | 31 | 남 | 위암 |
10 | 13053 | 37 | 여 | 위암 |
11 | 13068 | 36 | 남 | 위암 |
12 | 13068 | 35 | 여 | 위암 |
- 선거인 명부
구분 | 이름 | 지역코드 | 연령 | 성별 |
---|---|---|---|---|
1 | 김민준 | 13053 | 28 | 남 |
2 | 박지훈 | 13068 | 21 | 남 |
3 | 이지민 | 13068 | 29 | 여 |
4 | 최현우 | 13053 | 23 | 남 |
5 | 정서연 | 14853 | 50 | 여 |
6 | 송현준 | 14850 | 47 | 남 |
7 | 남예은 | 14853 | 55 | 여 |
8 | 성민재 | 14850 | 49 | 남 |
9 | 윤건우 | 13053 | 31 | 남 |
10 | 손윤서 | 13053 | 37 | 여 |
11 | 민우진 | 13068 | 36 | 남 |
12 | 허수빈 | 13068 | 35 | 여 |
- 지역코드 13053에 사는 28세 남자 김민준은 전립선염에 걸렸음을 재식별
- 비식별 조치 결과
구분 | 지역코드 | 연령 | 성별 | 질병 | 비고 |
---|---|---|---|---|---|
1 | 130** | < 30 | * | 전립선염 | 다양한 질병이
혼재되어 안전 |
2 | 130** | < 30 | * | 전립선염 | |
3 | 130** | < 30 | * | 고혈압 | |
4 | 130** | < 30 | * | 고혈압 | |
5 | 1485* | > 40 | * | 위암 | 다양한 질병이
혼재되어 안전 |
6 | 1485* | > 40 | * | 전립선염 | |
7 | 1485* | > 40 | * | 고혈압 | |
8 | 1485* | > 40 | * | 고혈압 | |
9 | 130** | 3* | * | 위암 | 모두가 동일
질병으로 취약
|
10 | 130** | 3* | * | 위암 | |
11 | 130** | 3* | * | 위암 | |
12 | 130** | 3* | * | 위암 |