5. 개인정보
• 살아 있는 개인에 관한
정보로서 성명, 주민등
록번호 및 영상 등을 통
하여 개인을 알아볼 수
있는 정보
• 해당 정보만으로는 특정
개인을 알아볼 수 없더
라도 다른 정보와 쉽게
결합하여 알아볼 수 있
는 것을 포함
민감정보
• 사상/신념, 노동조합/정
당의 가입/탈퇴, 정치적
견해, 건강, 성생활 등에
관한 정보
• 유전자검사 등의 결과로
얻어진 유전정보나 범죄
경력자료에 해당하는 자
료
고유식별정보
• 개인을 고유하게 구별하
기 위하여 부여된 식별
정보로 다음의 어느 하
나에 해당하는 정보
• 주민등록번호
• 여권번호
• 운전면허번호
• 외국인등록번호
7. 개인정보 보호법
•2011년 9월 30일 시행
•2014년 8월 7일 개정안 시행
•개인정보 이용 제한
•제18조 2항 “통계작성 및 학술연구 등의 목적을 위하여 필요
한 경우로서 특정 개인을 알아볼 수 없는 형태로 개인정보를
제공하는 경우” 예외로 인정
•제24조 고유식별정보* 사용 원칙적 금지
• 제24조 2항 고유식별정보 중 주민등록번호는 다음의 경우를
제외하고는 처리 금지
•법령에서 구체적으로 주민등록번호의 처리를 요구 또는 허
용한 경우 (예: 의료법)
•정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위
한 경우
•안전행정부장관이 고시하는 경우
•보유하고 있는 주민등록번호는 법령에 구체적인 근거가 없는
경우 법 시행 후 2년 이내 파기 (’16년 8월까지 파기)
생명윤리 및 안전에 관한 법률
•2015년 12월 29일 일부개정안 시행
•개인정보 이용 제한
•제18조, 제38조, 제43조: 연구를 위해서 반드시 개별 동의를
받거나 또는 익명화 처리를 하여 기관위원회의 심의를 받아
야 함
•인간대상연구
•사람을 대상으로 물리적으로 개입하는 연구
•설문조사, 행동관찰 등으로 자료를 얻는 연구
•개인을 식별할 수 있는 정보를 이용하는 연구
•인체유래물연구
* 고유식별정보: 주민등록번호, 외국인등록번호, 여권번호, 운전면허번호
47. Patterns of identifiers Rules Examples
Names
홍길동님은
⇒ 이름:****님은
Name of patient (1) Exact match using list of patients
Relatives of patient
(2) Exact match using list of relatives of physicians and employees.
If found, remove the physicians or employees name.
Addresses
현주소: 서울 송파구 …
⇒ 주소:**********
8 provinces + gun (county) (3) (강원|경기|경상|전라|제주|충청).*군.*[읍면리로].*d
8 provinces + si (city) (4) (강원|경기|경상|전라|제주|충청).*시.*[동면리로].*d
6 metropolitan cities & 1 special city (5) (울산|인천|대구|부산|서울|대전|광주).*구.*[동로길].*d
Phone numbers
keywords +(: or space) + numbers
(6) (전.*화.*)[0-9]{2,3}[:s;-][0-9]{3,4}[:s;-][0-9]{4}
Tel: 010-1234-5678
⇒ 전화:***-***-***
(7) (TEL.*|Tel.*|tel.*)[0-9]{2,3}[:s;-][0-9]{3,4}
[:s;-][0-9]{4}
(8) (HP|Hp|hp|H.P|H.p|h.p).*[0-9]{2,3}[:s;-][0-9]{3,4}
[:s;-][0-9]{4}
(9) .*폰.*[0-9]{2,3}[:s;-][0-9]{3,4}[:s;-][0-9]{4}
(10) d{2,3}[-.s]d{3,4}[-.s]d{4}
(11) 팩.*스.*[0-9]{2,3}.*[0-9]{2,4}.*[0-9]
⇒ 팩스:***-***-***
(12) (FAX|fax|Fax).*[0-9]{2,3}.*[0-9]{2,4}.*[0-9]
Patient IDs
(13) (등록번호|등록 번호|환자번호|환자 번호|환자 정보|
ID|id|IDNO|idno|NO|No|Baby|baby|기증자|수혜자|
Donor|donor|Recipient|recepient)D{0,5}d{8}
등록번호: 12345678
⇒ 등록번호:********
Birth dates
(14) (생.*일|birth|BIRTH|Birth).*d{2,4} [;:#%s]*d{1,2}
[;:#%s] *d{1,2} [;:#%s]
(15) 출.*생.*d{2,4}[;:#%/s.]*d{1,2}[;:#%/s.]
*d{1,2}[;:#%s]
생년월일: 44.5.25
⇒ 생년월일:44.5.***
48. 총 기록지 개수 6,039
총 기록지 종류 20종 (응급 6/입원 11/외래 3)
총 개인식별 정보 개수 1862 (0.31 개/기록지)
정확도1) 99.08%
민감도2) 98.66%
1) PHI라고 제거한 정보 중 정확하게 지워진 비율
2) 제거대상 PHI 중 실제로 지워진 비율
49. 총 기록지 개수1) 5,000
총 기록지 종류 33종 (응급 7/입원 15/외래 11)
총 개인식별 정보 개수 773 (0.15 개/기록지)
정확도 99.87%
민감도 96.25%
1) 각 기록지의 저장된 정보의 양에 따라 일정 비율로 추출
50. Automatic de-identification systems (2012년 Cincinnati Children's Hospital Medical Center Paper)
Name Document Types PHI Precision Recall
MIST1
22 note types (incl. ER, OR, inpatient, outpati
ent)
3503 clinical notes
18 PHIs
92.05 91.02
MIST2 92.79 92.81
MCRF1 95.25 89.86
MCRF2 95.08 91.92
Human Annotator 1
22 note types, 10% of 3503 clinical notes
93.95 92.15
Human Annotator 2 88.45 94.55
MCRF2 95.73 92.91
52. ABLE Statistics (as of November 2015)
4M+ Total registered patients
743M+ Total orders
221M+ Total medications
960M+ Total lab results
464M+ Total clinical notes
25M+ Total images (DICOM)
53. AMIS CIS ABLE
1
• AMIS ID 보유
2
• GCP 교육 이수 후 eIRB 등록/승인
3
• ABLE 사용 교육 이수 후 서약서 제출
54.
55.
56. 기본 검색 항목
상세 검색 항목
Inclusion 조건
Exclusion 조건
모수 확인
(몇 명의 환자가 해당 되는가?)
조회 결과
67. 연구자 개인의 Excel 파일을 UPLOAD하여 다른 임상정보 추출
개인 Excel 자료 Upload
68.
69. Routine Validation of
Performance
• Regular validation should be required.
• We validate de-identification
performance of ABLE annually.
• And update the regular expression rules.
70. • 대상
– 2014년 9월 한달 동안 익명 chart review 대상
이 된 기록지
– 18종(외래 2, 응급실 5, 입원 11) 1,275개 서식지
• 방법
– Honest broker(간호사)가 익명화 결과를 EMR
차트를 확인하여 검증
71. 총 기록지 개수1) 1,275
총 기록지 종류 18종 (응급 5/입원 11/외래 2)
총 개인식별 정보 개수 195 (1.17 개/기록지)
정확도2) 69.93%
민감도 71.81%
1) 2014년 9월 한달 동안 익명 chart review 대상이 된 기록지
2) Honest broker(간호사)가 익명화 결과를 EMR 차트를 확인하여
검증