준식別子

위키百科, 우리 모두의 百科事典.

준식別子 (準識別子, quasi-identifiers)는 固有 識別子 가 아닌 情報를 말하지만 固有 識別者를 만들기 위해 다른 준식별者들과 結合할 수 있는 엔티티와 充分히 相互 關聯되어 있다. [1]

그러므로 준식別子는 結合 時 個人 識別 情報 가 된다. 이 프로세스는 再識別 (re-identification)이라고 부른다. 한 例로, Latanya Sweeney는 社會的 性 , 生日 , 郵便番號 中 하나만 가지고서는 어느 것도 固有하게 個人을 識別하지 못하더라도 이 셋을 結合하면 美國 內 個人의 87%를 識別하기에 充分하다는 것을 證明하였다. [2]

이 用語는 1986年 Tore Dalenius에 依해 導入되었다. [3] 그 以後로 준식別子는 公開된 데이터의 여러 攻擊의 基礎가 되어왔다. 이를테면 Sweeney는 健康 記錄을 公開 情報와 連結시켜 固有하게 識別되는 준식別者를 使用하는 메사추세츠주의 病院 記錄의 當時 運營 委員을 識別했으며 [4] [5] Sweeney, Abu, Winn은 個人 게놈 프로젝트의 患者를 再識別하기 위해 有權者의 公開 記錄을 使用하였다. [6] 게다가 Arvind Narayanan과 Vitaly Shmatikov는 넷플릭스가 公開한 非匿名 데이터의 統計 條件을 識別하는 데 對해 준식別子에 關해 論하였다. [7]

같이 보기 [ 編輯 ]

各州 [ 編輯 ]

  1. “Glossary of Statistical Terms: Quasi-identifier” . OECD. 2005年 11月 10日 . 2013年 9月 29日에 確認함 .  
  2. Sweeney, Latanya. Simple demographics often identify people uniquely . Carnegie Mellon University, 2000. http://dataprivacylab.org/projects/identifiability/paper1.pdf
  3. Dalenius, Tore. Finding a Needle In a Haystack or Identifying Anonymous Census Records . Journal of Official Statistics, Vol.2, No.3, 1986. pp. 329?336. http://www.jos.nu/Articles/abstract.asp?article=23329 Archived 2017年 8月 8日 - 웨이백 머신
  4. Anderson, Nate. Anonymized data really isn’t?and here’s why not . Ars Technica, 2009. https://arstechnica.com/tech-policy/2009/09/your-secrets-live-online-in-databases-of-ruin/
  5. Barth-Jones, Daniel C. The're-identification'of Governor William Weld's medical information: a critical re-examination of health data identification risks and privacy protections, then and now. Then and Now (June 4, 2012) (2012).
  6. Sweeney, Latanya, Akua Abu, and Julia Winn. "Identifying participants in the personal genome project by name." Available at SSRN 2257732 (2013).
  7. Narayanan, Arvind and Shmatikov, Vitaly. Robust De-anonymization of Large Sparse Datasets . The University of Texas at Austin, 2008. https://www.cs.utexas.edu/~shmat/shmat_oak08netflix.pdf