層化標集

위키百科, 우리 모두의 百科事典.

統計學에서, 層化標集 (層化標集, Stratified sampling)은 母集團을 먼저 重複되지 않도록 層으로 나눈 다음 各 層에서 標本을 抽出하는 方法이다. 層을 나눌 때 層내는 同質的(homogeneous), 層間은 異質的(heterogeneous) 特性을 가지도록 하면 적은 費用으로 더 正確한 推定을 할 수 있으며, 全體 母集團뿐만 아니라 各 層의 特性에 對한 推定도 할 수 있다는 長點이 있다. 各 層으로부터 標本을 抽出할 때 單純任意 抽出 方法을 쓸 수도 있고 系統標集 (systematic sampling) 等 다른 抽出方法을 쓸 수도 있다. 또 必要에 따라 各 層을 다시 下位層으로 나누어 抽出하는 多段階 層化 抽出을 하기도 한다. [1]

標本 情報의 重要性 [ 編輯 ]

層化抽出法의 가장 重要한 點은 얼마만큼 標本의 情報를 根據로 母集團 을 層化하고 分割된 各 層으로부터 獨立的인 標本을 抽出하느냐의 與否이다. 層化抽出法의 適切한 標本抽出을 위하여 各 層에 對한 正確한 情報가 必要하다. 情報가 없을 때에는 誤差 가 커지게 된다. 單純任意抽出法과 달리 完全한 標本抽出틀이 各 層別로 要求되고 各 層內에서 適切한 標本이 抽出되어야 한다.

活用分野 [ 編輯 ]

層化抽出法은 標本調査方法에서 實際的으로 가장 많이 利用되는 抽出法이다. 單純任意抽出의 短點을 補完하려는 目的 및 其他 다른 抽出法과 比較하여 적은 費用으로 推定値를 多少 正確히 求할 수 있다. 때문에 母集團이 層化될 수 있는 情報를 가진 境遇 層化抽出法은 活用分野가 매우 넓은 標本抽出法에 該當된다.

標本抽出過程 [ 編輯 ]

標本抽出過程에서 가장 重要한 것은 母集團의 層을 나누는 方法, 卽 層化 方法과 標本을 몇 個 抽出하는가 與否이다.

第1過程 : 母集團의 層化 [ 編輯 ]

1) 몇 個의 層으로 나눌 것인가

層에 對한 특별한 規定은 없으나 母集團의 層化可能한 情報에 따란 2個 以上의 層으로 나누면 된다. 理由는 層을 나누지 않으면 이는 單純任意 抽出과 同一하기 때문에 差異를 두기 위한 것이다.

2) 層間 어떻게 나눌 것인가

層內部는 서로 同質的이고, 層間에는 서로 異質的이 되도록 層을 나누어야 한다. 效果的인 層化를 할 境遇 單純任意 抽出法보다 推定量의 誤差가 적게 되어 推定의 程度를 높일 수 있다. 層間 서로 同質的이란 意味는 層化를 했을 때 各 層 內部에 있는 單位들의 값의 變動이 적다는 것을 뜻하며 이는 推定量의 分散이 작게 된다는 意味이다.

第2過程 : 層別 目錄 作成 [ 編輯 ]

母集團을 몇 個의 層으로 分類한 다음 各 層을 하나의 父母集團(sub-population)으로 생각하여 各層을 構成하고 있는 單位들을 對象으로 目錄을 作成해야 한다. 各 層別로 配分된 標本을 單純任意抽出에 依하여 抽出해야 하기 때문에 目錄 作成過程이 必要하다.

第3過程 : 標本크기(n)를 決定 [ 編輯 ]

誤差의 限界 또는 要求되는 推定値의 信賴度를 滿足하도록 標本크기를 決定해야한다. 標本에 있는 情報의 量은 標本의 크기에 依存하는데 標本의 크기가 增加함에 따라 誤差의 限界는 줄어들게 되고 推定値의 信賴度는 높아지게 된다.

第4過程 : n個의 標本을 各 層別 配分 [ 編輯 ]

層化抽出法에서는 母集團에서 抽出되어야 할 標本의 크기가 決定되면 各 層別로 몇 個씩 抽出해야하는지 問題가 된다. 이에 對하여 同一한 크기로 配分하는 同一配分法(equal allocation method), 各 層의 크기에 比例하여 標本을 配分하는 比例配分法(proportional allocation method)等 다양한 方法으로 標本을 各 層別로 配分한다.

第5過程 : 各 層別 標本 抽出 [ 編輯 ]

層化抽出法에서 各 層別 配分된 標本을 單純任意抽出의 方法으로 標本을 抽出한다.

特徵 및 長.短點 [ 編輯 ]

長點 [ 編輯 ]

1) 單純任意 抽出보다 信賴性이 높은 推定値를 求할 수 있다.

各 層을 同質的으로 묶어 層化함으로써 層化抽出에서 求한 推定値의 分散이 單純任意抽出法으로 求한 推定의 分散이 單純任意抽出로 救한 推定値의 分散보다 적어지기 때문에 보다 信賴性이 높은 推定値를 求할 수 있다.

2) 費用 節減 및 資料分析이 容易하다.

費用을 줄일 수 있음은 勿論 資料整理나 分析이 容易한 理由는 層化抽出에 依해 標本으로 選擇된 單位만을 調査하기 때문이다.

3) 各 層에 對한 推定値를 附隨的으로 求할 수 있다.

이는 各 層을 同一性을 갖는 集團으로 區分하여 層化하기 때문에 各 層이 하나의 對象이 되는 境遇가 있다. 이러한 境遇 各 層에 對한 附隨的인 資料를 求할 수 있다.

短點 [ 編輯 ]

1) 厖大한 母集團의 境遇 目錄作成의 어려움

母集團의 크기가 너무도 큰 境遇 目錄을 作成하는 境遇는 標本 抽出을 하는 것보다 어려울 때가 많다.

2) 正確한 情報 必要

適切하게 層을 나누기 위해서는 母集團 各 層에 對한 正確한 情報를 必要로 한다. [2]

3) 層化의 어려움

層化抽出에서 가장 重要한 層 內에 同質性과 層 間에 異質性을 갖추어야 하는 問題에서 이는 理論上으로는 쉬울 수 있으나 이를 實質的으로 層化하는 過程에서는 어려움을 同伴하는 境遇가 많다.

같이 보기 [ 編輯 ]

各州 [ 編輯 ]

  1. 네이버 知識百科 , 出處-두산百科( http://www.doopedia.co.kr/ )
  2. Earl R. Babbie, 《社會調査方法論》, 센게이지러닝코리아(週), 2007, p.285

參考 文獻 [ 編輯 ]

  • 이해용ㅣ이필용, 《標本調査入門》, 敎友社, 2002, 133
  • Richard L. ScheafferㅣWilliam Mendenhall lllㅣR. Lyman Ott , 《Elementary Survey Sampling》, Duxbury Advanced Series, 2006