Rank Order Segregation Index for Continuous Variables




on Categorical Variables

Segregation index (๋ถ„๋ฆฌ ์ง€์ˆ˜)๋Š” ํ•œ ์‚ฌํšŒ ๋‚ด ๊ตฌ์„ฑ์›์ด ์–ด๋–ค ๊ธฐ์ค€์— ๋”ฐ๋ผ ๋ถ„๋ฆฌ๋œ ์ •๋„๋ฅผ ์ธก์ •ํ•˜๋Š”, ์‚ฌํšŒ๊ณผํ•™์˜ ์ค‘์š”ํ•œ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค. ํ”ํžˆ ์ธ์ข…์ด๋‚˜ ์„ฑ๋ณ„์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ ์ง€์ˆ˜๋ฅผ ๋งŽ์ด ์ธก์ •ํ•˜๋Š”๋ฐ, ์ด๋•Œ ์‚ฌํšŒ ๊ตฌ์„ฑ์›์ด ํฌ๊ฒŒ ๋‘ ๋ถ„๋ฅ˜๋กœ ๋ถ„๋ฆฌ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๊ฐ€์ •๋ฉ๋‹ˆ๋‹ค. ์„ฑ๋ณ„์˜ ๊ฒฝ์šฐ ๋‚จ๋…€๋กœ, ์ธ์ข…์˜ ๊ฒฝ์šฐ ๋ฏธ๊ตญ์—์„œ๋Š” ํ‘์ธ/๋ฐฑ์ธ์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ๊ฐ€ ์ž์ฃผ ๊ฐ€์ •๋ฉ๋‹ˆ๋‹ค. ๋งŒ์ผ ์ธ์ข…์— ๋”ฐ๋ฅธ ๊ฑฐ์ฃผ์ง€ ๋ถ„๋ฆฌ ์ง€์ˆ˜๋ฅผ ๊ตฌํ•œ๋‹ค๋ฉด, ์ง€์—ญ๋ณ„๋กœ ๊ฐ™์€ ์ธ์ข…๋ผ๋ฆฌ ๊ฑฐ์ฃผํ•˜๋Š” ์ •๋„๊ฐ€ ์–ผ๋งˆ๋‚˜ ๊ฐ•ํ•œ์ง€๋ฅผ ๊ตฌํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์ด ๊ฒฝ์šฐ ํ”ํžˆ ์‚ฌ์šฉ๋˜๋Š” ๋ถ„๋ฆฌ ์ง€์ˆ˜์˜ ์‚ฐ์‹์€ ์ด๋ ‡์Šต๋‹ˆ๋‹ค.

\[ D = \frac{1}{2} \Sigma_{k=1}^K | \frac{n^a_k}{N^a} - \frac{n^b_k}{N^b} | \]

์œ„ ์‹์—์„œ \(K\)๋Š” ์ง‘๋‹จ์˜ ์ด ๊ฐœ์ˆ˜์ž…๋‹ˆ๋‹ค. ๊ฑฐ์ฃผ์ง€์—์„œ์˜ ๋ถ„๋ฆฌ ์ง€์ˆ˜๋ผ๋ฉด ๊ณ ๋ คํ•˜๋Š” ์ง€์—ญ์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋ฉ๋‹ˆ๋‹ค. ์ด๋•Œ ๊ฐ ๊ตฌ์„ฑ์›๋“ค์€ a์™€ b ๋‘ ์นดํ…Œ๊ณ ๋ฆฌ ์ค‘ ํ•˜๋‚˜์— ํ•ด๋‹น๋ฉ๋‹ˆ๋‹ค. ์„ฑ๋ณ„ ๋ถ„๋ฆฌ ์ง€์ˆ˜๋ผ๋ฉด a์™€ b๊ฐ€ ๊ฐ๊ฐ ๋‚จ๋…€์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. \(N^a\)๋Š” ๋ชจ๋“  ์ง‘๋‹จ์—์„œ a์นดํ…Œ๊ณ ๋ฆฌ์— ์†ํ•˜๋Š” ๊ตฌ์„ฑ์›์˜ ์ˆ˜์ž…๋‹ˆ๋‹ค. \(N^b\)๋Š” ๋ชจ๋“  ์ง‘๋‹จ์—์„œ b์นดํ…Œ๊ณ ๋ฆฌ์— ์†ํ•˜๋Š” ๊ตฌ์„ฑ์›์˜ ์ˆ˜์ž…๋‹ˆ๋‹ค. \(n^a_k\)๋Š” \(k\)๋ฒˆ์งธ ์ง‘๋‹จ์—์„œ a์นดํ…Œ๊ณ ๋ฆฌ์— ์†ํ•˜๋Š” ๊ตฌ์„ฑ์›์˜ ์ˆ˜, \(n^b_k\)๋Š” \(k\)๋ฒˆ์งธ ์ง‘๋‹จ์—์„œ b์นดํ…Œ๊ณ ๋ฆฌ์— ์†ํ•˜๋Š” ๊ตฌ์„ฑ์›์˜ ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด ์‹์€ ์ „์ฒด ๋น„์œจ ํ‰๊ท ์œผ๋กœ๋ถ€ํ„ฐ ๊ฐ ์ง‘๋‹จ์˜ ๊ตฌ์„ฑ๋น„๊ฐ€ ์–ผ๋งˆ๋‚˜ ํŽธ์ค‘๋˜์–ด ์žˆ๋‚˜๋ฅผ ์ธก์ •ํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ๊ฐ’์˜ ๋ฒ”์œ„๋Š” \([0, 1]\)์ž…๋‹ˆ๋‹ค.

์ด๋ฅผ Python์œผ๋กœ ๊ฐ„๋‹จํžˆ ์ •์˜ํ•ด๋ณด๋ฉด ์ด๋ ‡์Šต๋‹ˆ๋‹ค.

import numpy as np
from typing import List, Any

# bool์€ ๊ฐ ๊ตฌ์„ฑ์›์ด ์–ด๋–ค ์นดํ…Œ์ฝ”๋ฆฌ์— ์†ํ•˜๋Š”์ง€ ํ‘œํ˜„
# List[bool]์€ ๊ฐ ์ง‘๋‹จ์— ํ•ด๋‹น
def get_d(list_of_list: List[List[bool]]) -> float:
  a_counts = [(np.array(e)==True).sum() for e in list_of_list]
  b_counts = [(np.array(e)==False).sum() for e in list_of_list]
  a_total = sum(a_counts)
  b_total = sum(b_counts)

  return sum([abs(a/a_total - b/b_total) for a, b in zip(a_counts, b_counts)])/2

# True ์œ ํ˜•๊ณผ False ์œ ํ˜•์ด ๊ณ ๋ฅด๊ฒŒ ๋ถ„ํฌํ•  ๊ฒฝ์šฐ
ex1 = [[True, True, False], [True, True, True, True, False, False, False], [True, False, False, True, False]]
# True ์œ ํ˜•๊ณผ False ์œ ํ˜•์ด ์„œ๋กœ ์ž˜ ์•ˆ ์„ž์—ฌ ์žˆ๋Š” ๊ฒฝ์šฐ
ex2 = [[True, True, True], [False, False], [True, False], [False, False, False, True]]

print(f"{get_d(ex1):.04}") # 0.1786
print(f"{get_d(ex2):.04}") # 0.6333

์˜ˆ์‹œ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ์ถœ๋ ฅ๊ฐ’์„ ๋ณด๋ฉด, ๋‘ ์œ ํ˜•์ด ๋” ์ž˜ ์„ž์—ฌ ์žˆ๋Š” ex1์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๊ฐ€ ๋ผ๋ฆฌ๋ผ๋ฆฌ ๋ชจ์—ฌ ์žˆ๋Š” ex2์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ณด๋‹ค ๋‚ฎ์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฐ๋ฐ ์ด ๋ถ„๋ฆฌ์ง€์ˆ˜์—๋Š” ์น˜๋ช…์ ์ธ ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿซข ๋ฐ”๋กœ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๊ฐ€ ์•„๋‹Œ ๊ฒฝ์šฐ์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ์ธก์ •ํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ธ์ข…, ์„ฑ๋ณ„์ฒ˜๋Ÿผ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๊ฐ€ ์•„๋‹Œ, ์—ฐ์†ํ˜•์ด๊ฑฐ๋‚˜ ์ˆœ์„œํ˜• ๋ณ€์ˆ˜๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผํ• ๊นŒ์š”? ๊ทธ ๋Œ€ํ‘œ์ ์ธ ๊ฒฝ์šฐ๊ฐ€ ์†Œ๋“ ๋ณ€์ˆ˜์ž…๋‹ˆ๋‹ค. ์†Œ๋“ ๋ณ€์ˆ˜๋Š” ๊ทธ ์ž์ฒด๋กœ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๊ฐ€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์†Œ๋“ ๋ถ„ํฌ์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•  ๋•Œ๋Š” ๋ณดํ†ต ์ž„์˜๋กœ ๊ธฐ์ค€์ ์„ ์ •ํ•˜๊ณ  ๊ทธ์— ๋”ฐ๋ฅธ ๋ฒ”์ฃผ๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ƒ์ธต๊ณผ ํ•˜์ธต์„ ๊ตฌ๋ณ„ํ•˜๊ณ  ๊ทธ์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด์ฃ . ํ•˜์ง€๋งŒ ์ด ๊ฒฝ์šฐ์—๋„ ์—ฌ์ „ํžˆ ๋ฌธ์ œ๋Š” ์žˆ์ฃ . ์šฐ์„  ๊ทธ ๊ธฐ์ค€์ ์„ ์–ด๋””๋กœ ์ •ํ•  ๊ฒƒ์ด๋ƒ - ๊ฒฐ์ฝ” ์ •๋‹ต์ด ์—†์Šต๋‹ˆ๋‹ค. ๋ฌด์—‡๋ณด๋‹ค, ์—ฐ์†ํ˜•/์ˆœ์„œํ˜• ๋ณ€์ˆ˜๋ฅผ ๋ฒ”์ฃผํ˜•์œผ๋กœ ๋ฐ”๊ฟˆ์œผ๋กœ์จ ์ „์ฒด ๋ถ„ํฌ๊ฐ€ ๊ฐ–๋Š” ์ƒ๋‹นํ•œ ์ •๋ณด๋Ÿ‰์„ ์ƒ์‹คํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๋•Œ๋ฌธ์— ์ด์— ๋Œ€ํ•œ ๋Œ€์•ˆ์ด ๊พธ์ค€ํžˆ ์ œ์‹œ๋˜์–ด ์™”์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” Reardon(2011)์ด ์ œ์‹œํ•œ ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค. ์†Œ๋“๊ณผ ๊ฐ™์€ ์—ฐ์†ํ˜• ๋ณ€์ˆ˜์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ํ˜„์žฌ๊นŒ์ง€ ์ œ์‹œ๋œ ๋ฐฉ๋ฒ•๋“ค ์ค‘ ๊ฐ€์žฅ ํ•ฉ๋ฆฌ์ ์ด๊ณ , ๊ฒฝ์ œํ•™๊ณผ ์‚ฌํšŒํ•™ ๋“ฑ ์—ฌ๋Ÿฌ ๋ถ„์•ผ์˜ ์‹ ์ง„ ์—ฐ๊ตฌ์—์„œ ์ ๊ทน์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

on Continuous Variables

Reardon(2011)'s solution

Reardon์ด ์ œ์‹œํ•œ ๋ฐฉ๋ฒ•์€ ์•„์ฃผ ๋‹จ์ˆœํ•˜๊ณ  ๊ฐ•๋ ฅํ•œ ์ง๊ด€์—์„œ ์ถœ๋ฐœํ•ฉ๋‹ˆ๋‹ค. ์†Œ๋“์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•  ๋•Œ ๊ทธ๋™์•ˆ ์ž„์˜์˜ ๊ธฐ์ค€์ ์„ ์žก๊ณ  ๊ทธ ๊ฒฝ๊ณ„์— ๋”ฐ๋ผ ๋ฒ”์ฃผ๋ฅผ ๋‚˜๋ˆ„๋Š” ๋ฐฉ์‹์„ ์‚ฌ์šฉํ–ˆ๋‹ค๋ฉด, ์–ด๋–ค ๊ธฐ์ค€์ ์— ๋”ฐ๋ผ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜์‹์„ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๊ธฐ์ค€์ ์˜ ๋ฒ”์œ„์—์„œ ๊ฐ€์ค‘ํ‰๊ท ํ•ฉ(์ ๋ถ„)ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ’€์–ด์„œ ์–˜๊ธฐํ•˜๋ฉด ์ด๋ ‡์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ์‹œ๊ธฐ์˜ ์–ด๋–ค ์‚ฌํšŒ์˜ ์†Œ๋“ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค. ์†Œ๋“์— ๋”ฐ๋ผ ๊ตฌ์„ฑ์›์˜ Rank-Order๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ๋‹ค์‹œ 0์—์„œ 1๊นŒ์ง€, ๊ฐ ๊ตฌ์„ฑ์›์˜ ์ƒ๋Œ€์  Rank-Order๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฒ”์ฃผํ˜• ๋ถ„๋ฆฌ ์ง€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค๋ฉด, ์ด 0์—์„œ 1๊นŒ์ง€ ์ค‘ ์–ด๋–ค ๊ฐ’ \(p\)๋ฅผ ์„ ํƒํ•œ ํ›„ ๊ทธ์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด \(p\)์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜๋ฅผ ์˜ˆ์ปจ๋Œ€ \[p = g(p)\] ์™€ ๊ฐ™์ด ์ •์˜ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋•Œ ์ด ํ•จ์ˆ˜์‹์„ 0์—์„œ 1๊นŒ์ง€ ์ ๋ถ„ํ•˜๋˜, ๊ฐ€์ค‘์น˜ ์—ญํ• ์„ ํ•˜๋Š” ํ•ญ์„ ์‚ฝ์ž…ํ•ด์ฃผ๋ฉด ์ผ์ข…์˜ ๊ฐ€์ค‘ํ‰๊ท ๊ฐ’์„ ์–ป๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๊ทธ ๊ฐ’์€ ๋ชจ๋“  ์ƒ๋Œ€์  ๊ธฐ์ค€์ ์„ ๋ฐ˜์˜ํ•œ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋” ์ž์„ธํžˆ ์ˆ˜์‹์„ ์†Œ๊ฐœํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. Reardon์ด ์ œ์‹œํ•œ Rank-Order ๋ถ„๋ฆฌ์ง€์ˆ˜์˜ ๊ธฐ๋ณธํ˜•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

\[ \Lambda^R = \int_{0}^{1} \frac{f(p)}{\int_{0}^{1} f(q),dq} \Lambda(p) ,dp \]

์ด๋•Œ \(\Lambda(p)\)๋Š” ๊ฒฝ๊ณ„๊ฐ‘ \(p\)์—์„œ์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ์‚ฐ์ถœํ•˜๋Š” ํ•จ์ˆ˜๊ฐ€ ๋˜๊ณ , \(\frac{f(p)}{\int_{0}^{1} f(q),dq}\)๋Š” ๊ฐ ์ง€์ ์—์„œ ์‚ฐ์ถœ๋œ ๊ฐ’์„ ๊ฐ€์ค‘ํ‰๊ท ํ•ด์ฃผ๋Š” ๊ฐ€์ค‘์น˜ ์—ญํ• ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด \(f(p)\) ํ•จ์ˆ˜๋Š” \(p=0\) ๋˜๋Š” \(p=1\)์ผ ๋•Œ 0์˜ ๊ฐ’์„, \(p=\frac{1}{2}\)์ผ ๋•Œ 1์˜ ๊ฐ’์„ ๊ฐ–๋Š” ์˜ค๋ชฉํ•จ์ˆ˜์—ฌ์•ผ ํ•œ๋‹ค๊ณ  ์ œ์‹œ๋ฉ๋‹ˆ๋‹ค. (๋”ฐ๋ผ์„œ \(p=\frac{1}{2}\)์ผ ๋•Œ ๊ฐ€์žฅ ํฐ ๊ฐ€์ค‘์น˜๊ฐ€ ๋ถ€์—ฌ๋˜๊ณ , ์–‘ ๋์—์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๋ฏผ๊ฐ๋„๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.) ์ด๋ฅผ ๋งŒ์กฑํ•˜๋Š” ํ•จ์ˆ˜๋Š” ๋ช‡ ๊ฐ€์ง€๊ฐ€ ์žˆ์ง€๋งŒ, ์ผ๋ฐ˜์ ์œผ๋กœ ๋‹ค์Œ์˜ ์—”ํŠธ๋กœํ”ผ ์‚ฐ์‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

\[ E(p) = -(p\log_{2}^{p} + (1-p)\log_{2}^{(1-p)}) \]

์ด์ œ \(\Lambda(p)\)์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ ์ง€์ ์—์„œ์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜์‹์„ ์ •ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. Reardon(2011)์—์„œ๋Š” ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ์ˆ˜์‹์ด ์ œ์‹œ๋˜๋Š”๋ฐ, ๊ทธ์ค‘ ์ •๋ณด์ด๋ก (Information theory)์— ๊ธฐ๋ฐ˜ํ•œ Theil index์˜ ์‚ฌ์šฉ์ด ์ถ”์ฒœ๋ฉ๋‹ˆ๋‹ค. ๊ทธ ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

\[ H = \Sigma_{k=1}^{K} \frac{t_{k}}{T} \frac{E-E_{k}}{E} \]

์œ„ ์‹์—์„œ \(E\)๋Š” ์•ž์„œ ๋ณธ ์—”ํŠธ๋กœํ”ผ ์ˆ˜์‹์ธ \(E(p)\)์— ์˜ํ•ด ๊ตฌํ•ด์ง€๋Š” ์—”ํŠธ๋กœํ”ผ ๊ฐ’์ž…๋‹ˆ๋‹ค. \(E\)๋Š” ์ „์ฒด ๊ตฌ์„ฑ์›์„ ๋ง๋ผํ–ˆ์„ ๋•Œ์˜ ์—”ํŠธ๋กœํ”ผ ์ง€์ˆ˜(์—”ํŠธ๋กœํ”ผ๊ฐ€ ๋†’์„์ˆ˜๋ก ๋ถ„๋ฆฌ์ •๋„๊ฐ€ ๋‚ฎ์Šต๋‹ˆ๋‹ค)๋ฅผ, \(E_{k}\)๋Š” \(k\)๋ฒˆ์งธ ์ง‘๋‹จ์—์„œ์˜ ์—”ํŠธ๋กœํ”ผ ์ง€์ˆ˜์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ \(T\)๋Š” ์ „์ฒด ๊ตฌ์„ฑ์›์˜ ์ˆ˜, \(t_{k}\)๋Š” \(k\)๋ฒˆ์งธ ์ง‘๋‹จ์—์„œ์˜ ๊ตฌ์„ฑ์›์˜ ์ˆ˜๋กœ์„œ, \(\frac{t_{k}}{T}\)๋Š” ์ธ์› ์ˆ˜์— ๋”ฐ๋ฅธ ๊ฐ€์ค‘์น˜ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹์„ ๊ตฌํ•˜๋ฉด ์ „์ฒด ๋ถ„ํฌ(๊ตฌ์„ฑ๋น„)๋กœ๋ถ€ํ„ฐ ๊ฐ ์ง‘๋‹จ์˜ ๊ตฌ์„ฑ๋น„๊ฐ€ ํŽธ์ค‘๋œ ์ •๋„์˜ ํ‰๊ท ์„ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ˆ˜์‹์„ p~[0, 1] ๋ฒ”์œ„์—์„œ ๊ฐ€์ค‘ํ‰๊ท ํ•ฉํ•˜๋ฉด ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ์–ป๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์ด์ œ ์•ž์„  ์„ธ ์‹์„ ์ข…ํ•ฉํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. Theil Index์ธ \(H\)๋ฅผ ์ด์šฉํ•˜๋Š” Rank-Order ๋ถ„๋ฆฌ์ง€์ˆ˜ \(\Lambda^R\), ์ฆ‰ \(H^R\)๋ฅผ ๊ตฌํ•˜๋Š” ์ˆ˜์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •๋ฆฌ๋ฉ๋‹ˆ๋‹ค:

\[ H^R = \int_{0}^{1} \frac{E(p)}{\int_{0}^{1} E(q),dq} H(p) ,dp \\ = 2 \log_{2}^{\int_{0}^{1} E(p)H(p) ,dp} \]

๋„ค, ์ด์ œ ์ด ์ˆ˜์‹์„ ๊ณ„์‚ฐํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค! ๐Ÿ™ƒ

๋‹น์—ฐํžˆ ์ด ์‹์„ ๊ทธ๋Œ€๋กœ ๊ณ„์‚ฐํ•˜๊ธฐ๋Š” ์–ด๋ ต๊ณ  ๊ทผ์‚ฌ๋ฒ•์„ ์ด์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ๋„ Reardon์€ ์—ฌ๋Ÿฌ ๋…ธํ•˜์šฐ๋ฅผ ์ œ์‹œํ•˜๊ณ  ์žˆ์ง€๋งŒ ์—ฌ๊ธฐ์„œ ์ž์„ธํ•œ ๋‚ด์šฉ์€ ์ƒ๋žตํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

Python Library: segindex

Reardon์ด ์ œ์‹œํ•œ Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜๋Š” ๊ทธ ์ถ”๋ก ์ด ํ•ฉ๋ฆฌ์ ์ผ ๋ฟ ์•„๋‹ˆ๋ผ ์†Œ๋“์„ ๋น„๋กฏํ•œ ์—ฌ๋Ÿฌ ์—ฐ์†ํ˜•/์ˆœ์„œํ˜• ๋ณ€์ˆ˜์— ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ ํ•ด๋‹น ์ง€์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ํ†ต๊ณ„ ํŒจํ‚ค์ง€๊ฐ€ ๋งŽ์ง„ ์•Š์€ ๊ฒƒ์œผ๋กœ ๋ณด์ด๋Š”๋ฐ์š”, ์—ฌ๊ธฐ์„œ๋Š” ๊ฐ„๋‹จํ•œ Python library์ธ segindex๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

segindex ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์ด์šฉํ•ด ์œ„์—์„œ ์†Œ๊ฐœํ•œ Theil Index๋ฅผ ์‚ฌ์šฉํ•œ Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

! pip install segindex==0.1.4
from segindex import estimate_Hp

# ๊ฐ ๊ฐ’์ด ์†Œ๋“ ์ˆ˜์ค€์ด๋ผ๊ณ  ํ•  ๋•Œ,
# area1์€ ์ƒ๋Œ€์ ์œผ๋กœ ๋น„์Šทํ•œ ์†Œ๋“ ์ˆ˜์ค€๋ผ๋ฆฌ ๋ชจ์—ฌ์žˆ๊ณ , area2๋Š” ๋” ํ˜ผํ•ฉ๋˜์–ด ์žˆ์Œ
area1 = [[80, 80, 70, 70], [50, 45, 40],[20, 20, 20, 10]]
area2 = [[80, 70, 50], [80, 70, 45, 20, 20], [40, 20, 10]]

print(estimate_Hp(area1)) # 0.7182
print(estimate_Hp(area2)) # 0.3191

์œ„ ์ฝ”๋“œ๋Š” segindex์˜ estimate_Hp ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•œ ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค. ๋ˆˆ์œผ๋กœ ๋ณด๊ธฐ์—๋„ ์†Œ๋“์ˆ˜์ค€์— ๋”ฐ๋ฅธ ๋ถ„๋ฆฌ ์ •๋„๊ฐ€ ๋” ๋†’์€ area1์˜ ๋ถ„๋ฆฌ์ง€์ˆ˜๊ฐ€ ๋” ๋†’๊ฒŒ ์ธก์ •๋์Šต๋‹ˆ๋‹ค.

Example: Chetty et al.(2014)

Reardon์ด ์ œ์‹œํ•œ Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜๋Š” ์‚ฌํšŒ๊ณผํ•™๊ณ„ ์—ฌ๋Ÿฌ ๋ถ„์•ผ์˜ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ๋“ค์— ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์ธ ์‚ฌ๋ก€๊ฐ€ Chetty et al.(2014)์˜ ์œ ๋ช…ํ•œ ๋…ผ๋ฌธ, "Where is the Land of Opportunity?"์ž…๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๋ฏธ๊ตญ์˜ ๋Œ€๊ทœ๋ชจ ํ–‰์ • ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ์†Œ๋“ ์ˆ˜์ค€์— ๋”ฐ๋ฅธ ๋ถˆํ‰๋“ฑ๊ณผ ์ด๋™์„ฑ ์ธก์ • ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ–ˆ๋Š”๋ฐ์š”, ๊ทธ์ค‘ ์†Œ๋“ ์ˆœ์œ„์— ๋”ฐ๋ฅธ ์ง€์—ญ๋ณ„ ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ๊ตฌํ•  ๋•Œ Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์†Œ๋“ ๋ฐ์ดํ„ฐ๋ฅผ "์ˆœ์œ„"๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๋ถˆํ‰๋“ฑ๊ณผ ์ด๋™์„ฑ ๋“ฑ ๊ฐ์ข… ์ง€ํ‘œ๋ฅผ ๊ตฌํ•œ๋‹ค๋Š” ๊ฒƒ์€ ์ด ์—ฐ๊ตฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ํ•ต์‹ฌ ์•„์ด๋””์–ด (์ƒˆ๋กœ์šด ์•„์ด๋””์–ด๋Š” ์•„๋‹ˆ์ง€๋งŒ, ๊ณผ๊ฐํ•œ) ์˜€๋Š”๋ฐ์š”, Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜์•ผ๋ง๋กœ ์ด ์—ฐ๊ตฌ์— ๊ผญ ํ•„์š”ํ•œ ์ง€ํ‘œ์˜€๋˜ ์…ˆ์ด์ฃ .

์†Œ๋“์„ ์ˆœ์œ„๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๊ฐ์ข… ์ง€ํ‘œ๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฒƒ์— ๋Œ€ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๋…ผ์Ÿ์€ ์žˆ์ง€๋งŒ, Chetty et al.์˜ ์—ฐ๊ตฌ์™€ ๊ฐ™์ด ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ๊ทธ ์œ ์šฉ์„ฑ๊ณผ ํ˜„์‹ค์  ํ•„์š”์„ฑ์€ ๋ถ„๋ช…ํ•ด ๋ณด์ด๋Š”๋ฐ์š”, ๊ฐˆ์ˆ˜๋ก ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ ์—ฐ๊ตฌ๊ฐ€ ํ™œ๋ฐœํ•ด์ง„๋‹ค๋ฉด Rank Order ๋ถ„๋ฆฌ์ง€์ˆ˜๋ฅผ ์ด์šฉํ•œ ์—ฐ๊ตฌ๋„ ๋” ํ™œ๋ฐœํ•ด์ง€์ง€ ์•Š์„๊นŒ์š”? ๐Ÿ”ฌ