부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

image 4 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

통계 분석을 하다 보면 한 번쯤 이런 고민을 하게 됩니다.

  • 데이터가 정규분포를 안 따르면 어떡하지?
  • “표본 수가 너무 적은데, 이 결과를 믿어도 될까?”

이럴 때 자주 등장하는 해결책이 바로 부트스트래핑(Bootstrapping)입니다.
그런데 막상 SPSS 결과를 보면,

신뢰구간, 간접효과, Percentile, BCa…
어디를 보고 어떻게 해석해야 하는지 더 헷갈리는 경우가 많죠 😭

이번 글에서는
✔ 부트스트래핑이 왜 필요한지
✔ SPSS에서 어떻게 실행되는지
✔ 결과표를 어떻게 해석해야 하는지

딱 논문에 필요한 수준으로 정리해 드릴게요 😆


image 1 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

1️⃣ 부트스트래핑(Bootstrapping)이란?

부트스트래핑은 하나의 표본 데이터를 가지고,
그 안에서 수천 번 가상의 표본을 다시 만들어
통계량의 분포와 신뢰구간을 추정하는 방법입니다.

🔍 쉽게 이해하면

  • 내가 가진 데이터가 100명이라면
  • 그 100명 중에서 복원추출로 다시 100명을 뽑아
  • ‘가짜 표본 1개’를 만듭니다
  • 이 과정을 1,000~5,000번 반복합니다

이렇게 만들어진 수천 개의 결과를 통해
👉 “이 결과가 얼마나 안정적인가?”를 확인하는 것이 목적이에요.

✔ 부트스트래핑의 핵심 장점

  • 정규분포 가정 ❌ 거의 필요 없음
  • 표본 수가 작아도 비교적 안정적
  • 특히 매개효과 분석에서 필수적

2️⃣ 왜 부트스트래핑이 필요한가?

전통적인 통계기법은 대부분 이런 가정을 전제로 합니다.

  • 표본 수가 충분히 크다
  • 데이터가 정규분포를 따른다

하지만 실제 연구에서는?

  • 💥 표본 수가 작거나
  • 💥 분포가 한쪽으로 치우쳐 있거나
  • 💥 매개효과처럼 분포가 본질적으로 비정규적인 경우가 많습니다

👉 이런 상황에서 기존 p값 중심 검정은 과도하게 불안정해질 수 있어요.

그래서 등장하는 대안이 바로 부트스트래핑입니다.


3️⃣ SPSS에서 부트스트래핑 실행 방법

📍 방법 1. SPSS 기본 기능 사용

  1. [분석] → 회귀분석 / t-test / ANOVA 등 원하는 분석 선택
  2. 분석 창에서 [Bootstrap] 버튼 클릭
  3. 옵션 설정
    • ✔ Bootstrap 체크
    • ✔ 재표집 횟수: 5,000회 (권장)
    • ✔ 신뢰수준: 95%
  4. [확인]

👉 기존 결과표 + Bootstrap 결과표가 함께 출력됩니다.


📍 방법 2. PROCESS Macro 사용

매개·조절 분석에서 PROCESS Macro를 사용한다면
👉 부트스트래핑은 자동으로 적용됩니다.

  • 기본 재표집 횟수: 5,000회
  • 이 경우 p값은 보지 않습니다
  • 신뢰구간(CI)만 해석합니다

image 2 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

4️⃣ 부트스트래핑 결과, 어디를 봐야 할까?

🔑 핵심 질문은 딱 하나입니다

신뢰구간(CI)에 0이 포함되는가?

✔ 해석 기준

  • 95% 신뢰구간에 0이 포함되지 않으면 → 유의
  • 95% 신뢰구간에 0이 포함되면 → 유의하지 않음

예시

  • CI = [0.1265, 0.4589] → 0 없음 → ⭕ 유의
  • CI = [-0.0343, 0.2813] → 0 포함 → ❌ 유의하지 않음

📌 PROCESS 결과에서는

  • LLCI / ULCI로 표시
  • 두 값의 부호가 같아야 유의

📌 매개효과 해석 시 특히 중요!

매개효과(indirect effect)는
직접효과가 유의한지와 무관하게,
👉 부트스트래핑 신뢰구간으로만 판단합니다.

논문에서는 이렇게 쓰면 안전합니다.

“Bootstrap 신뢰구간 분석 결과, 간접효과의 95% 신뢰구간에 0이 포함되지 않아 매개효과가 통계적으로 유의한 것으로 나타났다.”


5️⃣ 논문에서 가장 많이 하는 해석 실수 ⚠️

❌ p값으로 유의성 판단
❌ 평균값 크기만 보고 해석
❌ CI 설명 없이 “유의하다” 단정

👉 부트스트래핑에서는 p값이 아니라 CI가 기준입니다.


image 3 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

✨ 핵심 정리

  • 부트스트래핑은 결과의 안정성을 확인하는 방법
  • 해석의 기준은 p값 ❌ / 신뢰구간(CI) ⭕
  • CI에 0이 포함되는지만 보면 해석은 끝

부트스트래핑은 어려운 기법이 아닙니다.
“이 결과를 믿어도 되는지 한 번 더 확인하는 절차”에 가깝습니다.

신뢰구간에 0이 들어있는지, 없는지만 정확히 읽을 수 있다면
논문 해석에서 충분히 안전하게 활용할 수 있어요 😊