부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

통계 분석을 하다 보면 한 번쯤 이런 고민을 하게 됩니다.

데이터가 정규분포를 안 따르면 어떡하지?
“표본 수가 너무 적은데, 이 결과를 믿어도 될까?”

이럴 때 자주 등장하는 해결책이 바로 부트스트래핑(Bootstrapping)입니다.
그런데 막상 SPSS 결과를 보면,

신뢰구간, 간접효과, Percentile, BCa…
어디를 보고 어떻게 해석해야 하는지 더 헷갈리는 경우가 많죠 😭

이번 글에서는
✔ 부트스트래핑이 왜 필요한지
✔ SPSS에서 어떻게 실행되는지
✔ 결과표를 어떻게 해석해야 하는지

딱 논문에 필요한 수준으로 정리해 드릴게요 😆

image 1 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

1️⃣ 부트스트래핑(Bootstrapping)이란?

부트스트래핑은 하나의 표본 데이터를 가지고,
그 안에서 수천 번 가상의 표본을 다시 만들어
통계량의 분포와 신뢰구간을 추정하는 방법입니다.

🔍 쉽게 이해하면

내가 가진 데이터가 100명이라면
그 100명 중에서 복원추출로 다시 100명을 뽑아
‘가짜 표본 1개’를 만듭니다
이 과정을 1,000~5,000번 반복합니다

이렇게 만들어진 수천 개의 결과를 통해
👉 “이 결과가 얼마나 안정적인가?”를 확인하는 것이 목적이에요.

✔ 부트스트래핑의 핵심 장점

정규분포 가정 ❌ 거의 필요 없음
표본 수가 작아도 비교적 안정적
특히 매개효과 분석에서 필수적

2️⃣ 왜 부트스트래핑이 필요한가?

전통적인 통계기법은 대부분 이런 가정을 전제로 합니다.

표본 수가 충분히 크다
데이터가 정규분포를 따른다

하지만 실제 연구에서는?

💥 표본 수가 작거나
💥 분포가 한쪽으로 치우쳐 있거나
💥 매개효과처럼 분포가 본질적으로 비정규적인 경우가 많습니다

👉 이런 상황에서 기존 p값 중심 검정은 과도하게 불안정해질 수 있어요.

그래서 등장하는 대안이 바로 부트스트래핑입니다.

3️⃣ SPSS에서 부트스트래핑 실행 방법

📍 방법 1. SPSS 기본 기능 사용

[분석] → 회귀분석 / t-test / ANOVA 등 원하는 분석 선택
분석 창에서 [Bootstrap] 버튼 클릭
옵션 설정
- ✔ Bootstrap 체크
- ✔ 재표집 횟수: 5,000회 (권장)
- ✔ 신뢰수준: 95%
[확인]

👉 기존 결과표 + Bootstrap 결과표가 함께 출력됩니다.

📍 방법 2. PROCESS Macro 사용

매개·조절 분석에서 PROCESS Macro를 사용한다면
👉 부트스트래핑은 자동으로 적용됩니다.

기본 재표집 횟수: 5,000회
이 경우 p값은 보지 않습니다
신뢰구간(CI)만 해석합니다

image 2 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

4️⃣ 부트스트래핑 결과, 어디를 봐야 할까?

🔑 핵심 질문은 딱 하나입니다

신뢰구간(CI)에 0이 포함되는가?

✔ 해석 기준

95% 신뢰구간에 0이 포함되지 않으면 → 유의
95% 신뢰구간에 0이 포함되면 → 유의하지 않음

예시

CI = [0.1265, 0.4589] → 0 없음 → ⭕ 유의
CI = [-0.0343, 0.2813] → 0 포함 → ❌ 유의하지 않음

📌 PROCESS 결과에서는

LLCI / ULCI로 표시
두 값의 부호가 같아야 유의

📌 매개효과 해석 시 특히 중요!

매개효과(indirect effect)는
직접효과가 유의한지와 무관하게,
👉 부트스트래핑 신뢰구간으로만 판단합니다.

논문에서는 이렇게 쓰면 안전합니다.

“Bootstrap 신뢰구간 분석 결과, 간접효과의 95% 신뢰구간에 0이 포함되지 않아 매개효과가 통계적으로 유의한 것으로 나타났다.”

5️⃣ 논문에서 가장 많이 하는 해석 실수 ⚠️

❌ p값으로 유의성 판단
❌ 평균값 크기만 보고 해석
❌ CI 설명 없이 “유의하다” 단정

👉 부트스트래핑에서는 p값이 아니라 CI가 기준입니다.

image 3 부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

✨ 핵심 정리

부트스트래핑은 결과의 안정성을 확인하는 방법
해석의 기준은 p값 ❌ / 신뢰구간(CI) ⭕
CI에 0이 포함되는지만 보면 해석은 끝

부트스트래핑은 어려운 기법이 아닙니다.
“이 결과를 믿어도 되는지 한 번 더 확인하는 절차”에 가깝습니다.

신뢰구간에 0이 들어있는지, 없는지만 정확히 읽을 수 있다면
논문 해석에서 충분히 안전하게 활용할 수 있어요 😊

SPSS 리커트(5·7점) 설문, 신뢰도(Cronbach’s α) 제대로 보는 법

SPSS 결측값과 이상치처리, 이렇게 해야 분석이 살아납니다

SPSS Statistics 분석이 안 되는 이유 90%는 이것 때문입니다

SPSS Statistics 분석 전에 반드시 해야 하는 ‘데이터 코딩’ 방법

데이터 클리닝(Data Cleaning):

부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?

부트스트래핑(Bootstrapping), 왜 쓰고 어떻게 해석해야 할까?