통계 분석을 하다 보면 한 번쯤 이런 고민을 하게 됩니다.
- 데이터가 정규분포를 안 따르면 어떡하지?
- “표본 수가 너무 적은데, 이 결과를 믿어도 될까?”
이럴 때 자주 등장하는 해결책이 바로 부트스트래핑(Bootstrapping)입니다.
그런데 막상 SPSS 결과를 보면,
신뢰구간, 간접효과, Percentile, BCa…
어디를 보고 어떻게 해석해야 하는지 더 헷갈리는 경우가 많죠 😭
이번 글에서는
✔ 부트스트래핑이 왜 필요한지
✔ SPSS에서 어떻게 실행되는지
✔ 결과표를 어떻게 해석해야 하는지
딱 논문에 필요한 수준으로 정리해 드릴게요 😆

1️⃣ 부트스트래핑(Bootstrapping)이란?
부트스트래핑은 하나의 표본 데이터를 가지고,
그 안에서 수천 번 가상의 표본을 다시 만들어
통계량의 분포와 신뢰구간을 추정하는 방법입니다.
🔍 쉽게 이해하면
- 내가 가진 데이터가 100명이라면
- 그 100명 중에서 복원추출로 다시 100명을 뽑아
- ‘가짜 표본 1개’를 만듭니다
- 이 과정을 1,000~5,000번 반복합니다
이렇게 만들어진 수천 개의 결과를 통해
👉 “이 결과가 얼마나 안정적인가?”를 확인하는 것이 목적이에요.
✔ 부트스트래핑의 핵심 장점
- 정규분포 가정 ❌ 거의 필요 없음
- 표본 수가 작아도 비교적 안정적
- 특히 매개효과 분석에서 필수적
2️⃣ 왜 부트스트래핑이 필요한가?
전통적인 통계기법은 대부분 이런 가정을 전제로 합니다.
- 표본 수가 충분히 크다
- 데이터가 정규분포를 따른다
하지만 실제 연구에서는?
- 💥 표본 수가 작거나
- 💥 분포가 한쪽으로 치우쳐 있거나
- 💥 매개효과처럼 분포가 본질적으로 비정규적인 경우가 많습니다
👉 이런 상황에서 기존 p값 중심 검정은 과도하게 불안정해질 수 있어요.
그래서 등장하는 대안이 바로 부트스트래핑입니다.
3️⃣ SPSS에서 부트스트래핑 실행 방법
📍 방법 1. SPSS 기본 기능 사용
- [분석] → 회귀분석 / t-test / ANOVA 등 원하는 분석 선택
- 분석 창에서 [Bootstrap] 버튼 클릭
- 옵션 설정
- ✔ Bootstrap 체크
- ✔ 재표집 횟수: 5,000회 (권장)
- ✔ 신뢰수준: 95%
- [확인]
👉 기존 결과표 + Bootstrap 결과표가 함께 출력됩니다.
📍 방법 2. PROCESS Macro 사용
매개·조절 분석에서 PROCESS Macro를 사용한다면
👉 부트스트래핑은 자동으로 적용됩니다.
- 기본 재표집 횟수: 5,000회
- 이 경우 p값은 보지 않습니다
- 신뢰구간(CI)만 해석합니다

4️⃣ 부트스트래핑 결과, 어디를 봐야 할까?
🔑 핵심 질문은 딱 하나입니다
신뢰구간(CI)에 0이 포함되는가?
✔ 해석 기준
- 95% 신뢰구간에 0이 포함되지 않으면 → 유의
- 95% 신뢰구간에 0이 포함되면 → 유의하지 않음
예시
- CI = [0.1265, 0.4589] → 0 없음 → ⭕ 유의
- CI = [-0.0343, 0.2813] → 0 포함 → ❌ 유의하지 않음
📌 PROCESS 결과에서는
- LLCI / ULCI로 표시
- 두 값의 부호가 같아야 유의
📌 매개효과 해석 시 특히 중요!
매개효과(indirect effect)는
직접효과가 유의한지와 무관하게,
👉 부트스트래핑 신뢰구간으로만 판단합니다.
논문에서는 이렇게 쓰면 안전합니다.
“Bootstrap 신뢰구간 분석 결과, 간접효과의 95% 신뢰구간에 0이 포함되지 않아 매개효과가 통계적으로 유의한 것으로 나타났다.”
5️⃣ 논문에서 가장 많이 하는 해석 실수 ⚠️
❌ p값으로 유의성 판단
❌ 평균값 크기만 보고 해석
❌ CI 설명 없이 “유의하다” 단정
👉 부트스트래핑에서는 p값이 아니라 CI가 기준입니다.

✨ 핵심 정리
- 부트스트래핑은 결과의 안정성을 확인하는 방법
- 해석의 기준은 p값 ❌ / 신뢰구간(CI) ⭕
- CI에 0이 포함되는지만 보면 해석은 끝
부트스트래핑은 어려운 기법이 아닙니다.
“이 결과를 믿어도 되는지 한 번 더 확인하는 절차”에 가깝습니다.
신뢰구간에 0이 들어있는지, 없는지만 정확히 읽을 수 있다면
논문 해석에서 충분히 안전하게 활용할 수 있어요 😊





