목차
설문조사를 진행하고 나면
이 단계에서 대부분 막힙니다.
“이 데이터… 이제 뭐부터 해야 하지?”
응답은 다 모았고
엑셀 파일도 받았습니다.
그런데
👉 어떻게 정리해야 할지 모르겠는 상태
👉 그냥 분석 돌려도 되는지 애매한 상태
이 상태에서 바로 분석 들어가면
👉 결과가 이상하게 나오는 경우가 많습니다
그래서 이번 글에서는
👉 설문 데이터 정리 순서를
👉 초보자 기준으로 단계별 정리해드립니다

📊 설문 데이터 정리 순서 (필수 5단계)
👉 이 순서 그대로 하면 됩니다
1️⃣ 원본 데이터 그대로 보관
❌
바로 수정
✔
원본 파일 따로 저장
👉 가장 먼저 해야 할 것
👉 원본 데이터 절대 건드리지 않기
✔ 원본 파일 따로 저장
✔ 복사본으로 작업
👉 이거 안 하면
👉 데이터 망가졌을 때 복구 불가
2️⃣ 불성실 응답 제거
❌
전체 데이터 그대로 사용
✔
품질 필터링
👉 이 단계가 핵심
✔ 제거 기준 예시
- 응답 시간 너무 짧음
- 모든 문항 동일 응답
- 논리적으로 말 안 되는 조합
👉 이걸 안 하면
👉 결과 자체가 왜곡됨
3️⃣ 결측값 처리
❌
빈 값 그대로 사용
✔
기준 잡고 처리
👉 결측값(빈칸) 처리 방법
✔ 삭제 (표본 충분할 때)
✔ 평균 대체
✔ 특정 기준으로 보완
👉 기준 없이 처리하면
👉 분석 결과 흔들림
4️⃣ 변수 정리 (코딩 작업)
❌
텍스트 그대로 사용
✔
숫자로 변환
👉 예시
남 = 1
여 = 2
👉 SPSS나 통계 분석은
👉 숫자 기준으로 돌아감
5️⃣ 분석용 데이터로 구조 정리
❌
원본 그대로 사용
✔
분석 목적에 맞게 정리
👉 필요 없는 문항 제거
👉 변수 정리
👉 데이터 구조 정리
👉 이 단계까지 해야
👉 분석 가능 상태 됨

📌 데이터 정리는 ‘전처리’가 아니라 ‘핵심 과정’입니다
많은 분들이
👉 데이터 정리를 단순 준비 단계로 생각합니다
하지만 실제로는
👉 분석 결과를 결정하는 핵심 과정입니다

📌 여기서 잘못하면 분석이 다 틀립니다
👉 불성실 응답 안 제거
👉 결측값 기준 없음
👉 변수 코딩 오류
👉 이 3개만 있어도
👉 결과 신뢰도 바로 떨어짐

📌 초보자가 가장 많이 하는 실수
- 원본 데이터 수정
- 기준 없이 삭제
- 변수 정리 안 하고 분석
- 엑셀 그대로 SPSS 돌림
👉 거의 이 4개에서 막힘
📌실제로 느꼈던 부분

저도 처음에는
👉 데이터 받자마자 분석 돌렸는데
결과가 이상하게 나온 적이 있습니다
이후에
데이터 정리 기준부터 다시 잡고 진행했는데
👉 결과가 훨씬 안정적으로 나오더라고요
(더브레인에서 데이터 정리 과정 같이 보면서 더 체감했습니다)
📓 정리

설문 데이터 정리는
👉 선택이 아니라 필수 과정입니다
특히
- 원본 보관
- 불성실 응답 제거
- 결측값 처리
- 변수 코딩
- 구조 정리
이 5단계는 반드시 필요합니다
이 과정을 제대로 하지 않으면
👉 분석이 아무리 좋아도 의미가 없습니다
그래서 데이터는
👉 “받고 끝”이 아니라
👉 “정리하고 시작”입니다
