목차
설문조사를 끝내고 나면
이제 분석만 하면 될 것 같지만
실제로 많이 막히는 구간은
데이터 정리 단계입니다
특히 엑셀에서 데이터를 정리하다가
SPSS 오류가 나거나
분석이 꼬이거나
결과가 이상하게 나오는 경우가 정말 많습니다 😅
그래서 이번에는
논문 데이터 정리 과정에서
가장 많이 틀리는 부분들을 정리해보려고 합니다

📊 데이터정리, 왜 중요할까
많은 분들이 분석만 중요하다고 생각합니다
하지만 실제로는 데이터 정리 단계에서
결과 방향이 거의 결정됩니다
데이터 구조가 틀어지면
분석도 같이 흔들리게 됩니다

1️⃣ 변수명 정리를 안 하는 경우
가장 흔한 실수입니다
엑셀에서
Q1 / Q2 / 문항1 / 응답값
이런 식으로 그대로 두는 경우가 많습니다
하지만 SPSS에서는
변수명이 정리되어 있어야
분석 흐름이 훨씬 안정적입니다
예를 들어
gender / satisfaction / purchase_intent
이런 식으로 맞춰두는 게 좋습니다

2️⃣ 텍스트 응답을 그대로 사용하는 경우
이것도 정말 자주 나옵니다
예를 들어
“남자 / 여자”
“예 / 아니오”
이렇게 문자 형태 그대로 두는 경우입니다
분석에서는 보통
숫자 코딩 형태로 변환해서 사용합니다
✔ 남자=1 / 여자=2
✔ 예=1 / 아니오=0
이런 구조입니다

3️⃣ 결측값 처리 안 하는 경우
응답 누락이 있는 상태 그대로 분석하면
결과가 왜곡될 수 있습니다
특히
빈칸
중복값
의미 없는 값
이런 부분은 미리 확인해야 합니다

4️⃣ 역문항 정리 누락
논문 설문에서 정말 많이 나오는 실수입니다 😅
예를 들어
1점이 긍정 / 5점이 부정인 문항이 섞여 있으면
역코딩 처리가 필요합니다
이걸 놓치면
신뢰도(Cronbach’s α) 결과가 이상하게 나오는 경우도 많습니다

5️⃣ 응답자 기준 정리를 안 하는 경우
불성실 응답이나
조건 미충족 응답까지 그대로 포함하는 경우입니다
예를 들어
- 응답 시간 비정상적으로 짧음
- 동일값 반복 클릭
- 조사 대상 조건 불일치
이런 데이터는 정리 기준이 필요합니다

📌 엑셀 정리는 ‘단순 작업’이 아닙니다
많이 놓치는 부분인데
데이터정리는 분석 준비 단계입니다
여기서 구조가 틀어지면 뒤 분석까지 영향을 줍니다

📌 실제로 많이 발생하는 상황
SPSS 오류가 나는 경우도
분석 문제보다
엑셀 데이터 구조 문제인 경우가 훨씬 많습니다
그래서 분석 전에
데이터 구조를 먼저 확인하는 과정이 중요합니다

📌 자연스럽게 이어지는 부분
논문에서 데이터 분석이 막히는 이유는
통계 자체보다 데이터 정리 단계에서 발생하는 경우도 많습니다
그래서 최근에는
설문 수집 이후
데이터 정리와 분석 구조까지 같이 보는 방식으로
진행하는 경우도 많아지고 있습니다
이런 흐름이 실제로 오류를 줄이는 데 도움이 됩니다

📓 정리
데이터정리 단계에서 가장 많이 틀리는 부분은
- 변수명 정리
- 텍스트 코딩
- 결측값 처리
- 역문항 정리
- 응답자 기준 설정입니다
특히 논문에서는
데이터 정리가 곧 분석 준비 단계이기 때문에
생각보다 훨씬 중요합니다 😊
