목차
불성실 응답은
👉 단순한 노이즈가 아닙니다
- 변수 관계를 약하게 만들고
- 유의미한 결과를 사라지게 하고
- 결과 해석을 흐리게 만듭니다
👉 즉 데이터 전체를 흔드는 요소입니다

1️⃣ 응답 시간 기준
❌
시간 기준 없이 사용
✔
최소 응답 시간 설정
👉 너무 짧은 응답은
👉 제대로 읽지 않았을 가능성이 높습니다
✔ 예시
- 평균 응답 시간의 1/3 이하
- 1~2분 내 완료
👉 제거 후보

2️⃣ 동일 패턴 응답 (Straight-lining)
❌
모든 문항 동일값
✔
패턴 확인 후 제거
👉 예시
1-1-1-1-1-1
5-5-5-5-5
👉 이런 경우
👉 무성의 응답 가능성 매우 높음

3️⃣ 논리적 불일치 응답
❌
서로 맞지 않는 응답
✔
논리 검증
예시
- “이용 경험 없음” → “이용 만족도 응답 있음”
- 나이 10대 → 직업 교수
👉 이런 경우
👉 데이터 신뢰도 낮음

4️⃣ 극단적 응답만 반복되는 경우
❌
극단값 반복
✔
패턴 확인
👉 모든 문항
👉 “매우 그렇다” 또는 “전혀 아니다”
👉 이 경우도
👉 의심 데이터로 분류

5️⃣ 주관식 무의미 응답
❌
“asdf”, “123”, “없음” 반복
✔
내용 기반 필터링
👉 의미 없는 텍스트
👉 성의 없는 응답
👉 제거 대상

📌 중요한 포인트 : ‘제거 기준’을 설명할 수 있어야 합니다
이게 진짜 핵심임
👉 그냥 삭제하면 안 됩니다
👉 반드시 기준 있어야 합니다
✔ 논문에 들어가는 문장 예시
“응답 시간, 동일 응답 패턴, 논리적 불일치 기준에 따라 불성실 응답을 제거하였다”
👉 이 한 줄이
👉 논문 신뢰도를 좌우합니다

📌 너무 많이 제거해도 문제입니다
❌
의심되면 전부 삭제
✔
일관된 기준 적용
👉 기준 없이 많이 제거하면
👉 표본 왜곡 발생
👉 항상
👉 “일관된 기준”이 중요

📌 불성실 응답 제거는 ‘선택’이 아니라 ‘필수’입니다
많은 분들이
👉 그냥 데이터 그대로 사용합니다
그 결과
👉 분석 결과가 흔들립니다
👉 해석이 어려워집니다
📌 실제로 느꼈던 부분

저도 처음에는
👉 불성실 응답을 크게 신경 안 썼는데
분석 결과가 이상하게 나온 적이 있습니다
이후에는
제거 기준 잡고 진행했더니
👉 결과가 훨씬 안정적으로 나오더라고요
(더브레인에서 데이터 필터링 기준 같이 보면서 더 체감했습니다)

📓 정리
불성실 응답 제거는
👉 데이터 정리에서 가장 중요한 단계입니다
특히
- 응답 시간
- 동일 패턴
- 논리 불일치
- 극단값
- 주관식 품질
이 기준을 적용하면
👉 데이터 신뢰도가 크게 올라갑니다
그래서 분석 전에
👉 반드시
👉 “어떤 기준으로 제거할 것인가”를 먼저 정하는 것이 중요합니다
