20260113 12 불성실 응답, 왜 반드시 제거해야 할까

불성실 응답, 왜 반드시 제거해야 할까

불성실 응답은

👉 단순한 노이즈가 아닙니다

  • 변수 관계를 약하게 만들고
  • 유의미한 결과를 사라지게 하고
  • 결과 해석을 흐리게 만듭니다

👉 즉 데이터 전체를 흔드는 요소입니다


20260116tb22 불성실 응답, 왜 반드시 제거해야 할까

1️⃣ 응답 시간 기준


시간 기준 없이 사용


최소 응답 시간 설정

👉 너무 짧은 응답은

👉 제대로 읽지 않았을 가능성이 높습니다

✔ 예시

  • 평균 응답 시간의 1/3 이하
  • 1~2분 내 완료

👉 제거 후보


20260116tb26 불성실 응답, 왜 반드시 제거해야 할까

2️⃣ 동일 패턴 응답 (Straight-lining)


모든 문항 동일값


패턴 확인 후 제거

👉 예시

1-1-1-1-1-1
5-5-5-5-5

👉 이런 경우

👉 무성의 응답 가능성 매우 높음


20260116 tb21 불성실 응답, 왜 반드시 제거해야 할까

3️⃣ 논리적 불일치 응답


서로 맞지 않는 응답


논리 검증

예시

  • “이용 경험 없음” → “이용 만족도 응답 있음”
  • 나이 10대 → 직업 교수

👉 이런 경우

👉 데이터 신뢰도 낮음


20260116 tb12 불성실 응답, 왜 반드시 제거해야 할까

4️⃣ 극단적 응답만 반복되는 경우


극단값 반복


패턴 확인

👉 모든 문항

👉 “매우 그렇다” 또는 “전혀 아니다”

👉 이 경우도

👉 의심 데이터로 분류


20260116 tb11 불성실 응답, 왜 반드시 제거해야 할까

5️⃣ 주관식 무의미 응답


“asdf”, “123”, “없음” 반복


내용 기반 필터링

👉 의미 없는 텍스트

👉 성의 없는 응답

👉 제거 대상


20260116 tb10 불성실 응답, 왜 반드시 제거해야 할까

📌 중요한 포인트 : ‘제거 기준’을 설명할 수 있어야 합니다

이게 진짜 핵심임

👉 그냥 삭제하면 안 됩니다

👉 반드시 기준 있어야 합니다

✔ 논문에 들어가는 문장 예시

“응답 시간, 동일 응답 패턴, 논리적 불일치 기준에 따라 불성실 응답을 제거하였다”

👉 이 한 줄이

👉 논문 신뢰도를 좌우합니다


20260116 tb9 불성실 응답, 왜 반드시 제거해야 할까

📌 너무 많이 제거해도 문제입니다


의심되면 전부 삭제


일관된 기준 적용

👉 기준 없이 많이 제거하면

👉 표본 왜곡 발생

👉 항상

👉 “일관된 기준”이 중요


20260114 12 불성실 응답, 왜 반드시 제거해야 할까

📌 불성실 응답 제거는 ‘선택’이 아니라 ‘필수’입니다

많은 분들이

👉 그냥 데이터 그대로 사용합니다

그 결과

👉 분석 결과가 흔들립니다

👉 해석이 어려워집니다


📌 실제로 느꼈던 부분

더브레인 설문조사 배너 불성실 응답, 왜 반드시 제거해야 할까

저도 처음에는

👉 불성실 응답을 크게 신경 안 썼는데

분석 결과가 이상하게 나온 적이 있습니다

이후에는

제거 기준 잡고 진행했더니

👉 결과가 훨씬 안정적으로 나오더라고요

(더브레인에서 데이터 필터링 기준 같이 보면서 더 체감했습니다)


20260113 13 불성실 응답, 왜 반드시 제거해야 할까

📓 정리

불성실 응답 제거는

👉 데이터 정리에서 가장 중요한 단계입니다

특히

  • 응답 시간
  • 동일 패턴
  • 논리 불일치
  • 극단값
  • 주관식 품질

이 기준을 적용하면

👉 데이터 신뢰도가 크게 올라갑니다

그래서 분석 전에

👉 반드시

👉 “어떤 기준으로 제거할 것인가”를 먼저 정하는 것이 중요합니다