K대학원생 논문 기록

불성실 응답, 왜 반드시 제거해야 할까

—

제공

목차

불성실 응답은

👉 단순한 노이즈가 아닙니다

변수 관계를 약하게 만들고
유의미한 결과를 사라지게 하고
결과 해석을 흐리게 만듭니다

👉 즉 데이터 전체를 흔드는 요소입니다

1️⃣ 응답 시간 기준

❌
시간 기준 없이 사용

✔
최소 응답 시간 설정

👉 너무 짧은 응답은

👉 제대로 읽지 않았을 가능성이 높습니다

✔ 예시

평균 응답 시간의 1/3 이하
1~2분 내 완료

👉 제거 후보

2️⃣ 동일 패턴 응답 (Straight-lining)

❌
모든 문항 동일값

✔
패턴 확인 후 제거

👉 예시

1-1-1-1-1-1
5-5-5-5-5

👉 이런 경우

👉 무성의 응답 가능성 매우 높음

3️⃣ 논리적 불일치 응답

❌
서로 맞지 않는 응답

✔
논리 검증

예시

“이용 경험 없음” → “이용 만족도 응답 있음”
나이 10대 → 직업 교수

👉 이런 경우

👉 데이터 신뢰도 낮음

4️⃣ 극단적 응답만 반복되는 경우

❌
극단값 반복

✔
패턴 확인

👉 모든 문항

👉 “매우 그렇다” 또는 “전혀 아니다”

👉 이 경우도

👉 의심 데이터로 분류

5️⃣ 주관식 무의미 응답

❌
“asdf”, “123”, “없음” 반복

✔
내용 기반 필터링

👉 의미 없는 텍스트

👉 성의 없는 응답

👉 제거 대상

📌 중요한 포인트 : ‘제거 기준’을 설명할 수 있어야 합니다

이게 진짜 핵심임

👉 그냥 삭제하면 안 됩니다

👉 반드시 기준 있어야 합니다

✔ 논문에 들어가는 문장 예시

“응답 시간, 동일 응답 패턴, 논리적 불일치 기준에 따라 불성실 응답을 제거하였다”

👉 이 한 줄이

👉 논문 신뢰도를 좌우합니다

📌 너무 많이 제거해도 문제입니다

❌
의심되면 전부 삭제

✔
일관된 기준 적용

👉 기준 없이 많이 제거하면

👉 표본 왜곡 발생

👉 항상

👉 “일관된 기준”이 중요

📌 불성실 응답 제거는 ‘선택’이 아니라 ‘필수’입니다

많은 분들이

👉 그냥 데이터 그대로 사용합니다

그 결과

👉 분석 결과가 흔들립니다

👉 해석이 어려워집니다

📌 실제로 느꼈던 부분

저도 처음에는

👉 불성실 응답을 크게 신경 안 썼는데

분석 결과가 이상하게 나온 적이 있습니다

이후에는

제거 기준 잡고 진행했더니

👉 결과가 훨씬 안정적으로 나오더라고요

(더브레인에서 데이터 필터링 기준 같이 보면서 더 체감했습니다)

📓 정리

불성실 응답 제거는

👉 데이터 정리에서 가장 중요한 단계입니다

특히

응답 시간
동일 패턴
논리 불일치
극단값
주관식 품질

이 기준을 적용하면

👉 데이터 신뢰도가 크게 올라갑니다

그래서 분석 전에

👉 반드시

👉 “어떤 기준으로 제거할 것인가”를 먼저 정하는 것이 중요합니다