
이주희
운영이사CX/UX 디자인 8년, 스타트업 UX 리드 경험
Human-in-the-loop이 AX 품질을 높이는 이유

이주희
운영이사CX/UX 디자인 8년, 스타트업 UX 리드 경험

AI 자동화를 이야기할 때 사람 검수 단계는 종종 비효율처럼 보입니다. “어차피 사람이 봐야 한다면 자동화가 맞나?”라는 질문도 나옵니다. 하지만 실제 운영에서는 Human-in-the-loop이 품질을 낮추는 장치가 아니라 품질을 높이고 리스크를 줄이는 장치입니다.
좋은 AX는 사람을 완전히 빼는 것에서 시작하지 않습니다. AI가 반복과 초안을 맡고, 사람은 판단과 책임이 필요한 부분을 맡는 구조에서 시작합니다. 특히 고객 응대, 계약, 정산, 인사, 개인정보처럼 실수 비용이 큰 업무에서는 사람 검수 없이 자동화율만 높이는 것이 오히려 위험합니다.
사람 검수는 병목이 아니라 품질 데이터다
사람이 AI 결과를 수정하는 순간은 비용이 아니라 학습 데이터가 생기는 순간입니다. 운영자가 어떤 표현을 바꿨는지, 어떤 케이스를 반려했는지, 어떤 정보가 부족하다고 표시했는지가 다음 개선의 재료가 됩니다.
검수 데이터를 남기지 않으면 매번 같은 실수를 반복합니다. 반대로 수정과 반려 사유를 구조화하면 프롬프트, 데이터 연결, UI, 정책을 계속 개선할 수 있습니다.
검수 단계에서 남겨야 할 데이터는 다음과 같습니다.
- AI가 만든 원본 결과
- 사람이 수정한 최종 결과
- 수정한 항목
- 반려 사유
- 부족했던 데이터
- 최종 승인자
- 처리 시간
이 데이터가 쌓이면 “AI가 잘하는 업무”와 “사람 판단이 필요한 업무”를 분리할 수 있습니다.
모든 업무에 같은 검수 강도를 적용하면 안 된다
Human-in-the-loop 설계의 핵심은 검수 강도를 나누는 것입니다. 모든 결과를 사람이 꼼꼼히 보면 자동화 효과가 줄어듭니다. 반대로 모든 결과를 자동 실행하면 리스크가 커집니다. 업무별 위험도에 따라 검수 방식을 다르게 설계해야 합니다.
| 위험도 | 예시 | 권장 방식 |
|---|---|---|
| 낮음 | 내부 요약, 태그 추천 | 샘플링 검수 |
| 중간 | 고객 답변 초안, 리포트 초안 | 전수 검수 후 발송 |
| 높음 | 계약 조건, 정산, 보상 | 다단계 승인 |
| 매우 높음 | 법무, 인사, 민감 개인정보 | AI는 보조만 수행 |
이렇게 나누면 자동화율과 안정성을 함께 가져갈 수 있습니다.
검수 UI가 나쁘면 자동화가 실패한다
사람 검수가 필요한 구조에서도 UX가 나쁘면 현업은 AI를 쓰지 않습니다. 운영자가 원문, AI 결과, 근거 데이터, 수정 버튼을 한 화면에서 볼 수 있어야 합니다. 검수하기 위해 여러 탭을 오가야 한다면 AI가 만든 시간 절감이 사라집니다.
좋은 검수 화면은 다음을 갖습니다.
- AI 결과와 원문 비교
- 참고한 데이터 표시
- 빠른 승인, 수정, 반려 버튼
- 반려 사유 선택
- 자주 쓰는 수정 패턴 저장
- 예외 케이스 담당자 이관
검수 화면은 단순한 관리자 페이지가 아닙니다. AI 품질을 운영하는 콘솔입니다. 이 화면이 좋아야 사람과 AI가 함께 일할 수 있습니다.
검수 기준은 문장으로 남겨야 한다
사람이 검수한다고 해서 품질이 자동으로 좋아지지는 않습니다. 검수자마다 기준이 다르면 결과가 흔들립니다. 따라서 업무별 검수 기준을 문서화해야 합니다.
예를 들어 고객 답변 초안 검수 기준은 다음처럼 만들 수 있습니다.
- 고객의 질문에 직접 답했는가
- 내부 용어나 기술 용어가 과하지 않은가
- 확정되지 않은 약속을 하지 않았는가
- 가격, 일정, 계약 조건을 임의로 말하지 않았는가
- 다음 행동이 명확한가
이 기준은 사람 교육에도 쓰이고, 프롬프트 개선에도 쓰입니다. 결국 Human-in-the-loop은 사람을 남겨두는 것이 아니라, 사람의 판단 기준을 시스템으로 옮기는 과정입니다.
자동화율은 단계적으로 올린다
처음부터 자동화율을 높이려고 하면 품질 문제가 커집니다. 먼저 전수 검수로 시작해 오류 패턴을 모으고, 안정된 케이스부터 샘플링 검수로 낮추는 방식이 안전합니다.
단계는 다음과 같습니다.
- AI가 초안을 만들고 사람이 전수 검수합니다.
- 수정률과 반려율을 측정합니다.
- 안정적인 케이스를 분리합니다.
- 낮은 위험도 케이스는 샘플링 검수로 전환합니다.
- 높은 위험도 케이스는 계속 사람 승인으로 유지합니다.
이 방식은 자동화율을 무작정 올리는 것이 아니라 신뢰가 쌓인 영역부터 넓히는 방식입니다.
결론
Human-in-the-loop은 AX의 속도를 늦추는 장치가 아닙니다. 품질을 관리하고, 리스크를 줄이고, AI를 계속 개선하기 위한 운영 구조입니다. 사람 검수는 단순한 승인 단계가 아니라 조직의 판단 기준을 데이터로 만드는 과정입니다.
AI가 모든 것을 대신해야 좋은 자동화가 아닙니다. AI가 잘하는 반복을 맡고, 사람이 중요한 판단을 맡고, 그 판단이 다시 시스템을 개선할 때 AX는 오래갑니다.
WRITTEN BY

이주희
운영이사CX/UX 디자인 8년, 스타트업 UX 리드 경험



