STT API를 활용한 인터뷰 즉시 분석 기능 기획과 구현

이 글은 분석 LLM을 테스트하는 과정에서 제품의 구조적 문제를 발견하고, STT 기반 즉시 분석 기능을 기획·구현한 경험을 정리한 글입니다.

배경

피드인 프로젝트의 핵심 가치는 인터뷰 데이터를 분석하고 액션 아이템을 도출하는 것입니다. 기존 플로우는 챗봇을 통해 사용자 데이터를 수집한 뒤 이를 분석 파이프라인에 넘기는 구조였습니다.

[챗봇 인터뷰] → [텍스트 데이터 수집] → [분석 파이프라인] → [액션 아이템 도출]

분석 LLM API를 추가하는 과정에서 파이프라인에 넣을 테스트 데이터가 필요했습니다. 그런데 챗봇을 통해 수집한 데이터가 아직 없었습니다. 이때 이전에 진행했던 유저 인터뷰의 녹음 파일이 떠올랐고 이를 텍스트로 변환해 input으로 사용하면 되겠다고 생각했습니다.

그리고 이 아이디어를 테스트 용도에서 한 단계 더 확장하면 고객 온보딩의 구조적 문제를 해결할 수 있다는 것을 깨달았습니다.

문제: 서비스 효용을 체감하기까지의 긴 여정

신규 고객사 입장에서 기존 플로우에는 구조적인 문제가 있었습니다.

챗봇을 통한 데이터 수집이 완료되어야만 분석 결과를 확인할 수 있기 때문에 서비스의 핵심 가치를 체감하기까지 오랜 시간이 걸릴 것이 예상되었습니다. 고객사가 "이 서비스가 우리에게 진짜 도움이 되는가?"를 판단하려면 수일에서 수주간의 데이터 수집 과정을 먼저 거쳐야 했습니다.

[신규 고객 온보딩]

[챗봇 배포 및 데이터 수집 시작]  ← 수일~수주 소요

[충분한 데이터 축적]

[분석 결과 확인]  ← 이 시점에서야 서비스 가치 체감

즉, 서비스의 가치를 증명하기 위해 고객에게 먼저 시간 투자를 요구하는 구조였습니다.

해결: 기존 녹음 파일을 활용한 즉시 분석

핵심 아이디어는 간단합니다. 고객사가 이미 보유한 인터뷰 녹음 파일을 텍스트로 변환하여 기존 분석 파이프라인에 바로 연결하면 됩니다.

[기존 녹음 파일 업로드] → [STT 변환] → [분석 파이프라인] → [액션 아이템 도출]

데이터 수집 과정을 건너뛰고 고객이 이미 가진 자산을 활용해 서비스 가치를 즉시 보여줄 수 있는 구조입니다.

구현

기존 화면에는 챗봇과의 대화 기록이 자동으로 쌓이고 수동으로도 데이터를 추가할 수 있는 구조가 있었습니다. 이 수동 추가 기능에 녹음 파일 업로드를 연결했습니다.

사용자가 녹음 파일을 업로드하면 Whisper API를 통해 텍스트로 변환하고 변환된 텍스트를 기존 채팅 데이터 구조에 맞춰 삽입합니다. 이후는 기존 분석 파이프라인이 그대로 처리합니다. 기존 데이터 구조와 분석 파이프라인을 재활용했기 때문에 새로 만들어야 할 부분은 파일 업로드 UI와 STT API 연동뿐이었고 하루 이내에 구현과 배포를 마칠 수 있었습니다.

기대 효과

기존 플로우와 비교하면 고객 온보딩 경험이 구조적으로 달라집니다.

[기존] 온보딩 → 챗봇 배포 → 수일~수주 데이터 수집 → 분석 결과 확인
[개선] 온보딩 → 녹음 파일 업로드 → 즉시 분석 결과 확인
  • 즉각적인 가치 체감: 신규 고객이 데이터 수집 과정 없이도 서비스의 핵심 분석 기능을 바로 경험할 수 있는 구조가 만들어졌습니다.
  • 기존 자산 활용: 고객이 이미 보유한 녹음 파일을 활용하므로 추가적인 시간 투자 없이 서비스 도입을 검토할 수 있습니다.

회고

이 경험을 통해 느낀 건 개발자도 구현만 하는 게 아니라 제품의 흐름을 보면서 기획에 의견을 낼 수 있다는 점입니다. 실제로 코드를 작성하는 사람이기 때문에 STT API로 녹음 파일을 변환하는 기능을 제안할 수 있었으며 구현 비용이 얼마나 드는지를 판단할 수 있었고 그래서 회의에서 제안했을 때 바로 수용될 수 있었습니다.