2024년 12월 6일
데이터 전처리로 유입부터 전환까지 정교한 분석하기
💡 이 글에서는 다음 내용을 확인할 수 있어요.
유입경로 전처리란?
텀타의 데이터 전처리 프로세스
유입경로 전처리
마케팅 분석에서 필수 요소인 유입경로를 데이터 전처리 프로세스로 같은 소스끼리는 그룹으로 묶고, 출처가 불명확한 (Direct) / (none) / (not set) 경로는 최소화하는 작업을 소개해 드립니다.
본 작업은 ‘구글태그매니저 – GA4 – 빅쿼리 – 루커스튜디오’ 연결을 통해 원천데이터를 직접 전처리하였습니다. 고객사 웹사이트로 유입되는 경로(소스)가 UTM 파라미터 설정, URL 값에 따라서 제각각이라 분석이 힘든 문제가 있었습니다. 텀타 데이터 전처리 프로세스로 naver, naver.com, m.search.naver.com 등 유입경로는 같지만 다르게 표시되던 부분은 통합하고, (Direct) / (none) / (not set) 처럼 출처를 알 수 없는 부분은 최소화하는 작업을 진행했습니다.

[루커 스튜디오 리포트 화면]
왼쪽 그래프는 전처리 작업 전 유입경로별 세션수를 나타내는데 그 중 ‘null’ 값은 경로가 불분명한 값이며 전체 세션수 중 가장 높은 비중을 차지하고 있었습니다. 이럴 경우 유입의 대다수인 ‘null’ 값을 제외하면 유입 경로 분석에서 의미가 많이 약해집니다. 유입 고객의 약 50% 출처를 알 지 못하고 분석을 해야하기 때문입니다. 오른쪽 그래프는 ‘텀타 데이터 전처리 프로세스’를 진행한 결과입니다. 기존 ‘null’값과 같은 의미인 ‘unknown’ 세션수가 확연하게 줄어든 것을 볼 수 있습니다. 그리고 naver, google, facebook, instagram 등 유입 소스 정보가 말끔하게 통일되었습니다.
텀타 데이터 전처리 프로세스
GA4 – 빅쿼리 연동 후 원천데이터를 보면 모든 발생 이벤트 정보를 알 수 있는데요, ‘텀타 전처리 프로세스’는 이벤트마다 포함하고 있는 속성과 파라미터 정보를 분석하고 유입 경로를 알 수 있는 모든 정보로 ‘null’값을 최소화 하고 있습니다. 유입경로를 명확하게 알수록 ‘유입 – 활동 – 전환’의 퍼널분석을 더 정교하게 할 수 있습니다.
웹 분석의 시작은 고객의 유입인 만큼 데이터 전처리 프로세스로 분석을 더 정확하고 정교하게 진행해 보세요.
마치며
기업의 비즈니스 성과를 극대화하기 위해서는 데이터 기반의 의사결정이 필수적입니다. 텀타는 데이터 수집 및 분석부터 맞춤형 대시보드 제작까지, 기업이 데이터를 통해 더 나은 결정을 내리고 성장할 수 있도록 지원합니다.