본문 바로가기
IT생활

블로그는 어떻게 접속 키워드나 경로, 방문자 수를 추적 할 수 있을까?

by 우물 밖 개구리. 2025. 1. 19.
반응형

블로그나 웹사이트의 관리 페이지에서 트래커를 통해 방문자가 어떤 키워드로 어떤 사이트에서 접속했는지를 확인할 수 있는 기능은 웹 분석 기술과 관련이 있습니다. 이러한 기능은 HTTP 프로토콜, 브라우저 리퍼러(Referrer), UTM 파라미터, 쿠키, 스크립트 기반 추적 기술 등을 활용하여 작동합니다. 아래에서 3000자 정도로 이를 자세히 설명하겠습니다.


1. HTTP 리퍼러(Referrer) 헤더

HTTP 프로토콜에는 Referer(오타로 인해 Referrer가 아닌 "Referer"로 표기)라는 헤더가 존재합니다. 이 헤더는 사용자가 현재 페이지에 도달하기 직전에 방문했던 페이지의 URL 정보를 포함합니다.

1.1. Referrer 헤더의 동작 원리

  • 사용자가 A 웹사이트에서 특정 링크를 클릭하여 B 웹사이트로 이동하면, 브라우저는 HTTP 요청을 생성할 때 해당 링크가 있던 A 웹사이트의 URL을 Referer 헤더에 포함하여 서버로 전송합니다.
  • 예를 들어, 사용자가 https://example.com에서 링크를 클릭해 https://blog.com으로 이동했다면, https://blog.com으로 보내는 요청 헤더는 다음과 같습니다:
    vbnet
    GET / HTTP/1.1 Host: blog.com Referer: https://example.com
  • 이를 통해 B 웹사이트는 사용자가 이전에 방문했던 웹페이지 정보를 알 수 있습니다.

1.2. 제한 사항 및 한계

  • 보안 문제: HTTPS 페이지에서 HTTP 페이지로 이동할 경우 Referrer 헤더는 브라우저 정책에 따라 전송되지 않을 수 있습니다.
  • Referrer-Policy: 현대 브라우저에서는 Referrer-Policy 헤더를 통해 Referrer 정보의 전송 여부를 서버에서 제어할 수 있습니다.

2. 검색 키워드 추적

검색 키워드 추적은 사용자가 검색 엔진(예: Google, Bing, Naver 등)을 통해 웹사이트에 접속했을 때, 해당 검색 엔진의 URL에 포함된 정보를 분석하는 방식으로 이루어집니다.

2.1. 검색 엔진의 쿼리 파라미터

  • 검색 엔진은 검색 결과 페이지의 URL에 사용자가 입력한 키워드를 쿼리 파라미터로 포함합니다.
  • 예를 들어, 사용자가 Google에서 "블로그 트래킹 원리"를 검색했다면 검색 결과 URL은 다음과 같은 형식을 가집니다:
    arduino
    https://www.google.com/search?q=블로그+트래킹+원리
  • 여기서 q=블로그+트래킹+원리는 검색 키워드를 나타냅니다.

2.2. 키워드 추출 과정

  • Referrer 헤더에 포함된 URL에서 쿼리 파라미터(q=...)를 분석하여 검색 키워드를 추출합니다.
  • 웹사이트 관리 페이지에 설치된 트래커는 검색 엔진별로 쿼리 파라미터의 이름(q, query, search 등)을 알고 있으며, 이를 기반으로 키워드를 파싱합니다.

2.3. 검색 엔진의 개인정보 보호 정책

  • Google과 같은 일부 검색 엔진은 HTTPS로 보호된 검색 결과 페이지에서 리퍼러 헤더에 검색 키워드를 포함하지 않습니다. 대신, 웹사이트가 UTM 파라미터를 활용하도록 권장합니다.

3. UTM 파라미터

UTM(Urchin Tracking Module) 파라미터는 URL에 추가되어 마케팅 캠페인의 효과를 추적하는 데 사용됩니다.

3.1. UTM 파라미터 구성

  • 예를 들어, https://example.com에 접속하는 URL에 다음과 같은 UTM 파라미터가 포함될 수 있습니다:
    https://example.com?utm_source=google&utm_medium=cpc&utm_campaign=spring_sale
  • 주요 파라미터:
    • utm_source: 트래픽의 출처(예: google, facebook 등).
    • utm_medium: 트래픽의 유형(예: organic, cpc, email 등).
    • utm_campaign: 캠페인 이름.

3.2. 작동 원리

  • 사용자가 UTM 파라미터가 포함된 URL을 통해 웹사이트에 접속하면, 트래커는 URL의 파라미터 값을 저장합니다.
  • 이를 통해 관리 페이지에서 어떤 마케팅 채널이나 캠페인을 통해 트래픽이 유입되었는지 확인할 수 있습니다.

4. 쿠키 및 세션 추적

쿠키와 세션은 사용자의 방문 기록을 저장하고 분석하는 데 중요한 역할을 합니다.

4.1. 쿠키를 이용한 사용자 식별

  • 웹사이트는 방문자가 처음 접속했을 때 고유한 식별자를 쿠키에 저장합니다.
  • 이후 동일 사용자가 웹사이트를 재방문하면, 브라우저는 쿠키를 서버로 전송하여 사용자를 식별할 수 있습니다.

4.2. 세션 기반 분석

  • 방문자의 세션 동안 수행된 모든 활동(페이지뷰, 클릭, 구매 등)은 서버나 클라이언트의 추적 도구에 기록됩니다.
  • 세션 데이터는 시간 기반으로 만료되며, 관리 페이지에서 분석됩니다.

5. 자바스크립트 기반 추적 기술

대부분의 트래커는 자바스크립트를 이용하여 방문 데이터를 수집합니다.

5.1. 트래킹 코드 삽입

  • Google Analytics와 같은 분석 도구는 웹사이트에 자바스크립트 트래킹 코드를 삽입하도록 요구합니다:
    html
    <script async src="https://www.google-analytics.com/analytics.js"></script>
  • 이 스크립트는 사용자의 브라우저에서 동작하며, 다음과 같은 데이터를 수집합니다:
    • 사용자의 브라우저 정보(브라우저 종류, 해상도 등).
    • 접속 경로(Referrer, UTM 파라미터 등).
    • 클릭 및 스크롤 이벤트.

5.2. 데이터 전송

  • 수집된 데이터는 비동기 요청을 통해 분석 서버로 전송됩니다. 예:
    bash
    POST /collect HTTP/1.1 Content-Type: application/json { "referrer": "https://google.com", "utm_source": "email", "browser": "Chrome", "os": "Windows" }

6. 프라이버시 및 법적 제약

현대적인 트래킹 기술은 개인정보 보호법(예: GDPR, CCPA 등)의 규제를 받습니다.

  • 익명화: IP 주소를 익명화하거나 직접 식별 정보를 저장하지 않아야 합니다.
  • 동의 요구: 사용자의 추적 동의를 받아야 하는 경우도 있습니다.

결론

블로그와 같은 웹사이트에서 방문자의 키워드와 유입 경로를 추적하는 것은 주로 Referrer 헤더, UTM 파라미터, 쿠키 및 세션, 자바스크립트 기반 분석 도구를 통해 이루어집니다. 이러한 기술은 사용자의 경험을 분석하고 마케팅 효과를 평가하는 데 매우 유용하지만, 개인정보 보호와 관련된 법적 제약을 준수해야 합니다.

반응형