[서문] 웹사이트 분석을 위한 데이터를 얻는 방법은 실제로 여러 가지가 있습니다. 예를 들어, 서버 로그 데이터를 사용하거나 클라이언트에 일부 모니터링 소프트웨어를 설치하십시오. 페이지 태깅 방식을 활용해 웹사이트 분석을 위한 데이터를 얻는 방식은 앞의 두 방식과 다르지만 탄생하자마자 모두를 놀라게 했고, 순식간에 주류 방식이 됐다. 실제로 내 블로그( http://www.chinawebanalytics.cn )의 거의 모든 주제는 페이지 마크업을 기반으로 합니다. 오늘의 기사에서는 페이지 태그 지정 웹사이트 분석이 무엇인지, 그리고 우리가 매일 읽는 Omniture Site Catalyst 또는 Google Analytics 웹사이트 분석 보고서의 데이터가 어떻게 캡처되는지 다시 한 번 이해하도록 도와줄 것입니다.
출장중이라 블로그할 시간이 적네요. 이 글은 제가 현재 집필 중인 웹사이트 분석의 기초에 관한 책에서 발췌한 것입니다. 내년에는 이 책이 모든 사람에게 읽힐 수 있기를 바랍니다.
【텍스트】
웹사이트 분석을 위한 데이터 캡처에 관해서는 모든 사람이 먼저 사전 지식을 가지고 있어야 합니다. 즉, 페이지 마크업 웹사이트 분석과 로그 방법 웹사이트 분석의 기본 원칙은 완전히 다릅니다. 로그 방법을 사용한 웹사이트 분석의 원리에 대해서는 서버 로그 방법 웹사이트 분석의 원리, 장점 및 단점 게시물을 읽어보세요. 이전에 친구가 웨이보에 메시지를 남겼는데, AWStats, Omniture, WebTrends는 모두 로그 분석 도구인데 Omniture는 asp 방식을 사용하기 때문에 다르지 않다고 생각했습니다. 이 견해는 완전히 오해되었습니다. 실제로 세 가지 도구는 모두 다릅니다. AWStats는 무료 로그 분석 도구입니다. WebTrends는 원래 순수 로그 분석 도구였지만 나중에 페이지 태그 기능이 추가되었습니다. Omniture SiteCatalyst는 페이지 태그 지정을 기반으로 하는 도구로 탄생했으며 지금까지 Omniture에는 로그 분석 도구가 없습니다.
따라서 오늘은 페이지 태그를 이용한 웹사이트 분석을 통해 데이터를 얻는 원리에 대해서만 이야기하겠습니다. 게임부터 시작해 보겠습니다.
페이지 마크업이란 무엇입니까?
다들 블리자드의 게임 스타크래프트(스타크래프트 1세대)를 플레이해 보셨나요? 나는 이 게임의 열렬한 팬이다. 저그의 여왕은 적의 액션 유닛에게 기생충을 뿌리는 특별한 능력을 가지고 있습니다. 이렇듯 액션 유닛이 가는 곳마다 주변의 상황을 저그는 매우 명확하게 볼 수 있습니다.
혹은 은행 곳곳에 설치된 카메라가 실제로 우리의 모든 움직임을 촬영한 후 저장 장치로 옮겨 저장하기도 합니다.
따라서 소위 페이지 마크업이라고 불리는 부적절한 비유는 페이지에 '뿌려지는' 기생충과 같거나, 페이지에 설치된 카메라가 페이지에 방문자의 일거수일투족을 기록해 이를 전달하는 것과 같다. 관련 본 웹사이트에 대해 알아야 할 조직 또는 개인입니다.
아래 그림은 이 프로세스를 나타냅니다.
페이지 태그는 그림의 작은 빨간색 조각과 같습니다. 이는 실제로 브라우저에서 실행될 수 있고 페이지의 HTML 소스 파일에 배치되는 JavaScript 프로그램 명령문입니다. 이런 식으로 해당 페이지가 클라이언트의 브라우저에 다운로드되면 스타크래프트의 기생충처럼 이 페이지에 표시된 Javascript 프로그램이 실행되거나 카메라가 켜집니다.
페이지 마크의 JavaScript 코드가 실행된 후, 페이지에서 방문자의 인터랙티브 접근 행위는 페이지 마크에 해당하는 웹사이트 분석 도구의 서버로 충실하고 지속적으로 전송됩니다. 이는 카메라가 캡처한 이미지를 전송하는 것과 같습니다. 이미지 저장 서버도 똑같습니다. 웹사이트 분석 도구 서버는 데이터를 수신한 후 데이터를 추가로 처리하고 사람들이 읽고 분석할 수 있는 그래픽, 표 및 데이터 파일로 변환한 다음 이를 아름다운 사용자 인터페이스에 표시합니다. 우리가 일반적으로 사용하는 Google Analytics는 이러한 데이터 수집 방법입니다.
보시다시피 페이지 표시 방법은 로깅 방법과 근본적으로 다릅니다.
1. 로깅 방법은 분석을 위해 로그 파일에서 데이터를 추출하는 반면, 페이지 태그는 페이지에 작은 "스파이 유닛"을 인위적으로 추가해야 하며, 이는 데이터를 얻기 위해 제3자에 의존해야 함을 의미합니다.
2. 이 추가적인 작은 "스파이 유닛"으로 인해 페이지 표시 방법은 페이지의 HTML 소스 파일을 수정해야 하지만 로깅 방법은 그렇지 않습니다.
3. 로깅 방법은 사용자가 데이터를 처리할 때까지 수동적으로 기다립니다. 데이터를 처리하지 않으면 데이터는 충실하고 엄격한 기록이 됩니다. 페이지 표시 방법은 데이터를 적극적으로 전송하고 자동으로 데이터를 전처리한 후 사용자를 기다립니다. 분석하다.
여기서 약간의 역사에 대해 이야기 해 봅시다. 인터넷 초기에는 웹사이트의 규모가 작고 구조가 단순했으며 로깅 방식이 세상을 지배했습니다. 그러나 인터넷의 발전 속도가 너무 빨랐고 웹사이트의 소프트웨어, 하드웨어 및 논리적 아키텍처가 점점 더 빠르게 발전했습니다. 로깅 방법에는 극복해야 할 문제가 많이 있으며, 구현의 어려움도 기하급수적으로 증가하고 있으며 이를 달성하기 위한 더 쉬운 방법을 찾아야 합니다. JavaScript의 인기와 SaaS(Software as a Service, Software as a Service)의 등장으로 페이지 마크업 방식이 등장했습니다. 이 방식은 구현이 간단하고 대용량 로그 파일 기록, 데이터 관리를 처리할 필요가 없습니다. 처리 효율성이 크게 향상되어 빠르게 많은 웹마스터들의 첫 번째 선택이 되었습니다. 단순성, 높은 데이터 가독성, 낮은 관리 난이도 등의 많은 장점으로 인해 페이지 태그 지정 방법은 웹 사이트 분석 과학에서 주류 데이터 수집 방법이 되었습니다. 내 블로그도 로깅 방법보다는 이 방법에 전적으로 중점을 두고 있습니다. 자세히 논의될 예정이다.
흥미로운 내용: 모니터링 코드와 모니터링 태그의 차이점
웹사이트 분석의 구체적인 실제 활동에서는 추적 코드와 추적 태그라는 두 가지 추적 태그 방법을 혼합하는 경우가 많습니다. 하지만 사실은 서로 다른 것들이기 때문에 엄밀하게 구분할 수 있다면 좀 더 정확한 의사소통을 할 수 있을 것입니다.
코드는 실행 가능한 프로그램의 명령문을 의미하므로 모니터링 코드는 모니터링 목적으로 작성된 실행 가능한 프로그램 명령문을 의미합니다. 가장 일반적인 모니터링 코드는 페이지에 추가하는 Google Analytics JavaScript 모니터링 코드입니다.
태그란 모니터링 대상을 식별하기 위해 추가된 식별자를 의미하며, 이 식별자는 프로그램 명령문이 아니므로 실행될 수 없으나, 프로그램에서 인식하여 모니터링 대상의 구체적인 속성을 판단하는 데 사용할 수 있다. 예를 들어 다음 URL은 http://www.chinawebanalytics.cn/?utm_campaign=newbook&utm_source=tsinghua&utm_medium=PRess 입니다. "?utm_campaign=newbook&utm_source=tsinghua&utm_medium=press"는 라벨입니다. 태그는 완전한 URL일 수도 있습니다.
간단히 말하면, 실행 가능한 프로그램이 모니터링 코드이고, 실행 불가능한 프로그램이 모니터링 라벨입니다.
페이지 마크업 방법의 작동 방식
우리는 이미 페이지 마크업 방법의 기본 원리를 이해했으며 이제 페이지 마크업이 어떻게 데이터를 수집하고, 전송하고, 최종적으로 우리에게 제시할 수 있는지 자세히 배워야 합니다. 이 프로세스를 이해하는 것은 웹사이트 분석의 구체적인 모니터링 구현을 수행하는 데 매우 도움이 됩니다.
1단계: 브라우저에서 페이지 모니터링 코드를 로드하고 실행합니다.
페이지 태그 지정 방법이 제대로 작동하기 위한 전제 조건은 웹 사이트에서 모니터링해야 하는 모든 페이지에 JavaScript 모니터링 코드를 추가하는 것입니다. 사용자가 이 페이지를 열면 서버(또는 캐시)는 사용자의 요청에 응답한 다음 모니터링 코드와 함께 페이지를 사용자의 브라우저에 전달합니다. 사용자의 브라우저는 모니터링 코드를 수신하면 코드 실행을 시작합니다.
2단계, 전체 모니터링 코드 실행
페이지의 모니터링 코드가 실행된 후 모든 모니터링 기능을 구현하는 것이 아니라 해당 웹사이트 분석 도구의 서버에 완전한 모니터링 코드를 요청합니다. 전체 모니터링 코드문은 용량이 커서 .js 파일로 모아서 웹페이지 외부에 저장합니다. 외부 코드가 페이지 모니터링 코드로부터 요청을 받으면 이 요청도 브라우저에 전달되어 브라우저에 의해 실행됩니다. 이러한 방식으로 완전한 모니터링 기능을 실현할 수 있습니다.
내 블로그(CWA, Web Analytics in China, http://www.chinawebanalytics.cn )의 GA 모니터링을 예로 들면, 전체 모니터링 코드를 실행하는 동안 몇 가지 일이 발생합니다.
1. 브라우저 버전, 운영체제 버전, 화면 해상도 등 클라이언트의 다양한 속성을 감지하고, 페이지 접속이 발생한 특정 시간, 접속 소스(트래픽 소스) 등을 기록합니다.
2. 이 사용자의 브라우저에 대한 쿠키를 생성하십시오. 쿠키란 무엇입니까? 이 게시물을 참조하십시오: 쿠키 보호 - 쿠키가 없으면 아무것도 없습니다. 및 이 게시물: JavaScript와 쿠키가 GA에 얼마나 영향을 미칩니까? . 이 두 기사를 읽고 싶지 않더라도 상관없습니다. 간단히 말해서, 쿠키의 기능은 사용자가 다음에 이 웹사이트를 다시 방문할 때와 관련된 주요 정보를 기록하는 것입니다. 쿠키에 있는 기록은 새로운 방문자로 사용됩니다. 검색 기록을 참조하면 웹사이트 분석 도구를 통해 이 방문이 재방문인지, 방문자가 새로운 방문자인지 여부 및 기타 여러 중요한 데이터를 확인할 수 있습니다. 페이지 마크업 감지 방법에는 쿠키가 필요합니다. 즉, 브라우저가 쿠키를 비활성화하면 페이지 마크업 방법이 작동하지 않습니다. Google Analytics 쿠키 설정에 대해 알아보려면 다음 문서를 참조하십시오: 웹사이트 분석 지표, 의미 및 귀하가 모르는 것(2).
3. 이전에 이 방문자의 브라우저에 쿠키가 설정된 경우, 모니터링 코드는 업데이트해야 하는 기존 쿠키 데이터 부분을 다시 작성하여 각 쿠키가 해당 액세스 행동 데이터를 기록하도록 합니다.
3단계: 웹사이트 분석 도구 서버로 데이터 보내기
모니터링 코드가 모든 정보를 수집하면 관련 데이터를 웹사이트 분석 도구의 서버로 다시 전송합니다. 전송 방법은 데이터를 직접 보내는 것이 아니라(즉, post 메소드를 사용하지 않는 것입니다. HTTP 프로토콜의 post 및 get 메소드를 이해하지 못하는 경우 괄호 안의 내용을 건너뛰어도 됩니다) 웹사이트 분석 도구 서버로 데이터를 전송합니다. 이는 1×1 픽셀 투명 GIF 이미지를 요청하여 수행됩니다(즉, 여전히 get 메소드를 사용하고 있으므로 이해하지 못하는 경우 건너뛰십시오). 조금 이상한 것 같죠? 실제로 이 1×1 픽셀 요청을 발행할 때 수집된 모든 데이터는 이 요청의 관련 매개변수로 분석 도구 서버에 전송되므로 분석 도구는 관련 데이터를 획득하고 저장할 수 있습니다.
4단계, 웹사이트 분석 도구 서버가 데이터를 기록합니다.
웹사이트 분석 도구 서버는 데이터를 수신한 후 대용량 데이터 파일에 데이터를 저장합니다. 이 데이터 파일의 기록 방법은 앞서 언급한 로그 파일(Log File)과 매우 유사하므로 여기서도 이를 호출합니다. 로그 파일이지만 여기서의 로그 파일에는 웹사이트 분석 도구 서버 자체의 운영 데이터가 포함되어 있지 않고 모니터링되는 웹사이트의 데이터가 포함되어 있다는 점이 다릅니다.
이 로그 파일 파일의 각 데이터 줄(데이터 항목)에는 다음을 포함하되 이에 국한되지 않는 특정 페이지 보기(페이지 보기)에 대한 많은 정보가 포함되어 있습니다(예: Google Analytics 로그 파일 레코드 파일 사용).
1. 페이지 접속이 발생한 일시
2. 방문한 페이지의 제목
3. 방문자의 출처(특정 웹사이트로부터의 링크 여부, 검색 엔진을 통한 링크 여부, 직접 접속 여부 등)
4. 해당 방문자가 이 웹사이트를 방문한 횟수
5. 방문자 IP 주소의 지리적 위치
6. 운영 체제, 브라우저, 화면 해상도 등과 같은 방문자 클라이언트 속성
이러한 기록이 분석 도구 서버의 로그에 포함되면 데이터 수집 프로세스가 완료됩니다. 다음 예는 Google Analytics 서버에 기록된 데이터 행입니다. (실제 데이터가 아님에 유의하시기 바랍니다.)
123.121.215.51 www.chinawebanalytics.cn – [31/Jan/2010:20:45:26 -0600] "GET
/__utm.gif?utmwv=1&utmn=699988832&utmcs=utf-8&utmsr=1680×1050&utmsc=32-bit&utmul=enus&
utmje=1&utmfl=8.0&utmcn=1&utmdt=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E5%9C
%A8%E4%B8%AD%E5%9B%BD%E2%80%94%E2%80%94%E4%BB%8E%E5%9F%BA%E7%A1%80
%E5%88%B0%E5%89%8D%E6%B2%BF&utmhid=2006742654&utmr=-
&utmp=/ HTTP/1.1" 200 35 " http://www.chinawebanalytics.cn/ " "Mozilla/5.0(호환; MSIE 6.0;
윈도우 NT 5.1; .NET CLR 1.1.4322;
"__utma=453698521.699988832.235456888.235456888.235456888.1; __utmb=453698521;
__utmc=453698521;
__utmz=453698521.235456888.1.1.utmccn=(직접)|utmcsr=(직접)|utmcmd=(없음)"
위의 데이터는 지저분해 보이지만 실제로는 몇 가지 단서를 볼 수 있습니다. 예를 들어, 방문자의 IP 주소는 123.121.215.51이고, 방문한 도메인은 내 블로그 www.chinawebanalytics.cn 이며, 방문이 시작된 시간은 2010년 1월 31일 오후 8시 45분 26초였습니다. 또한, 되돌아보면 방문자가 사용하는 운영체제와 브라우저에 대한 정보도 확인할 수 있습니다.
utma, utmb, utmc 및 utmz가 모두 무엇을 의미하는지에 대해서는 이 기사를 읽고 나면 이해하게 될 것입니다: 웹사이트 분석 측정, 중요성 및 알 수 없음(2).
5단계, 웹사이트 분석 도구로 데이터 처리
웹사이트 분석 도구 서버의 로그 파일에 데이터가 기록되면 파이프라인이 계속 다운됩니다. 다음 단계는 이러한 로그 파일의 기록 줄을 처리하는 것입니다. 각 기록 줄에는 방문자 IP, 액세스 시간, 브라우저 및 해당 버전 등과 같은 필드라고 하는 특정 데이터 요소가 포함되어 있습니다. 그런 다음 해당 필드에 저장되어 데이터를 최종적으로 볼 수 있는 "반제품"이 됩니다.
그런 다음, 웹사이트 분석 도구에서 인위적으로 설정된 기준에 따라 반제품 데이터를 추가로 필터링하고, 필터링할 수 없는 데이터 필드는 제외하고, 나머지 데이터는 보고서 생성을 위해 준비된 프로젝트에 추가로 정렬합니다. 이 모든 데이터는 웹사이트 분석 도구의 전문 데이터베이스에 저장되어 언제든지 추출되어 사용되기를 기다리고 있습니다.
6단계, 보고서 생성
데이터 처리가 완료되면 전체 프로세스가 종료됩니다. 사용자가 웹사이트 분석 도구를 사용하여 특정 보고서를 요청하면 데이터 필드는 미리 정의된(또는 사용자 정의) 형식으로 구성된 보고서 생성을 준비하기 위해 추가로 계산, 구성 및 프로젝트로 정렬됩니다. 우리는 이 프로세스를 볼 수 없지만 웹사이트 분석 도구 알고리즘의 미묘함을 포함하고 있습니다. 더욱이 알고리즘의 정의는 일부 기본 웹사이트 분석 지표의 정의에도 영향을 미치며 이는 기본의 실제 값 출력에 직접적인 영향을 미칩니다. 측정항목. 이는 동일한 웹사이트를 계산할 때 웹사이트 분석 도구마다 다른 값을 가져오는 중요한 이유이기도 합니다.
그 후, 준비된 데이터 항목은 웹 사이트 도구의 UI(사용자 인터페이스) 서버로 추가 푸시되어 특정 그래프, 표 및 그림을 생성한 다음 사용자의 브라우저 또는 클라이언트에 추가로 출력되어 우리가 제공하는 보고서가 됩니다. 쉽게 이해할 수 있습니다.
전체 프로세스는 실제로 복잡하지 않지만 웹사이트 분석 도구는 많은 양의 데이터 처리에 직면하게 됩니다. 특히 웹사이트 트래픽이 특히 클 경우 웹사이트 분석 도구는 큰 부하를 받게 됩니다. 이것이 바로 많은 웹 태그 웹사이트 분석 도구가 모니터링되는 웹사이트의 트래픽을 기준으로 요금을 청구하는 이유입니다.
웹사이트 분석을 위한 페이지 태깅 방법의 장점
페이지 태그 지정에는 많은 장점이 있어 웹사이트 분석을 위한 데이터를 얻는 주요 방법이 되었습니다.
1. 캐시 영향을 두려워하지 않음
캐싱의 영향을 두려워하는 로깅 방식과 달리 페이지 마크업 방식은 캐싱에 대해 전혀 걱정할 필요가 없습니다. 페이지 마크업의 코드는 페이지 소스 파일에 배치되므로 해당 페이지가 프록시 서버에 의해 캐시되거나 클라이언트의 브라우저 캐시에 저장되더라도 페이지 마크업의 코드도 저장되어 브라우저를 실행할 때 포함됩니다. 페이지를 로드합니다.
따라서 웹사이트의 여러 페이지를 연속으로 입력한 후 브라우저의 "뒤로" 버튼을 클릭하여 이전 페이지로 돌아가면 페이지 표시 방식에서는 이전 페이지로 돌아가는 행위로 인해 페이지가 늘어나게 됩니다. 단, 로그 파일 방식에서는 캐싱의 영향으로 새로운 페이지 조회가 기록되지 않을 수 있습니다. 이러한 방식으로 페이지 태그 지정 방법은 방문자의 여정을 보다 정확하게 기록할 수 있습니다.
2. “고객 상호작용”을 기록하는 능력
앞서 언급했듯이 페이지 마크업은 클라이언트에서 JavaScript 코드를 실행하여 구현되므로 이론적으로는 브라우저에서 열리는 페이지의 "모든 이동"을 기록할 수 있습니다. "클라이언트 측 상호 작용" 유형의 Flash, JavaScript 또는 기타 web2.0 애플리케이션의 경우 페이지 마크업은 이러한 애플리케이션의 다양한 상호 작용을 표시한 다음 이러한 상호 작용의 발생을 정확하게 기록할 수도 있습니다.
웹 페이지가 점점 더 대화형으로 변하면서 페이지 마크업의 장점은 매우 분명해질 것입니다. 또한 페이지 마크업을 사용하여 페이지에서 클라이언트 상호 작용을 직접 제공하는 도구가 이미 많이 있으며, 이는 클라이언트 상호 작용 모니터링이 더 이상 필요하지 않음을 보여줍니다. 선택사항이며 웹사이트 성능을 측정하는 중요한 부분이 되었습니다.
3. 상대적으로 정확한 방문자 기록
페이지 태그 지정은 쿠키를 사용하여 방문자 정보를 기록하고 식별합니다. 일부 페이지 태그 지정 도구는 쿠키와 IP를 사용하여 방문자 정보를 공동으로 식별하는 반면, 로깅 방법은 특정 IP 주소에만 의존합니다.
방문자 정보를 식별하기 위해 쿠키 방식을 사용하는 것 또한 100% 정확하다는 것은 불가능하다는 점을 강조해야 합니다(사실 완벽함은 존재하지 않습니다. 스티븐 호킹은 우주에 100% 완벽함은 존재하지 않는다고 말했습니다. 그렇지 않으면 우주는 존재하지 않을 것입니다. 존재) 그러나 IP 주소에만 의존하는 것에 비해 쿠키는 결국 식별 메커니즘을 추가하고 이 메커니즘은 클라이언트의 브라우저에 번들로 제공되어 더 많은 식별 정보를 저장하므로 쿠키를 사용하여 방문자의 기록이 기록보다 확실히 더 정확합니다. IP 방문자 수. 공평하게 말하면, (아직 알려지지 않은) 새로운 방법이 발견될 때까지는 쿠키 기술을 사용한 페이지 표시 방법이 현재 가장 정확한 방문자 데이터를 제공할 수 있습니다.
또한 페이지 태깅 방식은 웹사이트 데이터를 크롤링하기 위해 웹사이트를 방문하는 로봇이나 스파이더의 영향을 받지 않습니다. 따라서 악의적인 부정 행위를 제외하고 이 방법으로 기록되는 모든 데이터는 방문하는 "사람"의 데이터라고 볼 수 있습니다. 웹사이트. 특히 내 블로그와 같은 비상업적 웹사이트의 경우 로봇이 내 웹사이트를 크롤링하는 것에 별로 관심이 없습니다. 그러나 SEO에 대한 매우 고급 요구사항이 있는 경우 로그 분석 소프트웨어를 사용하여 검색 엔진 로봇의 웹사이트를 확인해야 합니다.
4. 실시간 성능 향상
로깅 방식과 마찬가지로 페이지 태깅 방식 역시 실시간으로 데이터를 수집한다. 방문이 발생하고 페이지의 마크업이 트리거되며 데이터를 가져와 도구 서버로 전송합니다. 그러나 로그 방식과 달리 로그 방식의 데이터 처리는 실시간이 아니다. 페이지 마크 방식의 데이터는 툴의 서버로 전송된 후 짧은 시간(실시간이라도)에 처리된 후 형태를 취한다. 보고서. 따라서 페이지 태그 지정 방법은 실시간 성능이 상당히 좋습니다. 예를 들어, Omniture의 SiteCatalyst 데이터 보고서는 과거에 몇 시간만 지연되었습니다. Google Analytics에서는 1~2일 정도 지연이 발생했지만 이제는 이러한 데이터 지연이 분석에 거의 영향을 미치지 않습니다. 대략적인 시간이라고 생각하세요.
5. 데이터 저장 및 전송 문제는 더 이상 존재하지 않습니다.
많은 수의 로그 파일을 저장해야 하는 로깅 방식과 달리, 페이지 마크업 방식의 데이터는 원할 경우 웹사이트 분석 도구 제공업체의 서버(도구 서버)에 완전히 저장할 수 있으므로 추가 하드웨어 비용과 추가 비용이 발생합니다. 로그 저장 장치를 구입하면 로그 파일을 관리하는 소프트웨어 비용이 없어집니다. 또한, 저장되는 문제는 로그 파일 분석 소프트웨어에 로그 파일을 입력하는 작업입니다. 때로는 이 작업이 도구의 가져오기 인터페이스에서 파일을 클릭하기 위해 마우스를 사용하는 것처럼 간단하지 않지만 개발이 필요합니다. 전문 프로그램. 게다가 미러 서버 등의 상황이 있을 경우 페이지 마크업 방식은 사실상 무시할 수 있지만, 로그 방식은 데이터 병합에 있어 그리 단순하지 않다.
좋습니다. 이번 주 숙제가 모두에게 전달되었습니다. 이제 모두의 차례입니다. 나는 당신의 의견과 의견을 정말로보고 싶습니다. 모두들 행복한 새로운 한 주 보내시기 바랍니다!
작가 : 송싱
기사 출처: http://www.chinawebanalytics.cn/pag-tagged-data-acquire/