웹사이트 IIS 로그는 매우 중요한 것 중 하나입니다. 거기서 검색 엔진 로봇의 크롤링 상태를 확인할 수 있고, 자신의 웹사이트에 대해서도 알아볼 수 있으며, 특정 사용자의 출처를 분석할 수도 있기 때문입니다. 트래픽 통계 코드를 사용하여 계산을 수행하지만 웹사이트 IIS 로그를 보면 일부 공간 요구 사항이 제한되어 있으며 일부는 이를 지원하지 않는다는 알림도 필요합니다. 설치하려면 웹사이트 IIS 로그 스텁에도 공간이 필요합니다. 웹사이트 용량이 그다지 크지 않으면 갑자기 초과되므로 웹사이트를 호스팅할 더 나은 공간 공급자를 찾아야 합니다. 그렇다면 웹사이트 로그 분석이 어떻게 최적화에 도움이 되는지 이야기해 보겠습니다.
1. 검색 엔진 스파이더가 크롤링하는 횟수를 이해합니다.
스파이더는 검색 엔진이 콘텐츠를 크롤링하기 위해 보낸 로봇입니다. 스파이더 크롤링 횟수를 알아야만 검색 엔진이 우리 웹사이트를 좋아하는지 알 수 있습니다. 그렇지 않으면 이 웹사이트에서 크롤링 횟수를 비교할 수 없습니다. 이전 4주간의 작업 비교를 통해 웹사이트에 대한 외부 링크나 웹사이트 업데이트의 원인이 무엇인지 알 수 있으므로 웹페이지를 모두 직접 복사하여 붙여넣을 수 있습니다. 콘텐츠를 재인쇄하면 스파이더는 다음번에 그렇게 하지 못할 수도 있습니다. 다시 올 예정입니다. 이 웹사이트는 특정 웹사이트의 미러 사이트인 것 같습니다.
유해 스파이더의 경우 스파이더 IP를 차단하면 스파이더의 종류가 여러 가지인데, 어느 날 알 수 없는 스파이더 IP 웹사이트가 강등되거나 K로 판명되면 스파이더 IP 접속을 금지해야 합니다. .
스파이더 방문 횟수가 많으면 서버 리소스가 증가할 수 있습니다. 스파이더 방문을 자주 하는 것은 여전히 웹사이트에 도움이 되지만 리소스 소비도 매우 크기 때문에 이를 넣을 좋은 공간 공급자를 찾아야 합니다. 그렇지 않으면 서버가 모두 붕괴됩니다. 갑자기, 더 이상 존재하지 않을 수도 있습니다. 귀하의 웹사이트가 삭제되었음을 알려드립니다.
바이두 클럽: (다른 데이터를 훔치기 위해) 가짜 거미 식별을 살펴보면 가장 중요한 것은 바이두 거미가 항상 다른 곳에서 왔다면 실제 거미가 아닐 수도 있다는 점입니다. 강등되고 K-ed가 될 수 있습니다. 주의 깊게 확인하세요.
2. 웹사이트 페이지 크롤링 정도
홈페이지를 크롤링하려는 경우 격일로 스냅샷을 찍습니다. 내부 페이지가 자주 방문하는 경우 페이지의 특정 부분이 크롤링되지 않는 경우 스파이더 크롤링이 비활성화되어 있는지 확인하세요. 때로는 외부 링크가 만들어지기도 하지만, 내부 페이지도 제대로 수행하지 못하는 경우도 있습니다. 그렇지 않으면 포함률이 매우 낮을 것이며, 우리 웹사이트에 어떤 문제가 있는지, 어떤 페이지에 스파이더가 있는지도 알 수 있습니다. 어떤 페이지가 더 자주 크롤링되는지, 어떤 페이지가 크롤링되지 않는지 통합 분석하고 어떤 디렉토리에 콘텐츠가 더 많고 적은지 비교해야 합니다(공간 제공자에게 IIS 로그 제공을 요청). 재인쇄 때문인지, 외부 링크 때문인지, 시대에 따른 검색 엔진의 크롤링 상황이 다릅니다.
3. http 상태 코드 분석
스파이더는 일반적으로 크롤링 후에 http 상태 코드를 남깁니다. 200이 반환된다고 해서 바로 해제되는 것은 아닙니다. 일부는 업데이트 후 일주일 후에 해제되고, 일부는 이 코드가 반환되는 한. 페이지가 일반적으로 공개됩니다.
두 가지 질문:
1. 오류 페이지가 404 또는 200을 반환해야 합니까?
해당 검색 엔진만 웹 페이지에 액세스할 수 없다는 것을 알고 있기 때문에 404 4개를 정확하게 반환해야 합니다. 200이면 강등되거나 K(한 번이라도 웹 페이지가 큰 숫자로 크롤링될 수 있음을 의미)하는 상황이 발생할 수 있습니다. 모두 접근이 불가능하고, 처벌을 받기 때문에 404페이지를 준비하셔야 합니다.
2. 웹사이트를 제출해야 하고 준비 중인 경우 500, 400, 404, 500 또는 503 중 어떤 상태 코드를 반환해야 합니까?
503(503)을 반환하려면 검색 엔진에 일시적으로 사용할 수 없으며 곧 복원될 것임을 알립니다. 다른 상태 코드가 반환되면 검색 엔진이 해당 페이지에 액세스할 수 없습니다. 404 페이지는 이 페이지가 더 이상 존재하지 않는다는 의미이며 검색 엔진은 해당 웹사이트는 더 이상 존재하지 않는다고 생각하여 당분간은 다음번에도 계속 크롤링할 예정입니다.
웹사이트는 301 영구 리디렉션을 수행하지만 코드를 반환하지 않습니다. 그런 다음 설정이 올바른지 확인해야 합니다. 그렇지 않으면 가중치가 새 도메인 이름으로 이전되지 않습니다.
4. 전문적인 로그 분석 도구
pv 액세스 값과 공격적인 액세스 값을 알 수 있습니다.
PV는 사용자 유지율을 반영합니다. 이탈률이 너무 높으면 웹사이트가 열리지 않거나 콘텐츠를 읽을 수 없습니다. 또한 웹사이트가 가장 많이 방문한 페이지를 확인할 수도 있습니다. 이런 방식으로 사용자의 요구 사항을 파악하고 개선할 수 있습니다. 만약 웹사이트가 오랫동안 열리지 않거나 매우 느리게 열리게 된다면, 알 수 없는 IP로부터의 방문이 많은지 로그를 확인해야 합니다. 그렇지 않으면 다른 서버로 변경되지만 약을 바꾸더라도 문제가 해결되지는 않습니다. 귀하의 이익을 보호하기 위해 법적 조치를 취하는 것이 가장 좋습니다.
(웹사이트의 품질은 사용자의 클릭에 의해 직접적으로 결정됩니다)
사용자가 귀하의 웹사이트를 클릭하지 않는다는 것은 귀하의 웹사이트가 설득력이 없거나 매력적이지 않다는 것을 의미하며, 한계적이고 불법적인 웹사이트를 제외하면 귀하의 제품 설명이 충분히 상세하지 않고 사진이 충분히 명확하지 않다는 것을 의미합니다. , 고객 서비스가 충분히 강력하지 않다면 누가 귀하의 웹 사이트에 계속 머물 것인가? 사용자 경험을 잘 수행하는 것은 숙제입니다.
로그 분석 도구:
(1).awstats、
(2).웨발라이저
또한 웹사이트의 상태 코드를 분석할 수도 있습니다.
웹사이트 IIS 로그는 여전히 최적화에 매우 유용합니다. IIS 로그는 귀하의 웹사이트가 사용자에게 유용한지 여부를 알 수 있을 뿐만 아니라 검색 엔진에 사용자의 취향에 적합한지도 알 수 있습니다. 강등 및 강간당한 흔적은 해당 웹사이트의 IIS 로그 코드에서 확인할 수 있습니다. 재인쇄 시에는 www.bole110.com 의 출처를 명시해 주시기 바랍니다.
담당 편집자 : Chen Long 저자 wangruolun의 개인 공간