H1N1은 최근 많은 소음을 일으켰고 모두가 이를 알고 있습니다. 불과 며칠 전만 해도 바이두(Baidu)도 H1N1 바이러스에 시달렸습니다.
검색 엔진 업데이트 속도 측면에서 Baidu는 포털 뉴스 웹 사이트 및 기타 업데이트가 많은 웹 사이트를 매우 빠르게 색인화하고 기본적으로 당일 업데이트합니다. 그러나 병원 웹사이트와 같이 업데이트량이 적은 웹사이트의 경우에는 둘 사이에 큰 차이가 있습니다. 예를 들어, 가중치가 높고 사이트맵과 핑을 제출한 웹사이트의 경우 Google의 색인 생성 속도가 분 단위에 도달할 수 있습니다. , 기사 업데이트만 하면 색인 속도가 몇 분에 이를 수 있습니다. Google에서는 몇 분 만에 찾을 수 있지만 Baidu의 경우 색인 속도가 일반적으로 웹사이트 홈페이지까지 크롤링하여 제목을 검색하고, 또는 디렉토리 페이지이지만 기사에 대한 콘텐츠 페이지가 거의 없습니다.
새로운 웹사이트 www.wznanke.com을 관찰한 바에 따르면, 이 웹사이트는 주로 의료 서비스 웹사이트입니다. 포함된 스냅샷을 보면 Baidu가 웹사이트 홈페이지에 특히 많은 관심을 기울이고 있는 것으로 보입니다. 사이트 홈페이지의 수정 내용이 수정되고 수정 내용이 완벽하지 않을 때 먼저 외부 소프트 기사 링크와 Baidu의 지식, Tieba를 보조로 사용했습니다. 관련 의료 웹사이트 분석을 통해 바이두에 포함되기까지 보통 일주일도 채 걸리지 않습니다. 반달 안에 게재된 기사는 바이두를 이용해 기사제목을 검색해 보세요. 상위에 있는 기사는 기본적으로 포털 사이트에서 재인쇄되거나 수집된 기사들이 대부분 동일하므로 기사 내용이 눈에 띄지 않습니다. 매우 작은 검색 엔진인데 전문적인 콘텐츠 업데이트가 적고 업계 특성이 뚜렷한 Wanzhong Men's Network와 같은 웹사이트의 트래픽을 늘리는 방법은 무엇입니까? Baidu도 불행하게도 H1N1 바이러스에 영향을 받았다면 몇 가지 이유를 찾을 수 있을 것입니다.
1. 시뮬레이션 캡처 분석
(1) 5월 16일 사이트의 Baidu 크롤러 기록에 따르면 다음과 같습니다.
#소프트웨어: Microsoft 인터넷 정보 서비스 6.0
#버전: 1.0
#날짜: 2009-05-16 14:42:56
#필드: 날짜 시간 s-사이트 이름 s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2009-05-16 14:42:55 W3SVC490114653 61.129.14.17 GET /robots.txt - 80 - 61.135.190.55 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 64
먼저, 크롤러는 웹사이트 홈페이지 상단에서 네비게이션 정보를 찾았습니다. 바이두는 로봇을 한 번 읽고 404를 반환한 후 일시 정지했습니다. 웹사이트 내부 페이지의 내용이 아직 완성되지 않았기 때문에 Baidu는 홈페이지를 읽은 후 내부 페이지에 액세스하기까지 오랜 시간을 기다립니다. 시뮬레이션에 따르면 Baidu의 첫 번째 효과적인 방문은 다음과 같습니다.
2009-05-16 01:23:32 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
둘째, Baidu의 다음 읽기는 계속해서 홈페이지 콘텐츠를 읽을 가능성이 높습니다. site:wznanke.com의 스냅샷을 통해 표시할 수 있지만 두 번째로 홈페이지를 크롤링할 때는 로봇이 읽히지 않습니다(시뮬레이션된 크롤러 표시). ).
2009-05-16 08:24:26 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
다음 단계에서 Baidu는 홈페이지에서 더 많은 링크를 읽을 수 있습니다. 웹사이트는 점차 개선되고 있으므로 웹사이트는 관련 내부 링크를 개선하고 시뮬레이션된 크롤러 기록에 따라 표시되지 않는 링크를 거부해야 합니다.
2009-05-1608:26:01W3SVC490114653 61.129.14.17 GET /remensousuo/RuHeJianFei/index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
각 단계의 Baidu baiduspider 크롤링 네트워크의 다양한 콘텐츠에 따라 관련 규칙에 따라 웹사이트의 관련 레이아웃을 적시에 조정할 수 있습니다. 특히 온라인에 있는 새로운 웹사이트의 경우 Baidu는 해당 웹사이트가 검색 엔진에서 특정 가중치를 갖고 특정 고품질 역방향 링크가 있는 경우에만 해당 웹사이트에 임계값을 부여합니다. 관련 콘텐츠 페이지가 포함되기 시작하고 해당 웹사이트는 Baidu로부터 더 많은 트래픽을 받게 됩니다.
특히 웹사이트 콘텐츠가 여전히 점진적으로 개선되고 있고 Baidu에 포함되기를 열망하는 웹마스터의 경우 맹목적으로 주요 검색 엔진에 복종하지 마십시오. 그 과정에서 먼저 외부 링크 관련 기사를 통해 홈페이지를 홍보했고, 바이두를 이용해 바이두 스페이스, 티에바, 지즈에 더 높은 가중치를 부여했고, 바이두와 협력해 업데이트 시간이 더 빠른 포털 사이트인 Sina, NetEase를 자주 방문했다. , Tom 관련 커뮤니티에서 특정 품질의 기사를 작성하는 데 집중합니다. 이렇게 하면 Baidu는 해당 웹사이트를 외부적인 비중이 더 높은 것으로 간주하고 자발적으로 포함하게 됩니다.
물론 Baidu가 H1N1 바이러스의 확산자일 뿐만 아니라 Baidu의 수집 규칙에 대한 마법의 무기를 찾는 한 이 H1N1 바이러스도 대다수 웹마스터에 의해 제거될 것입니다.
이 기사는 www.wznanke.com의 웹마스터가 친절하게 제공한 것입니다. QQ309067036에 문의하세요.