저는 회사에서 일부 영어 웹사이트를 유지하고 있으며 주로 링크 추가, 키워드 만들기 등의 일상적인 SEO 작업을 수행하고 있습니다. 그러나 2009년 3월 이후 웹사이트는 종종 숨겨진 링크로 가득 차 있었습니다. 이것은 전형적인 해커의 침입입니다. 홈페이지 시스템에 백도어가 추가됐을 수도 있는데, 그 이후로 홈페이지에 숨김 링크가 추가되는 경우가 많았는데, 하루 이틀 뒤에는 다시 홈페이지에 숨김 링크가 추가된 것 같습니다. 그런데 이 문제에 대해서는 그냥 로그 파일을 대충 확인해봤는데 아무런 단서도 찾을 수 없어서 그냥 링크 몇 개만 추가하는 정도일 뿐 별것 아닌 줄 알았습니다.
6월 19일 아침에 웹사이트를 확인해 보니 방문자 수가 눈에 띄게 줄어들었습니다. 방문자가 모두 Yahoo!와 Bing에서 왔는데 Google에서는 방문하지 않는 것을 확인했습니다. 구글 관리자 도구를 보니 이미 17일부터 구글에서 숨겨진 텍스트 추가로 인해 웹사이트가 삭제됐다는 내용의 메일이 왔고, 이에 충격을 받아 웹사이트 전체를 다운로드해 해커 백도어를 찾아 삭제했다. , 페이지를 수정하고 검토를 위해 다시 제출했습니다. 이틀 후인 21일 오전에 웹사이트의 색인이 다시 생성되었으며 순위 순위는 기본적으로 변경되지 않은 것으로 나타났습니다.
주목할 만한 문제가 몇 가지 있습니다. 지난 17일 구글에서 인덱스 삭제를 알리는 이메일을 보냈으나, 이날도 여전히 구글로부터의 트래픽이 발생해 19일까지 구글로부터의 트래픽이 전혀 발생하지 않았습니다. 즉, Google 검색 품질팀에서 색인이 삭제되었다는 이메일을 보냈음에도 불구하고 실제로는 색인이 완전히 삭제되지 않은 상태입니다. 트래픽은 Google에서 발생하고 이틀 후 Google이 해당 웹 사이트를 다시 포함시켰으며 기본적으로 순위는 거기에 없습니다. 색인된 페이지 수는 이전과 크게 변하지 않았지만 특히 주목할만한 것은 Google 스냅샷을 발견했다는 것입니다. 이 발견은 참으로 충격적입니다. 즉, 색인을 삭제한 후에도 Google 스파이더가 여전히 페이지를 크롤링한다는 것입니다.
19일에 색인을 삭제한 후 전체 웹사이트가 Google에서 검색되지 않았는데, 나중에 다시 색인을 생성해보니 대부분의 페이지 스냅샷이 17일 이전의 것이었습니다. 색인은 실제로 Google에 의해 색인 데이터베이스에서 완전히 삭제되었습니까? 그렇지 않은 경우 스냅샷 날짜는 삭제 전 날짜가 아니라 검토 후 다시 크롤링된 날짜가 됩니다.
여기서 과감히 추측을 해봅니다.. 구글 검색엔진의 알고리즘은 아무도 모르지만 짐작할 수 있는 흔적이 있습니다. 구글이 이런 전략을 채택하고 처벌되거나 삭제된 파일을 저장하는 전용 서버가 있는 걸까요? 해당 웹사이트는 구글 샌드박스와 마찬가지로 삭제된 인덱스 웹페이지를 처리하는 방식도 구글 샌드박스의 또 다른 표현이다. 인덱스에서 웹사이트가 삭제되면 모든 인덱스가 해당 서버로 이동된다. 에는 더 이상 존재하지 않지만, 스파이더는 여전히 차단된 웹사이트를 방문하며 이는 스냅샷 날짜를 통해 확인할 수 있습니다. 그렇지 않은 경우 웹사이트를 재검토하여 통과하면 서버의 로그 파일을 통해서도 확인할 수 있습니다. 이러한 서버에서 일반 인덱스로 이동하는 데는 매우 짧은 시간이 소요됩니다. 따라서 검토를 통과하면 포함된 페이지 수가 0에서 이전 수준으로 돌아갑니다. 포함 속도가 빠릅니다.
나는 단지 내가 발견한 몇 가지 문제를 제기하는 것일 뿐입니다. 친구들이 자신의 의견을 제시하고 나와 소통할 수 있기를 바랍니다.