2010년 4월 13일 바이두 티에바 웹마스터 클럽에서 중국의 유명 SEO 전문가인 ZAC가 "원본 콘텐츠를 식별할 수 없다는 것을 타인을 대신하여 질문하는 것"이라는 글에서 "내가 만든 원본 콘텐츠의 순위"라고 질문했다. 재인쇄되거나 표절된 콘텐츠만큼 좋지 않은 경우가 많습니다. 웹마스터는 무엇을 해야 예방하거나 개선할 수 있나요? 내 웹사이트는 원본 콘텐츠를 매일 업데이트하고 Baidu도 매일 업데이트합니다. 그러나 다른 사람의 재인쇄물이 포함된 후에는 내 기사가 업데이트됩니다. 거의 4번이나 검색이 안 되네요. 제 원본인데도 Baidu가 500개가 넘는 곳으로 떨어뜨렸어요!”
2년 전 ZAC 대표 웹마스터는 바이두 대표인 이 대표와 독창적인 포함 문제를 두고 대화를 나눴다.
2년이 넘도록 위 질문에 언급된 상황은 바뀌지 않았으며 심지어 더욱 악화되었습니다. 다양한 "복제 및 수집된 유사 원본" 귀중한 원본 콘텐츠 페이지는 키워드 색인을 통해 Baidu 웹 검색을 통해 네티즌에게 쉽게 추천됩니다. 그러나 원본 콘텐츠 출시 웹사이트는 명성을 잃었습니다. 이는 바이두의 단점을 겨냥한 '유사 원본 복사 및 수집'을 기반으로 하는 소위 SEO의 확산을 객관적으로 용인하는 것입니다.
놀랍게도 올해 8월 10일 바이두의 '웹마스터 클리닉 오픈 데이' 행사에서 독창성 식별 문제는 웹마스터와 SEOER들이 바이두 검색 엔지니어 이씨에게 계속해서 묻는 질문이 됐다.
또한 놀랍게도 Baidu 검색 엔지니어 Lee의 답변은 2년 전 그의 답변과 동일했습니다. "글쎄, Baidu의 전략은 아직 완벽하지 않으며 우리는 이를 완벽하게 원래 식별 알고리즘을 개선하고 있다고 말할 수 있습니다."
바이두 뉴스를 팔로우하는 사람들은 바이두 리의 "우리는 비교적 완전한 원본 식별 알고리즘 세트를 설계하고 있습니다"라는 대답이 지난 7월 2일 바이두 웹 검색 사기 방지 팀의 "저품질 사이트에 대한 조치"에 대한 응답이라는 것을 쉽게 알 수 있습니다. "저품질 사이트(가짜 원본, 비원본 사이트)에 대한 대책이 시행되었습니다." - 당시 "저품질 사이트에 대한 대책이 시행되었습니다"라고 거창하게 말한 것을 모두가 기억하고 있습니다. 원본 리소스를 보유한 웹마스터의 경우 품질이 낮은 사이트의 순위를 낮추거나 심지어 제거하기 때문에 Baidu에서 더 많은 트래픽을 얻을 수 있습니다."
그러나 두 달도 채 지나지 않아 바이두 검색 엔지니어 이씨의 답변은 바이두 웹 검색 사기방지팀의 주장을 전면 부인하는 내용으로 매우 충격적이었다.
더욱이 이바이두는 2년 만에 두 차례나 '원본 콘텐츠'를 규명해야 하는 문제에 대해 '둘러보고 이야기하는' 방식을 채택해 형식적으로 대처했다. 사용자 경험상 일부 재판본은 원작보다 나쁘지 않을 수도 있다...그냥 국내 재판일 뿐이고, 처음부터 끝까지 잘린 부분이 많아 원저자를 더욱 상처받게 만든다." 올해 재인쇄; Baidu Lee의 답변은 다음과 같습니다. 3~5일 동안 전체 콘텐츠를 읽을 수 없으며 고품질 웹사이트라고 주장합니다."
이씨가 말한 내용은 모두 사실임은 부정할 수 없지만, 실제 세부 사항의 축적이 실제 전체와 같지는 않습니다. 이러한 공통 상황이 존재한다고 해서 중국 인터넷 산업에 고품질의 독창적인 콘텐츠가 없다는 의미는 아닙니다. 이는 Baidu가 원본 릴리스의 이유를 식별할 수 없음을 의미합니다. "다이아몬드가 없으면 도자기를 망치지 말라"는 속담처럼 바이두 리의 발언은 원본 콘텐츠를 식별하고 중복 페이지를 제거하는 바이두의 능력이 전혀 향상되지 않았음을 입증할 뿐입니다.
원본 페이지 식별 능력이 떨어지는 것이 모든 검색 엔진의 약점이라는 점을 이해한 후 많은 풀뿌리 원본 작성자가 기사 끝 부분에 시작 URL을 표시하기 위해 저작권 표시를 추가했으며 동시에 그들은 고품질 업계 웹사이트 제출의 "컨텐츠 동기화" 방법을 따릅니다. - 얻은 링크의 대부분은 일반 텍스트 링크이지만 Baidu 검색 엔지니어 Lee는 "질문을 명확히합시다. 태그가 아닌 일반 텍스트 형식을 인식하고 처리할 수 있습니까? "예, 검색 엔진 스파이더는 인터넷에서 적시에 링크를 검색하고 크롤링해야 합니다. 링크의 형식은 중요하지 않습니다." 그것은 그들에게 자신감을 주었다.
이들 웹마스터들을 실망시키는 점은 업계의 다수의 권위 있는 투고 및 재인쇄 웹사이트가 바이두리의 말처럼 '처음부터 끝까지 재인쇄'하지 않고 비중이 높은 투고 또는 재인쇄 웹사이트의 웹페이지가 생성되어 포함된다는 점이다. "유사 원본 복사 및 수집" 웹사이트의 경우 Baidu에서 무시하는 원본 첫 페이지 페이지가 여전히 많이 있습니다. "유사 원본 복사 및 수집" 순위 웹사이트의 비중은 여전히 높습니다. 이러한 페이지 중 상당수는 여전히 기사의 일부를 무작위로 가로채고 있으며 기사의 주제를 완전히 표현하지 못하고 있으며 Baidu에서 광고하는 "더 나은 사용자 경험" 표준을 충족할 수 없습니다.
원본 페이지 식별은 항상 검색 엔진의 약점이었지만, 원본 실행 페이지를 가리키는 많은 비중이 높은 URL에 직면하여 모든 검색 엔진이 Baidu만큼 성능이 떨어지는 것은 아니라는 점에 유의해야 합니다. 국내 유명 SEOER Wang Tong이 말했듯이 중국 인터넷에서 '유사 원본 복사 및 수집'이 확산되는 상황에서 저작권 표시 URL 가이드가 포함된 원본 런칭 페이지에 대해(출시 외에 시간, 링크 보편성, 링크 웹사이트 페이지 무게 등 기준), 구글은 '중국을 가장 잘 안다'고 주장하는 바이두처럼 완전한 실패를 겪지 않았다. 블록버스터 관련 검색어 상위권은 복사 및 수집된 유사 원본 페이지가 차지하고 있으며, 원본 첫 페이지는 흔적도 없이 사라집니다.
이는 “중국을 가장 잘 아는” 바이두가 키워드 색인을 통해 네티즌들에게 검색할 URL을 추천하기 전에 원본 식별 작업과 중복 페이지 제거(고품질 정보 페이지 및 핵심 추천에 대한 중요한 보충 페이지 식별)를 완료해야 함을 보여줍니다. 아직 완성되지 않았습니다. 그 이유는 기술 수준이 매우 낮고 따라잡기가 시급한데, 바이두 리의 발언은 끊임없이 바이두에 대한 변명을 찾고 있을 뿐입니다.
더욱이, 이에 비해 원래 시작 주소를 식별하는 데 있어 Google의 더 나은 성능은 Baidu가 원래 시작 페이지에 관심이 없고 더 독창적인 콘텐츠에만 관심이 있다는 것을 증명합니다. 그러나 이것이 Baidu가 하고 있는 일이라고 생각합니다. 오랫동안 원래 웹 사이트 알고리즘이 후진적인 주된 이유는 "불가능 여부"입니다.
국내 유명 SEOER인 Wang Tong이 "Baidu의 628 조정은 원본 웹사이트를 단속하기 위한 것"이라고 말하자마자 많은 웹마스터와 SEOER들이 안타까움을 느꼈습니다.
실제로 원본 첫 페이지의 식별 기술이 획기적으로 향상된다면 검색 엔진의 부정 행위 방지 능력도 크게 향상될 수 있고, 이익을 위해 다양한 방법으로 검색 엔진을 속이는 SEOER들의 음모를 직접적으로 좌절시키고, 고품질의 원본 콘텐츠에 대한 자신감을 갖고 있는 사람들을 위한 플랫폼입니다.
Baidu가 많은 중소 규모의 독창적인 웹사이트 웹마스터들의 작업을 실용적인 행동으로 존중하고 그들이 그들의 지성과 재능을 계속해서 독창적인 작업을 수행하도록 장려할 때에만 '복사 및 수집'에 집착하는 더 많은 웹마스터와 SEOER를 안내할 수 있습니다. 유사 원본"은 "웹 사이트의 핵심 가치를 가장 잘 반영하는" 원본 콘텐츠로 이동하는 데 에너지를 쏟는 것입니다. 바이두로서는 이 단계가 어렵지만 향후 검색 엔진 발전에 도움이 되는 큰 움직임이다.
더욱이 웹마스터들이 보고한 '원본 콘텐츠 수집 문제'를 보다 합리적인 알고리즘으로 가능한 한 빨리 해결하는 것이 많은 풀뿌리 웹마스터들에게 바이두가 주는 선물이 아니라는 점을 바이두 웹 검색에 상기시켜야 한다(유명 웹사이트는 바이두를 화나게 하지 않는다). 모두), 타오바오는 바이두)를 직접 차단하지만, 이는 현행 저작권법 및 기타 관련 법률에 따라 바이두가 이행해야 하는 '기본 의무'입니다. Baidu 사람들은 자신에 대해 너무 좋은 느낌을 가질 수 없습니다.
어디로 가야할지, 길은 당신의 발 앞에 있으며, 그것은 모두 검색 엔진의 선택에 달려 있습니다. (이 기사는 원래 gouyn12에 게시되었습니다. 모든 권리는 귀하에게 있습니다. 기사에 대한 책임은 귀하에게 있습니다. 기사의 원본 출처를 에 표시하십시오. 재인쇄 시 링크 형식 : http://www.gouyn12.com/cnnet/327.html ).
(편집자 : Chen Long) 저자 gouyn12의 개인 공간