바이두로 단어분할 연구를 별로 안했는데, 한번 최적화 하다가 우연히 단어 하나가 누락되어 결과 순위가 많이 달라지는 걸 발견했습니다.
제가 하는 일은 중고집 키워드인데 제 페이지의 키워드 설정이 '중고집'으로 되어 있어서 '중고집'에는 중고가 포함되지 않는다고 말하는 친구들도 있을 것입니다. 주택. 키워드? 바이두의 단어 분할을 주의깊게 연구하지 않았다면 두 단어의 차이를 보지 못할 수도 있지만, 검색 결과를 조금만 주목해 보면 바이두가 '두 번째-'를 비교하고 있다는 단서를 볼 수 있습니다. 중고 주택"과 "중고 주택"입니다. "중고 주택"이라는 두 단어는 다르게 분류됩니다. 바이두는 자체 어휘를 확립했기 때문에 "중고 주택"이라는 단어를 전체적으로 취급하지만 "중고 주택"이라는 단어를 Baidu는 "중고"와 "주택"이라는 두 단어로 나누었습니다. 당연히 다른 사람들은 "중고 주택"이라는 키워드를 검색하면 내 페이지를 찾을 수 없습니다. 이 작은 세부 사항을 통해 Baidu의 단어 분할에 대한 심층적인 연구를 수행할 필요가 있다고 생각하여 다음과 같은 사항을 대략적으로 요약했습니다.
1. 바이두 단어 분할은 콘텐츠에서 키워드 관련 단어가 처음 등장하는 것을 기준으로 합니다. 예를 들어, "오늘의 새로운 열혈 강호 sf"라는 단어가 텍스트에 먼저 나타나면 페이지의 키워드는 "오늘"과 "새로 열혈 강호 sf" 두 단어로 분할되며, 제목에는 다음이 포함되어야 합니다. 키워드는 반드시 일치할 필요는 없으나 내용에 나타나는 키워드는 바이두 단어 분할과 완전히 일치해야 하며, 완전 일치에서는 파일 URL 경로의 깊이를 기준으로 정렬하려면, 키워드는 완전히 일치합니다. 예를 들어 디렉터리는 파일보다 우선 순위가 있고, 루트 디렉터리의 파일은 보조 디렉터리의 파일보다 우선 순위가 있으며, 완전히 일치하는 항목은 먼저 순위가 매겨진 다음 부분 일치가 됩니다.
2. 키워드가 완전히 일치하지 않는 경우, 예를 들어 브라우저가 이 키워드를 다운로드하는 경우와 같이 단어 분할이 있는 경우 웹 페이지에 나타나는 첫 번째 키워드는 브라우저이며 키워드 밀도가 높습니다. 이 웹페이지에는 "다운로드"라는 키워드가 없으며 다른 웹페이지에 처음으로 나타나는 키워드는 다운로드입니다. 그러면 이 웹페이지의 키워드는 브라우저 다운로드라는 두 단어로 분할됩니다. 웹페이지에는 "브라우저"가 포함되어 있습니다. " 및 "다운로드"가 있지만 첫 번째 웹페이지의 순위는 여전히 두 번째 웹페이지보다 앞에 표시됩니다. 이는 키워드의 첫 번째 부분이 가장 중요하다는 것을 보여줍니다.
3. 키워드의 첫 번째 부분의 빈도가 순위의 핵심입니다. 예를 들어 "브라우저 다운로드", 두 웹 페이지가 완전히 일치하지 않고 둘 다 두 개의 분사를 포함하는 경우 웹 페이지 "브라우저"가 높습니다. 분사의 밀도는 앞에 있을 것입니다.
4. 완전히 일치하지만 키워드가 페이지 콘텐츠의 마지막 부분에 먼저 나타나면 이 웹페이지의 순위는 이전 페이지의 순위보다 낮습니다. 따라서 키워드가 콘텐츠에서 가능한 한 빨리 나타나는 것이 매우 중요합니다.
5. 바이두는 처음 나타나는 관련 키워드를 기준으로 단어를 자르기 시작합니다. 첫 번째로 나타나는 관련 키워드가 키워드의 꼬리이면 뒤에서 자르기 시작합니다. 즉, 웹 콘텐츠를 순서와 역순으로 단어로 구분하여 순서대로 키워드의 앞부분을 시작점으로 사용하고, 역순으로 뒷부분을 사용합니다. 출발점으로. 예를 들어, "오늘 새로 오픈한 열혈 강호 SF"가 키워드입니다. 웹페이지에 처음으로 나타나는 키워드가 "열혈 강호 SF"라면 페이지의 키워드는 "열혈 강호 SF"로 분할됩니다. -혈기왕성 SF'라는 문구와 함께 '오늘 새롭게 오픈했다'는 문구도 담겼다.
6. 바이두의 단어 분할 원칙에 따라 사용하기 쉬운 키워드 헤더를 선택할 수 있습니다(즉, 웹 페이지 콘텐츠에 처음 나타나는 키워드를 조정합니다). 즉, 인위적으로 단어를 분할할 때 Baidu는 앞에서 뒤로 판단하고 뒤에서 앞으로 잘라냅니다.
7. 단어분할의 전반부와 후반부에 반복이 있는 경우에는 반복된 부분이 없는 부분보다 순위가 낮으나, 반복이 있는 경우에는 앞 부분의 밀도를 기준으로 판단합니다. 반. 예를 들어 "새롭게 개봉한 오늘의 열혈 강호 SF"로 잘라서 "오늘 새로 개봉한 열혈 강호 | 새로 개봉한 오늘의 열혈 강호 SF"로 자르면(단어 컷의 전반부) 이렇게 하면 너무 길어서 순위가 불리함), 그러면 "오늘 새롭게 오픈한 열혈 강호|새롭게 오픈한 열혈 강후"로 잘라내는 것보다 순위가 확실히 더 높을 것입니다. 강호|sf의 순위 가난하다
8. 키워드가 완전히 일치하지 않고 키워드가 불완전하게 나타나는 경우(예: 오늘의 새로운 열혈 강호 SF), 웹 페이지 콘텐츠의 키워드에 "오늘"이라는 단어가 포함되어 있지 않으면 단어는 다음과 같습니다. 컷은 "새로 열림"부터 시작되지만 이러한 웹 페이지는 키워드의 첫 번째 부분에 포함되지 않기 때문에 상대적으로 낮은 순위를 차지합니다.
9. 누락된 단어의 경우, 단어가 부족하지 않은 웹페이지와 비교하더라도 여전히 단어가 분할되기 전 부분의 밀도, 즉 단어 분할 순서에 따라 정렬되어야 합니다. , 단어가 잘려지면 단어의 첫 번째 부분이 정렬됩니다. 밀도 비율 예를 들어 웹 페이지에서는 앞 부분에 있는 키워드의 비율이 핵심입니다. 부분이 1:2이고, 다른 웹페이지의 비율이 1:4라면 당연히 앞쪽 웹페이지의 순위가 높아야 합니다. 또한 누락된 단어의 경우 잘라내기 전의 짧은 단어가 순위에 유리합니다.
10. 단어 부족은 없으나 키워드 뒷부분이 앞 부분보다 먼저 나오는 경우, 예를 들어 '오늘의 신열혈 강호SF'가 먼저 나오나 '오늘의 신열혈 강호 SF'라는 단어의 밀도가 높다. 피흘린 강호"가 높지 않으면 단어가 누락된 사람들보다 순위가 낮을 것입니다.
11. 다음 단어도 앞에 나오긴 하는데, 앞 단어와 뒤 단어의 비율이 핵심이다. 예를 들어 웹 페이지에 "sf"와 "오늘의 신열혈 강호"라는 두 단어가 포함되어 있다면, 다른 웹페이지와의 비율은 1:1입니다. "새롭게 오픈한 열혈 강호" "sf" "오늘 새로 오픈했습니다" 비율은 2:1:1이므로 이전 페이지가 순위에 유리합니다. 키가 아니라 나타나는 위치, 단어 세그먼트의 비율이 매우 중요합니다. 나중에 분사가 더 많은 비율을 차지할수록 순위가 더 불리해집니다.
12. 키워드가 본문에서 너무 늦게 나타나는 것도 불리하고, 주요 단어의 밀도가 너무 낮은 것도 불리합니다. 이전 웹페이지에서는 주요 단어의 밀도가 비슷한 경우를 비교했습니다.
이것이 제가 조사한 전부입니다. 이해하실 수 있는지 모르겠습니다. 가능하다면 Baidu의 단어 분할을 기반으로 웹페이지의 키워드 가중치 디자인을 조정하여 경쟁을 피할 수 있습니다. 뜨거운 말을 할 수 있습니다. Xiaotuo와 더 많이 소통할 수 있기를 바라며, 마지막으로 공유해 주셔서 감사합니다.
재인쇄하는 경우 출처를 명시해 주세요. 인터넷 홍보 계획 - 웹사이트 최적화 방법 - Xiaotuo 웹사이트 홍보 블로그
이 기사의 원본 주소: http://www.xiaotuo.net/seoyouhua/24/
Xiaotuo의 기여에 감사드립니다.