Baidu での単語のセグメンテーションの調査にはあまり注目していませんでしたが、あるとき、最適化を行っているときに、単語が 1 文字欠落していることに偶然気づき、結果のランキングが大きく異なっていました。
私がやっているのは中古住宅のキーワードなのですが、私のページのキーワード設定は「中古住宅」となっているので、「中古住宅には中古は含まれない」と言う人もいるかもしれません。キーワードは? Baidu の単語分割を注意深く調べていないと、2 つの単語の違いがわからないかもしれませんが、検索結果に少し注意を払うと、Baidu が「2 番目」を比較していることがわかります。 「中古住宅」と「中古住宅」。「中古住宅」という 2 つの単語は別々に分類されます。百度は独自の語彙を確立しているため、「中古住宅」という単語を全体として扱いますが、 「中古住宅」という単語を、百度は「中古」と「住宅」という 2 つの単語に分割しました。当然、他の人が「中古住宅」というキーワードを検索しても私のページを見つけることはできません。この細かい点から、Baidu の単語分割について徹底的に研究する必要があると感じました。大まかに次の点をまとめました。
1. Baidu の単語の分割は、コンテンツ内のキーワード関連単語の最初の出現に基づいています。たとえば、「今日の新熱血 江湖 SF」という単語がテキストの最初に表示される場合、ページ上のキーワードは「今日」と「新熱血『江湖 SF』」の 2 つの単語に分割され、タイトルにはキーワードは完全に一致する必要はありませんが、コンテンツに出現するキーワードは Baidu の単語セグメンテーションと完全に一致する必要があり、完全一致では、ファイル URL パスの深さに基づいて並べ替えられます。キーワードは完全に一致します。たとえば、ディレクトリはファイルよりも優先され、ルート ディレクトリ内のファイルは 2 次ディレクトリ内のファイルよりも優先され、完全に一致するものが最初にランク付けされ、次に部分一致になります。
2. キーワードが完全に一致しない場合、たとえば、ブラウザがこのキーワードをダウンロードする場合、Web ページに最初に表示されるキーワードはブラウザであり、キーワード密度が高くなります。この Web ページには「ダウンロード」というキーワードはなく、別の Web ページで最初に表示されるキーワードはダウンロードです。この場合、この Web ページのキーワードは次の 2 つの単語に分割されます。ただし、2 番目の単語には「browser」が含まれます。 " と "ダウンロード" を使用しても、最初の Web ページは 2 番目の Web ページよりも前にランク付けされます。これは、キーワードの最初の部分が最も重要であることを示しています。
3. キーワードの最初の部分の頻度がランキングの鍵となります。たとえば、2 つの Web ページが完全に一致せず、両方に 2 つの分詞が含まれている場合、Web ページ「browser」の頻度が高くなります。分詞の密度は Will が前になります。
4. 完全に一致するが、キーワードがページ コンテンツの最後の部分に最初に出現する場合、この Web ページのランキングは前のページのランキングよりも低くなります。したがって、キーワードをコンテンツのできるだけ早い段階で表示することが非常に重要です。
5. Baidu は、最初に出現した関連キーワードに基づいて単語を切り取ります。最初に出現した関連キーワードがキーワードの末尾の場合は、後ろから切り取りを開始します。前部分の場合は、キーワードの後ろから切り取りを開始します。フロント、つまりベース Web コンテンツを順と逆の順序で単語に分割します。順の場合はキーワードの前半が開始点として使用され、逆の場合はキーワードの後半が使用されます。出発点として。例:「今日新しくオープンした熱血江湖sf」がキーワード Webページに初めて表示されるキーワードが「熱血江湖sf」の場合、ページ内のキーワードは「熱血江湖sf」に分割されます。 -血の江湖sf」と「本日新規オープン」の文字。
6. Baidu の単語分割原則に従って、使いやすいキーワード ヘッダーを選択できます (つまり、Web ページ コンテンツに初めて表示されるキーワードを調整します)。つまり、百度は人為的に単語を分割するときに、前から後ろまで判断し、後ろから前までカットします。
7. 単語区切りの前半と後半に繰り返しがある場合、繰り返しがあるものはないものよりも順位が低くなりますが、繰り返しがある場合は最初の密度に基づいて判断されます。半分。例:「本日新規オープン熱血江湖sf」にカットした場合「本日新規オープン熱血江湖sf | 新規オープン本日熱血江湖sf」にカットした場合(単語の前半部分がカットされています)こうやって出すのは長すぎるので順位が不利です)なら「今日の新規オープン熱血ジャンフー|新規オープン熱血ジャンフーフ」に切り込むより確実に順位は上がります ジャンフー|sfのランキング貧しいです
8. キーワードが完全に一致せず、キーワードが不完全に表示される場合。例: 今日の新しい熱血江湖 SF。Web ページのコンテンツにキーワードに「今日」という単語が含まれていない場合、単語は次のようになります。 「新規開設」から始まりますが、キーワードの最初の部分に が含まれていないため、このような Web ページは比較的ランクが低くなります。
9. 単語が欠落している場合でも、単語が欠落していない Web ページと比較した場合でも、単語が分割される前の部分の密度に従って、つまり単語分割の順序に従ってソートされる必要があります。 , 単語が切り取られている場合は、単語の最初の部分がソートされます。 後ろの部分の密度の比率。たとえば、Web ページでは、前部分と後ろのキーワードの比率が重要です。部分が 1:2 で、別の Web ページの比率が 1:4 であれば、当然、フロント Web ページの方が上位に表示されるはずです。単語が欠落している場合も、切り出す前の短い単語の方が順位が有利になります。
10. 語句に不足はないが、キーワードの後半部分が前部分よりも先に出現する場合、たとえば「今日の新作熱血江湖SF」が先に出現するが、「今日の新作熱血SF」という単語の密度が高くなってしまう。血の江湖」は上位ではありませんが、単語が欠落しているものよりも順位が低くなります。
11. 次の単語も前に表示されますが、前の単語と後の単語の比率が重要です。たとえば、Web ページに「sf」と「今日の新しい熱血ジャンフー」などの 2 つの単語が含まれている場合、比率は 1:1 に「熱血江湖新規オープン」「sf」「本日新規オープン」が含まれている場合、比率は 2:1:1 となり、前の Web ページがキーワードの数で有利になります。キーではなく、それらが出現する位置、単語セグメントの比率が非常に重要です。後分詞の割合が多くなるほど、順位は悪くなります。
12. 本文中にキーワードが出現するのが遅すぎることも好ましくありません。また、主要な単語の密度が低すぎることも好ましくありません。主要な単語の密度が類似している場合に、以前の Web ページを比較しました。
私が調べたことはこれだけです。理解できるかどうかはわかりませんが、それでも、Baidu の単語分割に基づいて Web ページのキーワードの重みを調整することができます。熱い言葉を紡ぐことができる。 Xiaotuo ともっとコミュニケーションが取れることを願っています。最後に、共有してくれてありがとう。
転載する場合は出典を明記してください: インターネットプロモーション計画-ウェブサイト最適化方法-Xiaotuo ウェブサイトプロモーションブログ
この記事の元のアドレス: http://www.xiaotuo.net/seoyouhua/24/
Xiaotuo の貢献に感謝します