背景情報:
Ce氏——Ceenの「世界的に有名な靴淘宝顧客」プロモーションコンテストの特別審査員
プロモーションコンテストの最初のシーズン中、彼は困難で複雑な病気の治療を専門として、出場者のパフォーマンスを毎週合理的にレビューし、多くの出場者に知られていました。彼は控えめでミステリアスな人物で、数年間ウェブサイトのプロモーションに注力してきました。彼は現在、Ce Enの「世界的に有名な靴淘宝顧客」プロモーションコンテストの第2シーズンの審査員を務めているが、消息は不明である。
中国語の単語のセグメンテーションに関しては、SEO の仕事に従事している人なら誰でも、この知識を深く理解し、検索エンジンが単語間の関係をどのように特定し、文の意味を判断するかを理解する必要があると思います。なぜなら、中国語の単語の分割を完全に理解し、一貫して適用することによってのみ、タイトルの作成を含むキーワードの収集、分析、レイアウトをより快適に行うことができ、より良いソフト記事を書くことができるからです。中国語の単語のセグメンテーションはすでに SEO 知識の中核知識となっています。
SEOER は検索エンジンの仕組みを理解する必要があります。これは特に重要かつ基本的なことです。
まず、中国語の単語の分割の概念を理解しましょう。中国語の単語の分割とは何ですか?
中国語の単語分割技術は自然言語処理技術のカテゴリーに属し、人間は自分の知識を使ってどの単語が単語で、どの単語が単語ではないかを理解できます。しかし、その処理プロセスはどのように行われるのでしょうか。単語分割アルゴリズム。
現在、検索エンジンは中国語の単語分割に関して 3 つのカテゴリに分類できます。文字列一致に基づいた単語分割方法、理解に基づいた単語分割方法、統計に基づいた単語分割方法です。
1. 文字列一致による単語分割手法
検索エンジンがユーザーの検索を受け入れると、ユーザーが検索した「単語」がデータベース内の「単語」と一致するかどうか、および一致がどの程度スキャンに近いかを判断します。
入力された「キーワード」または「文」の長さの違いに応じて、優先度のマッチングは最大 (最長) マッチングと最小 (最短) マッチングに分類できます。
次のように:
1) 前方最大マッチング法 (左から右の方向)。
例: Ceen の「世界的に有名な靴淘宝網顧客」プロモーション コンテスト。
最大順方向で区切られたキーワードは次のとおりです: Ce En、世界的に有名な靴淘宝網の顧客、プロモーション コンテスト (写真には表示されていません。Baidu で検索してスナップショットを確認できます)
2)逆最大一致法(右から左方向);これは、キーワードの順序が逆であり、検索エンジンのデータベースに問い合わせることによって得られる結果が同じであることを除いて、最初の点と同じ単語分割法である。
3) 最小限のセグメンテーション (各文の単語数を最小限に抑える)。
例: Ceen の「世界的に有名な靴淘宝網顧客」プロモーション コンテスト
最も細分化されていない単語は、Ce En、世界、有名な靴、淘宝網の顧客、プロモーション、競争です。
4) 双方向最大マッチング方式(左から右、右から左の2回のスキャン)
2. 理解に基づく単語分割法
この単語分割方法は、コンピューターが人間による文章の理解をシミュレートできるようにすることで、単語認識の効果を実現します。基本的な考え方は、単語を分割しながら構文解析と意味解析を実行し、構文情報と意味情報を使用して曖昧さに対処することです。この方法は、2009 年に擬似オリジナルの同義語が一般的に変更され、2010 年には擬似オリジナリティの範囲を拡大する必要がありました。今年 6 月末、Baidu の大幅なアップデートの後、多くの学生が、Baidu によって大量にリリースされたオリジナルのコレクション サイトや Web コンテンツが大量に公開され、Baidu のコンテンツが含まれなくなったことを発見しました。単語分割技術の手法はますます成熟してきています。オリジナリティを偽ることはますます困難になってきています。
3. 統計に基づく単語分割法
形式的な観点から見ると、単語は安定した単語の組み合わせであるため、文脈上、隣接する単語が同時に出現する回数が多いほど、それらが単語を形成する可能性が高くなります。したがって、単語間で共起する隣接単語の頻度または確率は、単語の信頼性をよりよく反映することができます。検索エンジンは、この方法により、「ドロップダウン ボックス」または「関連検索」にそれらを完全に表示できます。近年、多くのインターネット企業が「Baidu 関連キーワードのブラッシング」と呼ばれるビジネスを行っていることがわかりました。ユーザーが特定のキーワードを入力すると、希望するキーワードが Baidu のドロップダウン ボックスに表示されるように指定できます。これは統計的な単語分割の原則に基づいています。
最後に、タイトルへのキーワードの適用について説明し、中国語の単語の分割と Web サイトのタイトルの関係を理解しましょう。
1. 検索語は Web サイトのタイトルと完全に一致します。
ユーザーが Baidu で検索するとき、検索語が Web サイトのタイトルと完全に一致し、Web サイトが一定のウェイトに達すると、上位に表示されます。これは、タイトルにキーワードが含まれている必要があることも説明します。その理由は次のとおりです。逆に、検索された単語が Web サイトのタイトルと完全に一致しない場合、検索エンジンは単語の分割を実行します。単語の分割方法は、中国語の単語の分割原則の包括的な方法に参加します。
2. 単語の分割は、検索語が一致しない場合にのみ実行されます。
単語が Web サイトのタイトルと一致しない場合、単語の分割方法には、順方向、逆方向、統計、理解、同義語、新語および曖昧な単語が含まれます。現時点では、検索エンジンが理解することがさらに難しくなり、Web ページのランキングに影響を及ぼします。
そうは言っても、私は以前、Cern Taobao の顧客コンテストの QQ グループ 189321234 に、淘宝網でよく検索されたキーワードをいくつか投稿したと述べましたが、前回のインタビューで、Cern Taobao の顧客は、これらの単語の検索数について次のように述べました。タオバオは非常に大きいですが、百度ではほぼゼロです。そのとき私は「業界ワード+Ce En、業界ワード+Ce En 革靴」といったキーワードの最適化を提案し、それについては今後書くと言いました。この記事では具体的にそれを明確にしていますので、より明確にするために別の例を示します。
タイトル:カジュアルレザーシューズZeen Bowen、おしゃれなメンズ韓国スタイル
最大マッチング方法によると、カジュアルな革靴、Zeenbowen、おしゃれな男性、韓国風に分けられます。少なくとも 4 つの単語が含まれています:「カジュアル レザー シューズ、カジュアル レザー シューズ Cern、Cern Bowen、Cern レザー シューズ Bowen」。これは、Baidu で人気のワード「カジュアル レザー シューズ」だけでなく、正確な単語「カジュアル レザー シューズ」も最適化しています。 Cern 、同時に、淘宝網のホットワードと正確な単語「Cern Bowen、Cern Leather Shoes Bowen」も最適化し、ユーザーが検索した単語と一致するように最善を尽くしました。これが当時私が意味したことです。
淘宝網顧客向けの専用フォーラムをお勧めします。Tuike SEO フォーラムhttp://www.tuikeseo.com には、淘宝網顧客の活動、交流、経験の共有のほか、無料の淘宝網顧客テンプレート、プログラム、プロモーション ソフトウェア、チュートリアルのダウンロードなど、さらにアクセスすることをお勧めします。
A5 ウェブマスター ネットワーク & CEEN「世界的に有名な靴淘宝網顧客」プロモーション コンテスト - シーズン 2 が本格化しています。急いでご覧ください: