배경 정보:
Ce씨——Ceen의 “세계 유명 신발 타오바오 고객” 판촉 대회 특별 심사위원
승격대회 첫 시즌에는 참가자들의 성과에 대해 매주 간소화된 리뷰를 진행했으며 어렵고 복잡한 질병을 전문적으로 치료해 많은 참가자들에게 알려졌습니다. 그는 수년 동안 웹사이트 홍보에만 전념해 온 조용하고 신비스러운 인물이다. 그는 현재 세은의 시즌2 '세계 유명 신발 타오바오 고객' 프로모션 대회의 심사위원을 맡고 있지만 행방은 불분명하다.
중국어 단어 분할에 관해서는 SEO 작업에 종사하는 사람이라면 누구나 이 지식에 대해 깊이 이해하고 검색 엔진이 단어 간의 관계를 식별하는 방법과 문장의 의미를 결정하는 방법을 이해해야 한다고 생각합니다. 중국어 단어 분할을 완벽하게 이해하고 일관되게 적용해야만 제목 작성을 포함한 키워드 수집, 분석, 레이아웃이 더 편안해지고 더 나은 소프트 기사를 작성할 수 있기 때문입니다. 중국어 단어 분할은 이미 SEO 지식의 핵심 지식입니다.
SEOER는 검색 엔진의 작동 방식을 이해해야 합니다. 이는 특히 중요하고 기본입니다.
먼저 중국어 단어 분할의 개념을 이해해 봅시다. 중국어 단어 분할이란 무엇입니까?
중국어 단어 분할 기술은 자연어 처리 기술의 범주에 속합니다. 문장의 경우 사람은 자신의 지식을 사용하여 어떤 단어가 단어인지 이해할 수 있지만 컴퓨터는 어떻게 이를 이해할 수 있습니까? 단어 분할 알고리즘.
현재 검색 엔진은 중국어 단어 분할을 위해 문자열 매칭에 기반한 단어 분할 방법, 이해에 기반한 단어 분할 방법, 통계에 기반한 단어 분할 방법의 세 가지 범주로 나눌 수 있습니다.
1. 문자열 매칭을 기반으로 한 단어 분할 방법
검색 엔진이 사용자의 검색을 수락하면 먼저 사용자가 검색한 "단어"가 데이터베이스의 "단어"와 일치하는지 여부와 검색에 얼마나 가까운지 확인합니다.
입력된 "키워드" 또는 "문장"의 길이에 따라 우선순위 매칭은 최대(최장) 매칭과 최소(최단) 매칭으로 나눌 수 있습니다.
다음과 같이:
1) 순방향 최대 매칭 방법(왼쪽에서 오른쪽 방향);
예: Ceen의 “세계적으로 유명한 신발 Taobao 고객” 프로모션 콘테스트.
최대 전진 방향으로 구분된 키워드는 Ce En, 세계 유명 신발 Taobao 고객, 프로모션 경쟁(사진에는 표시되지 않음, Baidu에서 검색한 후 스냅샷 확인 가능)
2) 역최대 매칭 방식(오른쪽에서 왼쪽 방향); 키워드의 순서가 반대라는 점을 제외하고는 첫 번째 지점과 동일한 단어 분할 방식이며, 검색 엔진 데이터베이스를 쿼리하여 얻은 결과는 동일합니다.
3) 최소 분할(각 문장의 단어 수 최소화)
예: Ceen의 “세계 유명 신발 타오바오 고객” 프로모션 콘테스트
가장 적게 분할된 단어는 Ce En, 세계, 유명 신발, Taobao 고객, 판촉, 경쟁입니다.
4) 양방향 최대 매칭 방식(왼쪽에서 오른쪽으로, 오른쪽에서 왼쪽으로 2회 스캔)
2. 이해를 바탕으로 한 단어 분할 방법
이 단어 분할 방법은 컴퓨터가 인간의 문장 이해를 시뮬레이션할 수 있도록 하여 단어 인식 효과를 얻습니다. 기본 아이디어는 단어를 분할하면서 구문 및 의미 분석을 수행하고, 구문 정보와 의미 정보를 사용하여 모호성을 처리하는 것입니다. 이 방법은 2009년에 유사 원본 동의어가 전반적으로 변경되었으며, 2010년에는 유사 원본 동의어의 범위가 더 커져야 효과적이었습니다. 올해 6월 말, Baidu의 대규모 업데이트 이후 많은 학생들이 Baidu에서 가짜 원본 강도가 거의 없는 원본 컬렉션 사이트나 웹 콘텐츠를 대량으로 출시하여 더 이상 Baidu에 포함되지 않는다는 사실을 발견했습니다. 단어 분할 기술 방식은 점점 더 발전하고 있습니다. 독창성을 위조하는 것이 점점 더 어려워지고 있습니다.
3. 통계 기반 단어 분할 방법
형식적인 관점에서 볼 때 단어는 안정적인 단어의 조합이므로 문맥상 인접한 단어가 동시에 나타나는 횟수가 많을수록 단어를 형성할 확률이 높아집니다. 따라서 단어 사이에 인접한 단어가 동시 발생하는 빈도나 확률이 단어의 신뢰성을 더 잘 반영할 수 있습니다. 검색 엔진은 이 방법을 통해 "드롭다운 상자" 또는 "관련 검색"에 해당 항목을 완전히 표시할 수 있습니다. 최근 몇 년 동안 많은 인터넷 회사에서 "Brushing Baidu 관련 키워드"라는 비즈니스를 운영하고 있는 것으로 나타났습니다. 사용자가 특정 키워드를 입력하면 Baidu 드롭다운 상자에 원하는 키워드가 표시되도록 지정할 수 있습니다. 이는 통계적 단어 분할 원리를 기반으로 합니다.
마지막으로 제목에 키워드를 적용하는 방법에 대해 이야기하고 중국어 단어 분할과 웹 사이트 제목 간의 관계를 이해해 보겠습니다.
1. 검색어가 웹사이트 제목과 정확히 일치합니다.
사용자가 Baidu에서 검색할 때 검색어가 웹사이트의 제목과 완전히 일치하고 웹사이트의 순위가 일정 수준에 도달하면 제목에 키워드가 있어야 한다는 것도 설명됩니다. 반대로, 검색된 단어가 귀하의 웹사이트 제목과 정확히 일치하지 않는 경우 검색 엔진은 단어 분할을 수행합니다. 단어 분할 방법은 중국어 단어 분할 원칙의 포괄적인 방법에 참여합니다.
2. 검색어가 일치하지 않는 경우에만 단어 분할이 수행됩니다.
단어가 웹사이트 제목과 일치하지 않는 경우 단어 분할이 수행됩니다. 단어 분할 방법에는 정방향, 역방향, 통계, 이해, 동의어, 새로운 단어 및 모호한 단어가 포함됩니다. 이때 검색 엔진이 이해하기가 더 어려워지고 이는 웹 페이지 순위에 영향을 미칩니다.
이렇게 말씀드리자면, 제가 예전에 Cern Taobao 고객 경쟁 QQ 그룹 189321234에서 Taobao에 핫 검색어 몇 개를 게시했다고 언급한 적이 있습니다. 지난번 저와의 인터뷰에서 Cern Taobao 고객은 이 단어에 대한 검색 횟수가 다음과 같습니다. Taobao는 매우 크지만 Baidu에서는 거의 0에 가깝습니다. 당시 "업계 단어 + Ce En, 업계 단어 + Ce En 가죽 신발"과 같은 최적화 키워드를 제안하고 앞으로 이에 대해 쓸 것이라고 말했습니다. . 기사에 구체적으로 명시되어 있으므로 더 명확하게 설명하기 위해 다른 예를 들어 보겠습니다.
제목: 캐주얼 가죽신 젠 보웬, 패셔너블한 남자 한국 스타일
최대 매칭 방식에 따라 캐주얼 가죽신, 젠보웬, 패셔너블한 남성, 한국 스타일로 나뉜다. 여기에는 "캐주얼 가죽 신발, 캐주얼 가죽 신발 Cern, Cern Bowen, Cern 가죽 신발 Bowen"이라는 최소 4개의 단어가 포함되어 있습니다. 이는 Baidu에서 인기 있는 단어인 "캐주얼 가죽 신발"뿐만 아니라 정확한 단어인 캐주얼 가죽 신발도 최적화합니다. Cern, 그리고 동시에 Taobao의 인기 단어와 "Cern Bowen, Cern Leather Shoes Bowen"이라는 정확한 단어를 최적화하여 사용자가 검색한 단어와 일치하도록 최선을 다했습니다.
Taobao 고객을 위한 전용 포럼인 Tuike SEO 포럼 http://www.tuikeseo.com 을 추천하고 싶습니다. 여기에는 Taobao 고객 활동, 교환, 경험 공유가 포함되며 무료 Taobao 고객 템플릿, 프로그램, 프로모션 소프트웨어, 튜토리얼 다운로드 등을 더 많이 방문하는 것이 좋습니다.
A5 웹마스터 네트워크 및 CEEN "세계적으로 유명한 신발 Taobao 고객" 프로모션 대회 - 시즌 2가 본격화되고 있습니다. 서둘러 시청하세요: