우리는 구글의 한-영 번역 서비스를 비판해왔습니다. 때로는 구글이 번역한 내용이 외국어를 직접 읽는 것보다 이해하기 더 어렵지만, 구글의 번역 품질이 향상되었다는 점은 모두가 명백히 알 수 있습니다.
Baidu는 Google과 경쟁하며 Ferry가 중국어를 더 잘 이해한다는 점을 항상 강조해 왔습니다. 이는 단어 분할 기술과 Baidu 알고리즘의 정확한 일치를 기반으로 하며 모두가 동의합니다.
그저께 학생들을 가르칠 때 기사 명명 방법에 대해 이야기했는데, 학생들이 제가 말한 내용이 리신강 선생님(웹 교육 사이트 책임자)의 내용과 다소 다르다고 해서 온라인으로 요청했습니다. 확인. Google은 병음을 더 잘 이해하는 것으로 나타났습니다. 실험은 다음과 같이 수행되었습니다.
Baidu와 Google에서 "wangluoyingxiao"를 검색하면 "찾으시나요: 인터넷 마케팅"이 표시됩니다.
Baidu와 Google에서 "wangluoyingxiaocehua"를 검색하면 "찾고 계십니까: 인터넷 마케팅 계획?"이 표시됩니다.
Baidu와 Google에서 "wangluoyingxiaocehuashu"를 검색하면 "찾고 계십니까: 인터넷 마케팅 계획?"이 표시됩니다.
Google에서 "wangluoyingxiaocehuashude"를 검색하면 "찾고 계십니까: 인터넷 마케팅 계획"이 표시되지만 Baidu에는 검색 결과가 없습니다.
Google에서 "wangluoyingxiao-cehuashu"를 검색하면 "찾고 계십니까: 인터넷 마케팅 계획 도서"가 표시되고, Baidu는 "찾으십니까: 인터넷 마케팅 계획 도서"가 표시됩니다.
Google에서 "wangluoyingxiao-cehuasude"를 검색하면 "찾고 계십니까: 인터넷 마케팅 계획서"가 표시되지만 Baidu에는 검색 결과가 없습니다.
이 시점에서 우리는 Google이 Baidu보다 Pinyin을 더 잘 이해한다고 말할 수 있습니다! Google의 Pinyin 지원을 계속 탐색하기 위해 Feng Bin은 다음과 같은 실험을 계속할 계획입니다.
검색창에 "wangluocehuawangluoyingxiaocehuajiulaiwang-yingwangluowang"(네트워크 계획, 네트워크 마케팅 계획, 네트워크에 오세요 - 네트워크 네트워크 승리)을 입력하세요. 이는 Google에서 지원하는 병음 수 - 한자 17자의 병음입니다. 그리고 한자 처음 13자의 병음 뒤에 "-"를 추가해야 합니다. 그렇지 않으면 표시되지 않습니다. 13병음 문자의 "xiao"가 "xi'ao"로 나누어지면 잘못 표시됩니다.
검색창에 "wangluoyingxiaowangluoyingxiaocehuajiulaiwang-yingwangluowang"(온라인 마케팅, 네트워크 마케팅 계획, 네트워크에 오세요 - 네트워크 네트워크 승리)을 입력했지만 Google에 검색 결과가 없습니다.
검색창에 "wangluoyingxianwangluoyingxiaocehuajiulaiwang-yingwangluowang"(wangyingxianwangluoyingxiaocehuajiulaiwang-yingwangluowang)을 입력하면 Google에서 지원하는 병음 수, 즉 한자 18자의 병음입니다.
그래서 구글의 병음 지원이 글자 수와 관련이 있는 것인지, 아니면 한자 수와 관련이 있는 것인지 궁금해지기 시작했습니다. 글자 수를 지원한다면 철자를 임의로 변경할 수 없습니다. 예를 들어 마지막 "wangluowang"을 "wangwangwang"으로 변경합니다. "는 여전히 정상적으로 표시됩니다. 하지만 "cehua"를 "huihua"로 변경하면 표시되지 않습니다. "jiulai"를 "wangwang"으로 바꾸면 여전히 정상적으로 표시될 수 있습니다.
"cehua"를 "huihua"로 변경하면 표시할 수 없으므로 검색 엔진이 문자 수를 기준으로 검색 결과를 지원할 수 있다는 의미이지만, "jiulai"를 "wangwang"으로 변경하여 정상적으로 표시한다는 것은 검색 엔진이 문자 수 기준으로 검색 결과를 지원하지 않는다는 의미입니다. 캐릭터에. 즉, 구글은 한자 수를 기준으로 지원합니다. 그런데 "Ji Lai"와 "Chang"은 단지 두 개의 한자일 뿐입니다. 그렇다면 무슨 일이 일어나고 있는 걸까요?
그래서 미친 실험을 해봤더니 "wangluoyingxianwangluoyingxiaocehuawangwangwangwangwangwang-yingwangwangwang"(인터넷 캠프 시안 인터넷 마케팅 기획 자주 자주-yinwangwang.com)을 구글에 입력했더니 정상적으로 "wangluocehuawangluoyingxiaocehuawangluocehuawangluoyingxiaocehua"(인터넷 기획 인터넷 마케팅 기획 인터넷 기획 인터넷)이 나오더군요. 마케팅 기획) 표시할 수 없습니다.
Baidu에서는 'google-zhongwen'의 일치 결과가 정상적으로 표시되며, 'zhongwen123'을 검색해도 결과가 표시됩니다. 이는 Baidu가 여전히 구문 일치를 지원하지만 예를 들어 'zhongwenwang123'과 같이 길면 안 된다는 것을 보여줍니다. 표시할 수 없습니다.
구글은 이를 인식할 수 있지만, 구글이 인식하면 사람들의 공통 언어에 따라 문구를 판단하여 표시합니다. Google 병음 인식은 일반 문구를 기반으로 하며, 일반 문구를 구성하지 않으면 인식되지 않습니다. 이 테스트 후 Google 병음 인식은 일반 구문 병음 상태에서 최대 24개의 한자를 인식할 수 있습니다.