เราวิพากษ์วิจารณ์บริการแปลภาษาจีน-อังกฤษของ Google บางครั้งสิ่งที่แปลโดย Google นั้นเข้าใจยากกว่าการอ่านภาษาต่างประเทศโดยตรง แต่การปรับปรุงคุณภาพการแปลของ Google ก็เห็นได้ชัดสำหรับทุกคนเช่นกัน
Baidu แข่งขันกับ Google และเน้นย้ำอยู่เสมอว่า Ferry เข้าใจภาษาจีนได้ดีขึ้น ซึ่งขึ้นอยู่กับเทคโนโลยีการแบ่งส่วนคำและการจับคู่อัลกอริทึมของ Baidu อย่างแม่นยำ และทุกคนก็เห็นด้วย
เมื่อวานตอนที่ฉันกำลังสอนนักเรียน ฉันพูดถึงวิธีการตั้งชื่อบทความ พวกนักเรียนบอกว่าสิ่งที่ฉันพูดค่อนข้างแตกต่างจากของอาจารย์หลี่ซิงกัง (ผู้อำนวยการเว็บไซต์สอนเว็บ) จึงขอทางออนไลน์ การตรวจสอบ ปรากฎว่า Google เข้าใจพินอินดีขึ้น มีการทดลองดังนี้:
การค้นหา "wangluoyingxiao" ทั้งใน Baidu และ Google จะแสดง "คุณกำลังมองหา: การตลาดทางอินเทอร์เน็ต"
การค้นหา "wangluoyingxiaocehua" บน Baidu และ Google จะแสดง "คุณกำลังมองหา: การวางแผนการตลาดทางอินเทอร์เน็ต?"
การค้นหา "wangluoyingxiaocehuashu" บน Baidu และ Google จะแสดง "คุณกำลังมองหา: แผนการตลาดทางอินเทอร์เน็ตหรือไม่"
การค้นหา "wangluoyingxiaocehuashude" บน Google จะแสดง "คุณกำลังมองหา: แผนการตลาดทางอินเทอร์เน็ต" แต่ Baidu ไม่มีผลการค้นหา
การค้นหา "wangluoyingxiao-cehuashu" บน Google จะแสดง "คุณกำลังมองหา: หนังสือวางแผนการตลาดทางอินเทอร์เน็ต" และ Baidu จะแสดง "คุณกำลังมองหา: หนังสือวางแผนการตลาดทางอินเทอร์เน็ต"
การค้นหา "wangluoyingxiao-cehuasude" บน Google จะแสดง "คุณกำลังมองหา: หนังสือวางแผนการตลาดทางอินเทอร์เน็ต" แต่ Baidu ไม่มีผลการค้นหา
ณ จุดนี้เราสามารถพูดได้ว่า Google เข้าใจพินอินดีกว่า Baidu! เพื่อที่จะสำรวจการสนับสนุนพินอินของ Google ต่อไป Feng Bin วางแผนที่จะทำการทดลองต่อไป ผลลัพธ์มีดังนี้:
ในแถบค้นหา ให้ป้อน "wangluocehuawangluoyingxiaocehuajiulaiwang-yingwangluowang" (การวางแผนเครือข่าย การวางแผนการตลาดแบบเครือข่าย มาที่เครือข่าย - ชนะเครือข่ายเครือข่าย) ซึ่งเป็นจำนวนพินอินที่ Google รองรับ - พินอินของตัวอักษรจีน 17 ตัว และคุณต้องเพิ่ม "-" หลังพินอินของตัวอักษรจีน 13 ตัวแรก ไม่เช่นนั้นจะไม่แสดงขึ้นมา หาก "xiao" ในอักขระพินอิน 13 ตัวถูกแบ่งออกเป็น "xi'ao" จะแสดงไม่ถูกต้อง
ป้อน "wangluoyingxiaowangluoyingxiaocehuajiulaiwang-yingwangluowang" (การตลาดออนไลน์ การวางแผนการตลาดแบบเครือข่าย มาเครือข่าย - ชนะเครือข่ายเครือข่าย) ในช่องค้นหา แต่ไม่มีผลการค้นหาใน Google
ในแถบค้นหา ให้ป้อน "wangluoyingxianwangluoyingxiaocehuajiulaiwang-yingwangluowang" (wangyingxianwangluoyingxiaocehuajiulaiwang-yingwangluowang) คือจำนวนพินอินที่ Google รองรับ ซึ่งเป็นพินอินของตัวอักษรจีน 18 ตัว
เลยเริ่มสงสัยว่าการรองรับพินอินของ Google เกี่ยวข้องกับจำนวนตัวอักษรหรือจำนวนตัวอักษรจีนหรือไม่ ถ้ามันรองรับจำนวนตัวอักษร คุณไม่สามารถเปลี่ยนการสะกดแบบไม่ได้ตั้งใจได้ เช่น เปลี่ยน "wangluowang" ตัวสุดท้ายเป็น "wangwangwang" " จะยังคงแสดงตามปกติ แต่ถ้าคุณเปลี่ยน "cehua" เป็น "huihua" มันจะไม่แสดงขึ้นมา หากคุณแทนที่ "jiulai" ด้วย "wangwang" ก็ยังสามารถแสดงได้ตามปกติ
เนื่องจากไม่สามารถแสดง "cehua" เป็น "huihua" ได้ หมายความว่าเครื่องมือค้นหาอาจรองรับผลการค้นหาตามจำนวนตัวอักษร แต่การเปลี่ยน "jiulai" เป็น "wangwang" เพื่อแสดงตามปกติหมายความว่าไม่รองรับผลลัพธ์ตาม บนตัวละคร กล่าวอีกนัยหนึ่ง Google รองรับตามจำนวนตัวอักษรจีน แต่ "จี้ไหล" และ "ฉาง" เป็นเพียงอักษรจีนสองตัวเท่านั้น!
ดังนั้นฉันจึงทำการทดลองที่บ้าคลั่งและป้อน "wangluoyingxianwangluoyingxiaocehuawangwangwangwangwang-yingwangwangwang" (Internet Camp Xi'an Internet Marketing Planning มักจะมักจะ-yinwangwang.com) ลงใน Google มันแสดงให้เห็นตามปกติ การป้อน "wangluocehuawangluoyingxiaocehuawangluocehuawangluoyingxiaocehua" (Internet Planning Internet Marketing Planning Internet Planning Internet การวางแผนการตลาด) ไม่สามารถแสดงได้
ใน Baidu ผลลัพธ์การจับคู่ของ "google-zhongwen" จะแสดงตามปกติ และยังมีผลลัพธ์เมื่อค้นหา "zhongwen123" นี่แสดงว่า Baidu ยังคงรองรับการจับคู่วลี แต่ต้องไม่ยาวเกินไป ตัวอย่างเช่น "zhongwenwang123" ไม่สามารถแสดงได้
Google สามารถจดจำสิ่งเหล่านี้ได้ แต่เมื่อ Google จดจำสิ่งเหล่านี้ได้ ระบบจะตัดสินวลีตามภาษาทั่วไปของผู้คนและแสดงวลีเหล่านั้น การรู้จำพินอินของ Google จะขึ้นอยู่กับวลีทั่วไป หากไม่สร้างวลีปกติ ระบบจะไม่รับรู้ หลังจากการทดสอบนี้ การรู้จำพินอินของ Google สามารถจดจำอักขระภาษาจีนได้สูงสุด 24 ตัวในสถานะพินอินวลีปกติ