ก่อนอื่นให้ฉันแสดงข่าวเกี่ยวกับอินเทอร์เน็ตให้คุณดูก่อน อย่างแรกคือส่วนแบ่งการค้นหาเว็บของ Baidu สูงถึง 73.2% Baidu ประมวลผลคำขอค้นหาเว็บ 109.6 พันล้านคำขอ เพิ่มขึ้น 0.6 เปอร์เซ็นต์เมื่อเทียบกับปีที่แล้ว หลังจากเผยแพร่รายงาน ดูเหมือนว่าบล็อกจำนวนมากโจมตี Google ตามตัวเลขนี้ โดยระบุว่าทำได้ไม่ดี
เมื่อดูบทความที่สอง ยังคงเป็นข้อมูลเดิม มีการกล่าวถึงคำขอค้นหา Baidu เพิ่มขึ้น 0.5 เปอร์เซ็นต์ คำขอค้นหาของ Google เพิ่มขึ้น 3.5 เปอร์เซ็นต์ และ Google กลายเป็นเครื่องมือค้นหาที่เติบโตเร็วที่สุด
ข่าวทั้งสองใช้ข้อมูลและเป็นข้อมูลเดียวกันแต่ถ้าดูเฉพาะข่าวแรกและข่าวที่สองข้อสรุปที่ออกมาจะแตกต่างอย่างสิ้นเชิง มาดูบทความที่สามซึ่งเกี่ยวกับข้อมูลส่วนแบ่งการตลาดด้วย ส่วนแบ่งการตลาดของ Baidu ลดลง 2.1%, Google เพิ่มขึ้น 5.6% และช่องว่างระหว่างทั้งสองลดลงเหลือ 7.7% เมื่อดูข่าวไม่กี่รายการก็แสดงตัวเลขที่เกี่ยวข้องกับส่วนแบ่งตลาดของเครื่องมือค้นหาทั้งหมด แต่ถ้าใครที่ไม่คุ้นเคยกับตลาดเครื่องมือค้นหาก็จะเห็นข้อสรุปที่น่าสับสนในที่สุด
เหตุใดบทความข่าวสามบทความจึงอ้างอิงข้อมูลเดียวกันแต่กลับได้ผลลัพธ์ที่ต่างกัน ด้านล่างนี้ Lu Songsong จะวิเคราะห์หลักการหลายประการเกี่ยวกับวิธีวิเคราะห์ข้อมูล
ประการแรก การดูข้อมูลแยกกันไม่มีความหมาย
จากการสนทนาข้างต้น มีการกล่าวถึงประเด็นส่วนแบ่งการตลาดระหว่าง Baidu และ Google ในบทความข่าวแรกว่าส่วนแบ่งการตลาดของ Baidu เพิ่มขึ้น 0.6% ดูเหมือนว่า Baidu กำลังเพิ่มขึ้น ซึ่งโดยธรรมชาติแล้วบอกเป็นนัยว่า Baidu กำลังเพิ่มขึ้น และ Google กำลังลดลง รายงานฉบับที่สองมีความครอบคลุมมากขึ้น หมายความว่าส่วนแบ่งของเครื่องมือค้นหาอื่นๆ กำลังลดลง ในขณะที่ Google และ Baidu กำลังเติบโต และ Google กำลังเติบโตเร็วขึ้น นี่แสดงให้เห็นว่าเราไม่สามารถดูตัวเลขแยกกันได้
ตัวอย่างเช่น การเปรียบเทียบ Sohu และ Sina เข้าด้วยกันนั้นไม่สมเหตุสมผล แยกกัน
ประการที่สอง ความสามารถของข้อมูลจะต้องสามารถเปรียบเทียบได้
สำหรับตัวอย่างส่วนแบ่งการตลาดของเครื่องมือค้นหาที่กล่าวถึงก่อนหน้าในบทความนี้ บางส่วนถูกกำหนดโดยคำขอการค้นหา และบางส่วนถูกกำหนดโดยรายได้ จึงไม่สมเหตุสมผลที่จะเปรียบเทียบข้อมูลที่แตกต่างกันด้วยกัน หากไม่สามารถมองเห็นชิ้นส่วนของข้อมูลได้ตามธรรมชาติ คุณควรดูคำจำกัดความของข้อมูลนั้น แม้ว่าบริษัทต่างๆ จะใช้คำจำกัดความเดียวกัน แต่ผลลัพธ์ก็จะแตกต่างออกไป สิ่งสำคัญคือเราต้องแน่ใจว่าความสามารถมีความสม่ำเสมอในการเปรียบเทียบ
ประการที่สาม ความแตกต่างในวิธีการรวบรวมข้อมูล
แบบสำรวจหลังจากรายงานเหตุการณ์สำคัญมักปรากฏบนเว็บไซต์ต่างๆ เช่น แบบสำรวจ 360 และ QQ ว่าควรเลือกถอนการติดตั้งใคร จริงๆ แล้วผลลัพธ์มักไม่สามารถสะท้อนถึงสถานการณ์จริงได้ เพราะโดยทั่วไปแล้ว มีเพียงผู้ที่ใส่ใจเกี่ยวกับข่าวเท่านั้นที่สามารถแสดงวิธีการได้ มาอ่านข่าว มาลงคะแนนและใช้ผลการลงคะแนนเพื่อแสดงความเห็นโดยรวมเพื่อเป็นแนวทางให้คนอีกกลุ่มหนึ่งที่ไม่รู้ความจริงติดตามกระแสหลัก ผู้ผลิตสามารถใช้ผลการสำรวจออนไลน์เพื่อโปรโมตตนเองและวิพากษ์วิจารณ์คู่ต่อสู้ของตนได้อย่างง่ายดาย
ดังนั้นจึงเป็นการดีที่สุดที่จะถามคำถามหลายข้อเกี่ยวกับตัวเลข เมื่อคุณพบตัวเลข จะเป็นการดีที่สุดที่จะไม่ใช้มันโดยตรง ก่อนอื่น คุณควรรู้ว่าข้อมูลมาจากไหน ได้มาอย่างไร ความหมายและคำจำกัดความของข้อมูลคืออะไร และมีการละเว้นหรือไม่ เช่นเดียวกับตัวอย่างก่อนหน้าของส่วนแบ่งการตลาดของเครื่องมือค้นหา คุณสามารถสรุปได้ถูกต้องหลังจากทำความเข้าใจว่าส่วนแบ่งใดและเกณฑ์เป็นอย่างไร
สำหรับบทความต้นฉบับ โปรดระบุว่าตีพิมพ์ซ้ำจากบล็อกของ Lu Songsong
ขอขอบคุณ Lu Songsong สำหรับการสนับสนุนของเขา