Izinkan saya menunjukkan kepada Anda beberapa berita tentang Internet. Yang pertama adalah pangsa pencarian web Baidu mencapai 73,2%. Baidu memproses 109,6 miliar permintaan pencarian web, meningkat 0,6 poin persentase dibandingkan tahun lalu. Setelah laporan tersebut dirilis, banyak blog yang menyerang Google berdasarkan nomor ini, dengan mengatakan bahwa kinerjanya tidak baik.
Melihat artikel kedua, datanya masih sama. Disebutkan permintaan pencarian Baidu meningkat 0,5 poin persentase, permintaan pencarian Google meningkat 3,5 poin persentase, dan Google menjadi mesin pencari dengan pertumbuhan tercepat.
Kedua berita tersebut menggunakan data, dan merupakan data yang sama, namun jika hanya melihat berita pertama dan kedua, kesimpulan yang diambil sama sekali berbeda. Mari kita lihat artikel ketiga yang juga membahas tentang data pangsa pasar. Pangsa pasar Baidu turun 2,1%, Google meningkat 5,6%, dan kesenjangan antara keduanya menyempit menjadi 7,7%. Melihat beberapa berita yang sama, semuanya menunjukkan angka-angka yang terkait dengan pangsa pasar mesin pencari. Namun jika seseorang yang tidak familiar dengan pasar mesin pencari melihatnya, pada akhirnya dia akan sampai pada kesimpulan yang sangat membingungkan.
Mengapa tiga artikel berita mengutip data yang sama tetapi memberikan hasil yang berbeda? Di bawah ini Lu Songsong akan menganalisis beberapa prinsip cara menganalisis data.
Pertama, tidak ada gunanya melihat sepotong data secara terpisah.
Melanjutkan pembahasan di atas, masalah pangsa pasar antara Baidu dan Google disebutkan pada artikel berita pertama bahwa pangsa pasar Baidu meningkat sebesar 0,6%. Tampaknya Baidu meningkat, yang tentu saja berarti Baidu meningkat dan Google menurun. Laporan kedua lebih komprehensif, artinya pangsa mesin pencari lain menurun, sementara Google dan Baidu tumbuh, dan Google tumbuh lebih cepat. Hal ini menunjukkan bahwa kita tidak dapat melihat suatu angka secara terpisah.
Misalnya, tidak masuk akal untuk membandingkan Sohu dan Sina secara bersamaan. Sohu memiliki game online, nirkabel, dan periklanan, sedangkan Sina terutama berfokus pada nirkabel dan periklanan secara terpisah.
Kedua, kualitas data harus sebanding.
Untuk contoh pangsa pasar mesin pencari yang disebutkan sebelumnya dalam artikel ini, beberapa ditentukan oleh permintaan pencarian, dan beberapa lainnya ditentukan oleh pendapatan. Tidak masuk akal untuk membandingkan data yang berbeda secara bersamaan. Jika suatu data tidak dapat dilihat secara alami, Anda harus melihat definisinya. Sekalipun definisi yang sama digunakan oleh perusahaan yang berbeda, hasilnya akan berbeda. Yang penting kita harus memastikan kalibernya konsisten saat membandingkan.
Ketiga, perbedaan metode pengumpulan data
Survei setelah laporan peristiwa panas sering muncul di berbagai situs, seperti survei 360 dan QQ tentang siapa yang harus dipilih untuk dicopot pemasangannya. Faktanya, hasilnya seringkali tidak mencerminkan keadaan sebenarnya, karena secara umum, hanya orang yang peduli dengan berita yang dapat mengungkapkan caranya untuk membaca berita. Ayo pilih dan gunakan hasil pemungutan suara mereka untuk mewakili opini secara keseluruhan, sehingga membimbing kelompok orang lain yang tidak mengetahui kebenaran untuk mengikuti pandangan arus utama. Hasil survei online dapat dengan mudah digunakan oleh produsen untuk mempromosikan diri dan mengkritik lawannya.
Oleh karena itu, yang terbaik adalah menanyakan beberapa pertanyaan tentang suatu nomor. Saat Anda menemukan suatu angka, sebaiknya jangan menggunakannya secara langsung. Pertama-tama, Anda harus mengetahui dari mana data tersebut berasal, bagaimana cara memperolehnya, apa arti dan definisi data tersebut, dan apakah ada yang terlewat. Sama seperti contoh pangsa pasar mesin pencari sebelumnya, Anda hanya bisa menarik kesimpulan yang benar setelah memahami pangsa pasarnya dan apa kriterianya.
Untuk artikel asli, harap tunjukkan bahwa artikel tersebut dicetak ulang dari blog Lu Songsong
Terima kasih kepada Lu Songsong atas kontribusinya