Сначала позвольте мне показать вам некоторые новости об Интернете. Первая из них заключается в том, что доля веб-поиска Baidu достигла 73,2%. Baidu обработала 109,6 миллиардов поисковых запросов, что на 0,6 процентных пункта больше, чем в прошлом году. После того, как отчет был опубликован, многие блоги начали атаковать Google, основываясь на этих цифрах, заявляя, что дела у компании идут не очень хорошо.
Глядя на вторую статью, данные остаются теми же. Упоминается, что поисковые запросы Baidu увеличились на 0,5 процентных пункта, поисковые запросы Google увеличились на 3,5 процентных пункта, а Google стал самой быстрорастущей поисковой системой.
Обе новости используют данные, и это одни и те же данные, но если посмотреть только первую и вторую новость, то выводы будут совершенно разные. Давайте посмотрим на третью статью, которая также посвящена данным о доле рынка: рыночная доля Baidu упала на 2,1%, Google увеличилась на 5,6%, а разрыв между ними сократился до 7,7%. Глядя на одни и те же несколько новостей, все они показывают цифры, связанные с долей рынка поисковых систем. Но если кто-то, кто не знаком с рынком поисковых систем, увидит это, он в конечном итоге придет к очень запутанному выводу.
Почему три новостные статьи приводят одни и те же данные, но дают разные результаты? Ниже Лу Сонгсонг проанализирует несколько принципов анализа данных.
Во-первых, бессмысленно рассматривать часть данных изолированно.
Продолжая вышеизложенное, вопрос доли рынка между Baidu и Google упоминается в первой новостной статье, где доля рынка Baidu увеличилась на 0,6%. Кажется, что Baidu увеличивается, что, естественно, означает, что Baidu увеличивается, а Google уменьшается. Второй отчет более полный. Это означает, что доли других поисковых систем снижаются, в то время как Google и Baidu растут, а Google растет быстрее. Это показывает, что мы не можем рассматривать число изолированно.
Например, было бы неразумно сравнивать Sohu и Sina вместе. У Sohu есть онлайн-игры, беспроводная связь и реклама, тогда как соотношение 3:2 явно неразумно. отдельно.
Во-вторых, качество данных должно быть сопоставимым.
В примерах доли рынка поисковых систем, упомянутых ранее в этой статье, некоторые определяются поисковыми запросами, а некоторые — доходом. Сравнивать разные данные вместе не имеет смысла. Если часть данных не может быть видна естественным образом, вам следует взглянуть на ее определение. Даже если одно и то же определение будет использоваться разными компаниями, результаты будут разными. Важно то, что мы должны обеспечить соответствие калибра при сравнении.
В-третьих, различия в методах сбора данных.
Опросы после горячих сообщений о событиях часто появляются на различных веб-сайтах, таких как опросы 360 и QQ о том, кого выбрать для удаления. На самом деле, результаты часто не могут отражать реальную ситуацию, потому что, вообще говоря, только люди, которым небезразличны новости, могут выразить, как это сделать. читать новости. Приходите голосовать и использовать результаты своего голосования, чтобы представить общее мнение, тем самым направляя другую группу людей, которые не знают истины, следовать основным взглядам. Результаты онлайн-опросов могут легко использоваться производителями для продвижения себя и критики своих оппонентов.
Поэтому лучше всего задать несколько вопросов о номере. Когда вы встречаете число, лучше не использовать его напрямую. Прежде всего, вы должны знать, откуда берутся данные, как они получены, каковы смысл и определение данных, а также есть ли какие-либо упущения. Как и в предыдущем примере о доле рынка поисковых систем, сделать правильный вывод можно только после того, как вы поймете, какая это доля и каковы критерии.
Для оригинальных статей укажите, что они были перепечатаны из блога Лу Сонгсона.
Спасибо Лу Сонгсонгу за его вклад.