Scraping analysis_Cdiscount_computer
1.0.0
在抓取了 Cdiscount 网站上所有可用的计算机后,我们首先处理文本数据以隔离计算机的不同特征:RAM 内存、存储内存、屏幕尺寸、零售商等......然后我们决定将研究重点放在网站上出现最多的两个计算机品牌,以免错过任何数据并获得可靠的结果:Macbook 和 Dell。
因此,我们能够得出一些结论并做出一些假设。以下是其中一些:
我们可以清楚地看到,价格分散呈现出一种规律,大多数电脑的价格要么集中在低价位,要么集中在低价位,但价格在这些区域之间的电脑并不多。我们可以解释为,一旦商品不再是新的,人们就会贬值。因此,一个表明计算机不是新的小缺陷可能会导致出售时的巨大损失。
我们可以清楚地看到,价格离散似乎随着商品的平均价格而减小。 Mac 上的图表不太平滑,因为数据更多,因此某些值的随机性更大。万可以解读为,价格高的时候卖家会更加谨慎。这确实可以理解,对于中型计算机,您不需要努力找到确切的值,但对于高科技计算机(因此可能具有更多可见性的计算机),进行更多研究是有意义的。此外,对于便宜的计算机,由于其使用方式、使用时间等因素,查找其价值可能会很复杂。
我们这里所说的“昂贵”是指买家对不同型号电脑的平均评价。我们可以清楚地看到,不同型号的价格可能有很大差异。因此,一些销售同一台电脑的卖家可能会设定不同的价格,这就是价格分散的原因。我们可以解读为某些卖家拥有非常好的声誉(要么通过评论,要么因为他们很有名)。另一种理论是,存在循环效应:他们的声誉越好,他们能卖的东西就越多,因此买家就越放心。这使他们能够获得声誉并相应提高价格。