Scraping analysis_Cdiscount_computer
1.0.0
在抓取了Cdiscount 網站上所有可用的電腦後,我們首先處理文字資料以隔離電腦的不同特徵:RAM 記憶體、儲存記憶體、螢幕尺寸、零售商等......然後我們決定將研究重點放在網站上出現最多的兩個電腦品牌,以免錯過任何數據並獲得可靠的結果:Macbook 和 Dell。
因此,我們能夠得出一些結論並做出一些假設。以下是其中一些:
我們可以清楚地看到,價格分散呈現出一種規律,大多數電腦的價格要么集中在低價位,要么集中在低價位,但價格在這些區域之間的電腦並不多。我們可以解釋為,一旦商品不再是新的,人們就會貶值。因此,一個表明計算機不是新的小缺陷可能會導致出售時的巨大損失。
我們可以清楚地看到,價格離散似乎隨著商品的平均價格而減少。 Mac 上的圖表不太平滑,因為資料較多,因此某些值的隨機性較大。萬可以解讀為,價格高的時候賣家會更加謹慎。這確實可以理解,對於中型計算機,您不需要努力找到確切的值,但對於高科技計算機(因此可能具有更多可見性的計算機),進行更多研究是有意義的。此外,對於便宜的計算機,由於其使用方式、使用時間等因素,尋找其價值可能會很複雜。
我們這裡所說的「昂貴」是指買家對不同型號電腦的平均評價。我們可以清楚地看到,不同型號的價格可能有很大差異。因此,一些銷售同一台電腦的賣家可能會設定不同的價格,這就是價格分散的原因。我們可以解讀為某些賣家擁有非常好的聲譽(要麼透過評論,要麼因為他們很有名)。另一種理論是,存在循環效應:他們的聲譽越好,他們能賣的東西就越多,因此買家就越放心。這使他們能夠獲得聲譽並相應提高價格。