Vinted データと Vinted.fr からの検索
Vinted データは、Google スプレッドシートまたはGoogle データポータルレポートで視覚化できます。これらは毎日 09:00 (GMT+2) に実現され、Google シートとこの GitHub リポジトリのDATAフォルダーに保存されます。
現在のところ、 BRAND ID は収集に最も時間がかかる ID です。これは、1 回または少数のリクエストですべての ID を取得するクエリが見つからなかったためです。現在、この識別子のデータ収集は、各ブランド (現在 2,000 以上のブランド) のクエリを使用して行われます。
現在、HTML をスクレイピングするよりも良い解決策を見つけるために Vinted API を調査しています。
Vinted 検索は完璧に機能し、7 つの異なる ID (カタログ、色、ブランド、サイズ、素材、ステータス、国) を処理します。これは、使用された検索で見つかった項目のリストをキー「items」に持つ辞書を返します。このメソッドは、collect_data.py ファイル内にあります。したがって、次のように使用できます。
from collect_data import searchVinted
search = searchVinted (
catalog = [ 221 ],
color = [ "pink" ],
brand = [ 53 ])
これにより、対応する URL が構築されるはずです: https://www.vinted.fr/vetements?search_text=&per_page=120&page=1&price_from=0&price_to=1000000¤cy=EUR&catalog%5B%5D=221&color_id%5B%5D=5&brand_id%5B%5D=53
そして、次の辞書を返します。