Dieses Python-Skript wurde entwickelt, um mithilfe der Google PageSpeed Insights API Webleistungsmetriken, insbesondere Core Web Vitals, aus einer Liste von URLs zu extrahieren. Es nutzt die aiohttp
-Bibliothek für asynchrone HTTP-Anfragen und asyncio
für die Verarbeitung der Parallelität. Die extrahierten Metriken werden dann verarbeitet und zur weiteren Analyse in einer Excel-Datei gespeichert.
URL-Liste : Das Skript beginnt mit einer vordefinierten Liste der zu analysierenden URLs. Sie können diese Liste anpassen, indem Sie URLs in der Variablen url_list
hinzufügen oder entfernen.
API-Konfiguration : Es werden wichtige Konfigurationsparameter festgelegt, darunter:
category
: Die Leistungskategorie für die Analyse.today
: Das aktuelle Datum im Format „TT-MM-JJJJ“.locale
: Das Gebietsschema für die Analyse (z. B. „br“ für Brasilien).key
: Ihr API-Schlüssel, den Sie über die PageSpeed Insights API von Google erhalten können. API-Datenextraktion : Das Skript definiert eine asynchrone Funktion webcorevitals
, um API-Anfragen für jede URL zu stellen, sowohl für „mobile“ als auch „Desktop“-Geräte. Es extrahiert verschiedene Leistungsmetriken, wie First Input Delay (FID), Interaction to Next Paint (INP), Time to First Byte (TTFB), First Contentful Paint (FCP), Speed Index (SI), Largest Contentful Paint (LCP). , Time to Interactive (TTI), Total Blocking Time (TBT), Cumulative Layout Shift (CLS), Gesamtseitengröße und die Gesamtleistungsbewertung.
Datentransformation : Die extrahierten Daten werden transformiert und verarbeitet, um Konsistenz und richtige Datentypen sicherzustellen.
DataFrame-Erstellung : Ein Pandas DataFrame wird erstellt, um die extrahierten Metriken zu organisieren. Der DataFrame ist mit Spalten für Datum, URL, Score, FCP, SI, LCP, TTI, TBT, CLS, Größe in MB und Gerät strukturiert.
Gleichzeitige Ausführung : Das Skript verwendet Asyncio, um API-Anfragen gleichzeitig für alle URLs und Geräte auszuführen, wodurch der Datenextraktionsprozess erheblich beschleunigt wird.
Excel-Ausgabe : Der endgültige DataFrame wird aus allen Anforderungen verkettet und als Excel-Datei mit dem Namen „output.xlsx“ im selben Verzeichnis wie das Skript gespeichert.
Abhängigkeiten installieren : Stellen Sie sicher, dass Sie die erforderlichen Python-Bibliotheken installiert haben. Sie können sie mit pip installieren:
pip install aiohttp asyncio pandas
API-Schlüssel : Besorgen Sie sich einen API-Schlüssel von der PageSpeed Insights API von Google und ersetzen Sie die key
im Skript durch Ihren Schlüssel.
URL-Liste anpassen : Passen Sie die Liste der zu analysierenden URLs an, indem Sie die Variable url_list
im Skript ändern.
Führen Sie das Skript aus : Führen Sie das Skript mit Python aus:
python lighthouse.py
Ausgabe : Sobald die Ausführung des Skripts abgeschlossen ist, finden Sie im selben Verzeichnis wie das Skript eine Excel-Datei mit dem Namen „output.xlsx“, die die extrahierten Web-Leistungsmetriken enthält.
Zum Beispiel:
Datum | URL | Punktzahl | FCP | SI | LCP | TTI | TBT | CLS | Größe (MB) | Gerät |
---|---|---|---|---|---|---|---|---|---|---|
25.09.2023 | https://www.google.com | 76 | 2 | 3.2 | 2 | 8.5 | 910 | 0,014 | 1.123100281 | Mobile |
25.09.2023 | https://www.google.com | 92 | 0,4 | 0,8 | 0,6 | 1.9 | 220 | 0,007 | 1.246808052 | Desktop |
Wenn Sie einen Beitrag leisten möchten, eröffnen Sie bitte eine Ausgabe oder senden Sie mir eine E-Mail an [email protected]. Wenn nicht, gib mir einfach einen Stern.