Этот скрипт Python предназначен для извлечения показателей веб-производительности, в частности основных веб-показателей, из списка URL-адресов с помощью API Google PageSpeed Insights. Он использует библиотеку aiohttp
для асинхронных HTTP-запросов и asyncio
для обработки параллелизма. Извлеченные показатели затем обрабатываются и сохраняются в файл Excel для дальнейшего анализа.
Список URL-адресов : сценарий начинается с предопределенного списка URL-адресов для анализа. Вы можете настроить этот список, добавляя или удаляя URL-адреса в переменной url_list
.
Конфигурация API : устанавливаются ключевые параметры конфигурации, в том числе:
category
: Категория производительности для анализа.today
: текущая дата в формате «дд-мм-гггг».locale
: локаль для анализа (например, «br» для Бразилии).key
: ваш ключ API, который вы можете получить из API Google PageSpeed Insights. Извлечение данных API : сценарий определяет асинхронную функцию webcorevitals
для выполнения запросов API для каждого URL-адреса, как для «мобильных», так и для «настольных» устройств. Он извлекает различные показатели производительности, такие как первая задержка ввода (FID), взаимодействие с следующей отрисовкой (INP), время до первого байта (TTFB), первая отрисовка контента (FCP), индекс скорости (SI), наибольшая отрисовка контента (LCP). , время взаимодействия (TTI), общее время блокировки (TBT), совокупный сдвиг макета (CLS), общий размер страницы и общий показатель производительности.
Преобразование данных : Извлеченные данные преобразуются и обрабатываются для обеспечения согласованности и правильных типов данных.
Создание DataFrame : DataFrame Pandas создается для организации извлеченных показателей. DataFrame структурирован столбцами для даты, URL-адреса, оценки, FCP, SI, LCP, TTI, TBT, CLS, размера в МБ и устройства.
Параллельное выполнение : сценарий использует asyncio для одновременного выполнения запросов API для всех URL-адресов и устройств, что значительно ускоряет процесс извлечения данных.
Вывод Excel : окончательный DataFrame объединяется из всех запросов и сохраняется как файл Excel с именем «output.xlsx» в том же каталоге, что и сценарий.
Установите зависимости : убедитесь, что у вас установлены необходимые библиотеки Python. Вы можете установить их с помощью pip:
pip install aiohttp asyncio pandas
Ключ API . Получите ключ API от Google PageSpeed Insights API и замените key
переменную в скрипте своим ключом.
Настроить список URL-адресов : настройте список URL-адресов для анализа, изменив переменную url_list
в скрипте.
Запустите сценарий . Выполните сценарий с помощью Python:
python lighthouse.py
Вывод : как только сценарий завершит выполнение, вы найдете файл Excel с именем «output.xlsx», содержащий извлеченные показатели веб-производительности, в том же каталоге, что и сценарий.
Например:
Дата | URL-адрес | Счет | ФКП | СИ | ЛКП | ТТИ | ТБТ | ЦЛС | Размер (МБ) | Устройство |
---|---|---|---|---|---|---|---|---|---|---|
2023-09-25 | https://www.google.com | 76 | 2 | 3.2 | 2 | 8,5 | 910 | 0,014 | 1.123100281 | мобильный |
2023-09-25 | https://www.google.com | 92 | 0,4 | 0,8 | 0,6 | 1,9 | 220 | 0,007 | 1.246808052 | рабочий стол |
Если вы хотите внести свой вклад, откройте вопрос или отправьте мне электронное письмо [email protected]. Если не просто дайте мне звезду.