vk url scraper Download - vk url scraper Quellcode-Download

vk url scraper

Anderer Quellcode

v0.3.30

Herunterladen

vk-url-scraper

Python-Bibliothek zum Scrapen von Daten und insbesondere Medienlinks wie Videos und Fotos aus vk.com-URLs.

Sie können es über die Befehlszeile oder als Python-Bibliothek verwenden, siehe Dokumentation .

Installation

Sie können die neueste Version von Pypi über pip install vk-url-scraper installieren.

Derzeit müssen Sie eine Abhängigkeit manuell deinstallieren und neu installieren (da sie von Github und nicht von Pypi installiert wird):

pip uninstall vk-api
pip install git+https://github.com/python273/vk_api.git@b99dac0ec2f832a6c4b20bde49869e7229ce4742

Um die Bibliothek nutzen zu können, benötigen Sie eine gültige Kombination aus Benutzername und Passwort für vk.com.

Verwendung der Befehlszeile

 # run this to learn more about the parameters
vk_url_scraper --help

# scrape a URL and get the JSON result in the console
vk_url_scraper --username " username here " --password " password here " --urls https://vk.com/wall12345_6789
# OR
vk_url_scraper -u " username here " -p " password here " --urls https://vk.com/wall12345_6789
# you can also have multiple urls
vk_url_scraper -u " username here " -p " password here " --urls https://vk.com/wall12345_6789 https://vk.com/photo-12345_6789 https://vk.com/video12345_6789

# you can pass a token as well to avoid always authenticating 
# and possibly getting captcha prompts
# you can fetch the token from the vk_config.v2.json file generated under by searching for "access_token"
vk_url_scraper -u " username " -p " password " -t " vktoken goes here " --urls https://vk.com/wall12345_6789

# save the JSON output into a file
vk_url_scraper -u " username here " -p " password here " --urls https://vk.com/wall12345_6789 > output.json

# download any photos or videos found in these URLS
# this will use or create an output/ folder and dump the files there
vk_url_scraper -u " username here " -p " password here " --download --urls https://vk.com/wall12345_6789
# or
vk_url_scraper -u " username here " -p " password here " -d --urls https://vk.com/wall12345_6789

Verwendung der Python-Bibliothek

 from vk_url_scraper import VkScraper

vks = VkScraper ( "username" , "password" )

# scrape any "photo" URL
res = vks . scrape ( "https://vk.com/photo1_278184324?rev=1" )

# scrape any "wall" URL
res = vks . scrape ( "https://vk.com/wall-1_398461" )

# scrape any "video" URL
res = vks . scrape ( "https://vk.com/video-6596301_145810025" )
print ( res [ 0 ][ "text" ]) # eg: -> to get the text from code

 # Every scrape* function returns a list of dict like
{
	"id" : "wall_id" ,
	"text" : "text in this post" ,
	"datetime" : utc datetime of post ,
	"attachments" : {
		# if photo, video, link exists
		"photo" : [ list of urls with max quality ],
		"video" : [ list of urls with max quality ],
		"link" : [ list of urls with max quality ],
	},
	"payload" : " original JSON response converted to dict which you can parse for more data
}

siehe [Dokumente] für alle verfügbaren Funktionen.

TODO

Album-Links scrapen
Scrape-Profil-Links
Dokumente online von Sphinx

Entwicklung

(Weitere Informationen unter CONTRIBUTING.md).

Richten Sie die Entwicklungsumgebung mit pip install -r dev-requirements.txt oder pipenv install -r dev-requirements.txt ein
Richten Sie die Umgebung mit pip install -r requirements.txt oder pipenv install -r requirements.txt
Um alle Prüfungen auszuführen make run-checks (Fixes-Stil) oder einzeln
1. Stil fixieren: black . und isort . -> flake8 . um Flusen zu validieren
2. So führen Sie eine Typprüfung durch: mypy .
3. Zum Testen: pytest . ( pytest -v --color=yes --doctest-modules tests/ vk_url_scraper/ um Ausführlichkeit, Farben und Test-Docstring-Beispiele zu verwenden)
make docs , um Shpynx-Dokumente zu generieren -> bearbeiten Sie bei Bedarf config.py

Um die in main .py verfügbare Befehlszeilenschnittstelle zu testen, müssen Sie die Option -m wie folgt an Python übergeben: python -m vk_url_scraper -u "" -p "" --urls ...

Veröffentlichung einer neuen Version

Bearbeiten Sie version.py mit der richtigen Versionierung
Stellen Sie sicher, dass Sie pipenv run pip freeze > requirements.txt ausführen, wenn Sie Bibliotheken mit „pipenv“ verwalten
1. Wenn die fest codierte Version von vk_api noch verwendet wird, müssen Sie diese Zeile aus der generierten Anforderungsdatei kommentieren/entfernen und Benutzer anweisen, die Version manuell von der Quelle zu installieren, da Pypi keine Repo-/Commit-Tags zulässt. Fügen Sie außerdem die neueste veröffentlichte Version hinzu, derzeit vk-api==11.9.9 .
Führen Sie alternativ ./scripts/release.sh aus, um ein Tag zu erstellen und zu pushen
1. git tag vx.yz zum Tag-Version
2. git push origin vx.yz -> dies löst den Workflow aus und legt das Projekt auf Pypi ab
Gehen Sie zu https://readthedocs.org/, um die neue Dokumentversion bereitzustellen (wenn der Webhook nicht eingerichtet ist).

Beheben einer fehlgeschlagenen Version

Wenn der Release-Workflow von GitHub Actions aus irgendeinem Grund fehlschlägt und ein Fehler auftritt, der behoben werden muss, müssen Sie sowohl das Tag als auch die entsprechende Version von GitHub löschen. Nachdem Sie einen Fix gepusht haben, löschen Sie das Tag mit aus Ihrem lokalen Klon

git tag -l | xargs git tag -d && git fetch -t

Wiederholen Sie dann die oben genannten Schritte.

Expandieren

Zusätzliche Informationen

Version v0.3.30
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-11
Größe 50MB
Kommt von Github

Ähnliche Anwendungen

google noto emoji scraper

2024-11-14
Musik für VK

2024-11-09
VK-App für soziale Netzwerke

2024-05-12
VK-Client

2023-06-16
Witkey VK-Hintergrundbild

2023-06-09
URL-Weiterleitungssystem

2010-06-17

vk url scraper

vk-url-scraper

Installation

Verwendung der Befehlszeile

Verwendung der Python-Bibliothek

TODO

Entwicklung

Veröffentlichung einer neuen Version

Beheben einer fehlgeschlagenen Version

google noto emoji scraper

Musik für VK

VK-App für soziale Netzwerke

VK-Client

Witkey VK-Hintergrundbild

URL-Weiterleitungssystem

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind