Basic number captcha solver herunterladen - Basic number captcha solver Quellcode-Download

Basic number captcha solver

Anderer Quellcode

Herunterladen

Basis-Zahlen-Captcha-Löser mit Tensorflow CNN

Dies ist eine reale Implementierung von CNN auf Python 3, Keras und TensorFlow. Wir arbeiten in zwei Hauptschritten mit Preprocess.py , das artefaktfreie Ziffernbilder erstellt, die später dem CNN-Modell in train.py zugeführt werden, das das CNN-Modell trainiert und speichert.

Dieser Captcha-Löser wurde für die Verwendung in metu-NTE-scraper entwickelt und wird derzeit auch darin verwendet, um den Captcha-Schutz des Studentenportals von METU für Kurskapazitätsprüfungen https://student.metu.edu.tr/ zu umgehen. Aber Sie können es in Ihrer Anwendung mit einfachen Schritten verwenden, die unter „Wie verwende ich es?“ erläutert werden. Abschnitt.

CNN-Modellbeschreibung

Ich habe ein CNN mit TensorFlow trainiert, um Bilder von Captcha-Ziffern nach der Ziffernextraktion zu klassifizieren. Das Modell besteht aus zwei Faltungsschichten und Pooling-Schichten, gefolgt von einer vollständig verbundenen Schicht. Ich habe das Modell anhand eines Datensatzes von 10.000 Captcha-Bildern trainiert, der später in Bilder mit 60.000 Ziffern unterteilt wurde, und bei einem Bildtestsatz mit 12.000 Ziffern eine Testgenauigkeit von 99,94 % erreicht.

Zug- und Testgenauigkeit des Modells sind:

Zuggenauigkeit: 1,0
Testgenauigkeit: 0,9994166493415833

Hinweis: Einige der Bilder der Aktivierungsneuronenreaktionen sind unterhalb der 4 Vorverarbeitungsschritte zu sehen

Wie benutzt man es?

Importieren Sie predict.py in Ihr Python-Programm:

 Import predict

Rufen Sie die Funktion predict_captcha auf und verwenden Sie dabei den Dateipfad des Captcha-Bilds als einziges Argument, um das Captcha vorherzusagen

 filepath="pathtocaptchaimage"
prediction=predict.predict_captcha(filepath)

Wie funktioniert es

Um Ihnen das Verständnis des Ziffernextraktors und des Modells zu erleichtern, zeigen wir Ihnen die einzelnen Schritte in einer Visualisierung

Preprocess.py arbeitet in 4 Schritten, um Ziffernbilder zu erstellen, die unten mit den Modellaktivierungen am Ende gezeigt werden

1-Artefakt-Entfernung

Im ersten Schritt löschen wir die Artefakte der Captcha-Bilder, die mit SampleCollecter.py gesammelt wurden

Originalbild	Nach der Artefaktentfernung

2-Ausschnitt

Später wird das artefaktfreie Bild ausgeschnitten, um die Ziffern des Captchas einzubinden

Nach der Artefaktentfernung	Abgeschnitten

3-K_bedeutet

Dann werden gewichtete K-Mittel verwendet, um die Mittelpunkte jeder Ziffer zu ermitteln

Abgeschnitten	Schwerpunkte

4-stellige Extraktion

Zuletzt erstellen wir Ziffernbilder unter Verwendung der aus k-means ermittelten Schwerpunkte

Schwerpunkte	Ziffern

5-Aktivierungsbilder

Nachdem die Ziffern extrahiert wurden. Zur Vorhersage der Captcha-Bilder wird das CNN-Modell verwendet. Hier werden Aktivierungsneuronen für die letzte Faltungsschicht des CNN generiert. Diese Bilder wurden erstellt, indem die Ausgabe der letzten Faltungsschicht extrahiert und als Bild visualisiert wurde. Die folgenden Aktivierungsbilder zeigen die Reaktion einiger Filter in der letzten Faltungsschicht zweistelliger Bilder.