gnes Download - gnes -Quellcode herunterladen

gnes

Anderer Quellcode

1.0.0

Herunterladen

Highlights • Übersicht • Installation • Erste Schritte • Hub • Dokumentation • Tutorial • Mitwirken • Versionshinweise • Blog

Was ist das

GNES [ jee-nes ] ist Generic Neural Elastic Search , ein Cloud-natives semantisches Suchsystem, das auf einem tiefen neuronalen Netzwerk basiert.

GNES ermöglicht eine umfassende Index- und semantische Suche für Text-zu-Text- , Bild-zu-Bild- , Video-zu-Video- und Any-to-Any- Inhaltsformen.

Höhepunkte

? Um mehr über die wichtigsten Grundsätze von GNES zu erfahren, lesen Sie diesen Blogbeitrag

☁️ Cloud-nativ und elastisch	? Einfach zu bedienen	? Stand der Technik
_{GNES ist All-in-Microservice ! Encoder, Indexer, Präprozessor und Router laufen alle in ihren eigenen Containern. Sie kommunizieren über versionierte APIs und arbeiten unter der Orchestrierung von Docker Swarm/Kubernetes usw. zusammen. Skalierung, Lastausgleich, automatisierte Wiederherstellung – sie sind in GNES von der Stange.}	_{Wie lange würde es dauern, eine Änderung bereitzustellen, bei der nur eine Ebene in VGG gewechselt wird? In GNES ist dies nur eine Zeilenänderung in einer YAML-Datei. Wir abstrahieren die Codierungs- und Indexierungslogik in eine YAML-Konfiguration, sodass Sie Encoder und Indexer ändern oder stapeln können, ohne die Codebasis auch nur zu berühren.}	_{Wir nutzen die sich schnell entwickelnden KI-/ML-/NLP-/CV-Communitys, lernen von den besten Deep-Learning-Modellen und integrieren sie in GNES, um sicherzustellen, dass Sie immer in den Genuss der hochmodernen Leistung kommen.}
? Generisch und universell	? Modell als Plugin	? Best Practice
_{Suchen Sie nach Texten, Bildern oder sogar Kurzvideos? Verwenden Sie Python/C/Java/Go/HTTP als Client? Egal welche Inhaltsform Sie haben oder welche Sprache Sie verwenden, GNES kann sie alle verarbeiten.}	_{Wenn integrierte Modelle Ihren Anforderungen nicht genügen, erstellen Sie einfach Ihre eigenen mit GNES Hub. Packen Sie Ihr Modell als Docker-Container und verwenden Sie es als Plugin.}	_{Wir lieben es, die Best Practices aus der Community zu lernen und unserem GNES dabei zu helfen, die nächste Stufe der Verfügbarkeit, Ausfallsicherheit, Leistung und Haltbarkeit zu erreichen. Wenn Sie Ideen oder Vorschläge haben, können Sie gerne einen Beitrag leisten.}

Überblick

GNES-Hub

GNES Hub liefert AI/ML-Modelle als Docker-Container und verwendet Docker-Container als Plugins. Es bietet eine saubere und nachhaltige Möglichkeit, externe Algorithmen (mit den Abhängigkeiten) in das GNES-Framework zu portieren.

GNES Hub wird auf dem Docker Hub gehostet.

Installieren Sie GNES

Es gibt zwei Möglichkeiten, GNES zu erhalten, entweder als Docker-Image oder als PyPi-Paket. Für Cloud-Benutzer empfehlen wir dringend die Verwendung von GNES über Docker .

Führen Sie GNES als Docker-Container aus

docker run gnes/gnes:latest-alpine

Dieser Befehl lädt das neueste GNES-Image (basierend auf Alpine Linux) herunter und führt es in einem Container aus. Wenn der Container ausgeführt wird, gibt er eine Informationsmeldung aus und wird beendet.

Wählen Sie das richtige GNES-Bild

Neben dem für den Weltraum optimierten alpine Image stellen wir auch auf Buster (Debian 10.0), Ubuntu 18.04 und Ubuntu 16.04 basierende Images bereit. Die folgende Tabelle fasst alle verfügbaren GNES-Tags zusammen. Man kann {ver} mit latest , stable oder v0..xx ausfüllen. latest bezieht sich auf den neuesten Master dieses Repositorys, der möglicherweise nicht stabil ist. Wir empfehlen Ihnen, eine offizielle Version zu verwenden, indem Sie die latest in eine Versionsnummer ändern, z. B. v0.0.24 , oder einfach stable für die letzte Version verwenden, z. B. gnes:stable-ubuntu

Etikett	Größe und Schichten	Beschreibung
`{ver}-alpine`		basierend auf Alpine Linux; keine Deep-Learning-Bibliotheken; extrem leicht und tragbar, ermöglicht eine schnelle Skalierung auf Even-Edge-Geräten.
`{ver}-buster`		basierend auf Debian 10.0; keine Deep-Learning-Bibliotheken; Empfohlen zum Erstellen oder Erweitern eines GNES-Hub-Images.
`{ver}-ubuntu18`		basierend auf Ubuntu 18.04; keine Deep-Learning-Bibliotheken.
`{ver}-full`		basierend auf Ubuntu 16.04; Python-3.6.8, Cuda-10.0, TF1.14, Pytorch1.1, Faiss, mehrere vorab trainierte Modelle; Schwer, aber in sich geschlossen, nützlich beim End-to-End-Testen von GNES.

️ Seit dem 21.10.2019 hosten wir den öffentlichen Mirror Tencent Cloud nicht mehr. Die alten Docker-Images sind noch vorhanden, aber es werden keine neuen Images mehr auf Tencent Cloud verfügbar sein.

Wir bieten auch öffentliche Github-Spiegelpakete an. Wählen Sie den Spiegel aus, der Ihnen gute Dienste leistet.

docker login --username=xxx docker.pkg.github.com/gnes-ai/gnes  # login to github package so that we can pull from it
docker run docker.pkg.github.com/gnes-ai/gnes/gnes:latest-alpine

Die folgende Tabelle zeigt den Status der Build-Pipeline.

Registrierung	Build-Status
_Docker-Hub `gnes/gnes:[tag]`
_Github-Paket `docker.pkg.github.com/gnes-ai/gnes/gnes:[tag]`

Installieren Sie GNES über `pip`

Sie können GNES auch als Python3 -Paket installieren über:

pip install gnes

Beachten Sie, dass dadurch nur eine „Barebone“-Version von GNES installiert wird, die aus den minimalen Abhängigkeiten für die Ausführung von GNES besteht. Es werden keine vorab trainierten Modelle von Drittanbietern, Deep-Learning-/NLP-/CV-Pakete installiert. Wir legen dieses Setup als Standardinstallationsverhalten fest, da ein für NLP-Ingenieure interessantes Modell für CV-Ingenieure möglicherweise nicht von Interesse ist. In GNES dienen Modelle als Docker-Plugins.

? Tensorflow, Pytorch und Torchvision sind nicht Teil der GNES-Installation. Abhängig von Ihrem Modell müssen Sie diese möglicherweise vorab installieren.

Obwohl dies nicht empfohlen wird, können Sie GNES mit vollständigen Abhängigkeiten installieren über:

pip install gnes[all]

? Oder wählen Sie die Abhängigkeiten anhand der folgenden Tabelle aus: (zum Erweitern klicken...)

pip install gnes[bert]	bert-serving-server>=1.8.6, bert-serving-client>=1.8.6
pip install gnes[flair]	Flair>=0,4,1
pip install gnes[nerven]	nervig==1.15.2
pip install gnes[chinesisch]	jieba
pip install gnes[vision]	opencv-python>=4.0.0, imagehash>=4.0
pip install gnes[leveldb]	Lagenhöhe>=1,0,5
pip install gnes[test]	pylint, Memory_profiler>=0.55.0, psutil>=5.6.1, gputil>=1.4.0
pip install gnes[transformers]	Pytorch-Transformatoren
pip install gnes[onnx]	onnxruntime
pip install gnes[audio]	librosa>=0,7,0
pip install gnes[scipy]	scipy
pip install gnes[nlp]	bert-serving-server>=1.8.6, pytorch-transformers, flair>=0.4.1, bert-serving-client>=1.8.6
pip install gnes[cn_nlp]	pytorch-transformers, bert-serving-client>=1.8.6, bert-serving-server>=1.8.6, jieba, flair>=0.4.1
pip install gnes[all]	pylint, psutil>=5.6.1, pytorch-transformers, annoy==1.15.2, bert-serving-client>=1.8.6, gputil>=1.4.0, bert-serving-server>=1.8.6, imagehash >=4.0, onnxruntime, memory_profiler>=0.55.0, jieba, flair>=0.4.1, librosa>=0.7.0, scipy, plyvel>=1.0.5, opencv-python>=4.0.0

Eine gute Möglichkeit, Abhängigkeiten auszuwählen, besteht darin, dem Beispiel in GNES Hub zu folgen und ein eigenes GNES-Image zu erstellen.

So oder so: Wenn Sie nach $ gnes oder $ docker run gnes/gnes die folgende Meldung lesen, können Sie loslegen!

Erste Schritte

? Vorrunden
- Mikroservice
- Arbeitsablauf
Erstellen Sie in 3 Minuten eine Blumensuchmaschine
- Definieren Sie den Indexierungsworkflow
- Indizierung von Blumenbilddaten
- Ähnliche Blumen abfragen
Elastisch leicht gemacht
Bereitstellen eines Flows über Docker Swarm/Kubernetes
Aufbau einer Cloud-nativen Suchmaschine für semantische Gedichte
?‍️Nachrichten zum Mitnehmen

? Vorrunden

Bevor wir beginnen, möchte ich zunächst zwei wichtige Konzepte in GNES vorstellen: Microservice und Workflow .

Mikroservice

Ingenieure für maschinelles Lernen und Datenwissenschaftler, die mit dem Konzept von Cloud-Native und Microservices nicht vertraut sind, können sich einen Microservice als App auf Ihrem Smartphone vorstellen. Jede App wird unabhängig ausgeführt und eine App kann mit anderen Apps zusammenarbeiten, um eine Aufgabe zu erfüllen. In GNES haben wir vier grundlegende Apps, auch bekannt als: Microservices, das sind:

Präprozessor : Umwandeln eines realen Objekts in eine Liste funktionsfähiger semantischer Einheiten;
Encoder : Darstellung einer semantischen Einheit mit Vektordarstellung;
Indexer : Speichern der Vektoren im Speicher/auf der Festplatte, was einen schnellen Zugriff ermöglicht;
Router : Weiterleitung von Nachrichten zwischen Microservices: z. B. Stapeln, Zuordnen, Reduzieren.

In GNES haben wir Dutzende von Präprozessoren, Encodern und Indexern implementiert, um verschiedene Inhaltsformen wie Bilder, Text und Videos zu verarbeiten. Es ist auch super einfach, Ihre eigene Implementierung einzubinden, was wir in der Fortsetzung als Beispiel sehen werden.

Arbeitsablauf

Was erwarten wir von ihnen, nachdem wir nun eine Reihe von Apps haben? Ein typisches Suchsystem hat zwei grundlegende Aufgaben: Index und Abfrage . Der Index speichert die Dokumente, die Abfrage durchsucht die Dokumente. In einem neuronalen Suchsystem steht man möglicherweise vor einer anderen Aufgabe: Trainieren , bei der man einen Encoder/Präprozessor entsprechend der Datenverteilung feinabstimmt, um eine bessere Suchrelevanz zu erreichen.

Diese drei Aufgaben entsprechen drei verschiedenen Arbeitsabläufen in GNES.

Erstellen Sie in 3 Minuten eine Blumensuchmaschine

Seit v0.0.46 ist GNES Flow die Hauptschnittstelle von GNES. GNES Flow bietet eine pythonische und intuitive Möglichkeit, einen Workflow zu implementieren, sodass Benutzer GNES auf einem lokalen Computer ausführen oder debuggen können. Standardmäßig orchestriert GNES Flow alle Microservices mithilfe eines Multithread- oder Multiprozess-Backends. Es kann auch in eine Docker Swarm/Kubernetes YAML-Konfiguration exportiert werden, sodass GNES in der Cloud bereitgestellt werden kann.

? Das vollständige Beispiel und das dazugehörige Jupyter Notebook finden Sie hier.

In diesem Beispiel verwenden wir die neue gnes.flow API ( gnes >= 0.0.46 ist erforderlich), um ein Suchsystem für Spielzeugbilder zum Indizieren und Abrufen von Blumen basierend auf ihren Ähnlichkeiten zu erstellen.

Definieren Sie den Indexierungsworkflow

Definieren wir zunächst den Indexierungsworkflow durch:

 from gnes . flow import Flow
flow = ( Flow ( check_version = False )
        . add_preprocessor ( name = 'prep' , yaml_path = 'yaml/prep.yml' )
        . add_encoder ( yaml_path = 'yaml/incep.yml' )
        . add_indexer ( name = 'vec_idx' , yaml_path = 'yaml/vec.yml' )
        . add_indexer ( name = 'doc_idx' , yaml_path = 'yaml/doc.yml' , recv_from = 'prep' )
        . add_router ( name = 'sync' , yaml_path = 'BaseReduceRouter' , num_part = 2 , recv_from = [ 'vec_idx' , 'doc_idx' ]))

Hier verwenden wir das vorab trainierte Modell inceptionV4 als Encoder und die integrierten Indexer zum Speichern von Vektoren und Dokumenten. Der Ablauf sollte ziemlich selbsterklärend sein. Wenn nicht, können Sie ihn jederzeit in ein SVG-Bild konvertieren und seine Visualisierung sehen:

 flow . build ( backend = None ). to_url ()

Indizierung von Blumenbilddaten

Um unsere Blumendaten zu indizieren, benötigen wir einen Iterator, der bytes Strings generiert und diese bytes Strings in den definierten Fluss einspeist.

 def read_flowers ( sample_rate = 1.0 ):
    with tarfile . open ( '17flowers.tgz' ) as fp :
        for m in fp . getmembers ():
            if m . name . endswith ( '.jpg' ) and random . random () <= sample_rate :
                yield fp . extractfile ( m ). read ()

Wir können jetzt die Indizierung über das Multiprozess-Backend durchführen:

 with flow ( backend = 'process' ) as fl :
    fl . index ( bytes_gen = read_flowers (), batch_size = 64 )

Abhängig von Ihrer Maschine dauert es einige Minuten.

Bereitstellen eines Flows über Docker Swarm/Kubernetes

Man kann ein Flow Objekt ganz einfach in eine Docker Swarm/Kubernetes YAML-Compose-Datei konvertieren über:

 flow . build ( backend = None ). to_swarm_yaml ()

 version : ' 3.4 '
services :
  Frontend0 :
    image : gnes/gnes:latest-alpine
    command : frontend --port_in 56086 --port_out 52674 --port_ctrl 49225 --check_version
      False --ctrl_with_ipc True
  prep :
    image : gnes/gnes:latest-alpine
    command : preprocess --port_in 52674 --port_out 65461 --host_in Frontend0 --socket_in
      PULL_CONNECT --socket_out PUB_BIND --port_ctrl 49281 --check_version False --ctrl_with_ipc
      True --yaml_path yaml/prep.yml
  Encoder0 :
    image : gnes/gnes:latest-alpine
    command : encode --port_in 65461 --port_out 50488 --host_in prep --socket_in SUB_CONNECT
      --port_ctrl 62298 --check_version False --ctrl_with_ipc True --yaml_path yaml/incep.yml
  vec_idx :
    image : gnes/gnes:latest-alpine
    command : index --port_in 50488 --port_out 57791 --host_in Encoder0 --host_out
      sync --socket_in PULL_CONNECT --socket_out PUSH_CONNECT --port_ctrl 58367 --check_version
      False --ctrl_with_ipc True --yaml_path yaml/vec.yml
  doc_idx :
    image : gnes/gnes:latest-alpine
    command : index --port_in 65461 --port_out 57791 --host_in prep --host_out sync
      --socket_in SUB_CONNECT --socket_out PUSH_CONNECT --port_ctrl 50333 --check_version
      False --ctrl_with_ipc True --yaml_path yaml/doc.yml
  sync :
    image : gnes/gnes:latest-alpine
    command : route --port_in 57791 --port_out 56086 --host_out Frontend0 --socket_out
      PUSH_CONNECT --port_ctrl 51285 --check_version False --ctrl_with_ipc True --yaml_path
      BaseReduceRouter --num_part 2

Um es bereitzustellen, kopieren Sie einfach die generierte YAML-Konfiguration in eine Datei, beispielsweise my-gnes.yml , und führen Sie dann den Vorgang aus

docker stack deploy --compose-file my-gnes.yml gnes-531

Aufbau einer Cloud-nativen Suchmaschine für semantische Gedichte

In diesem Beispiel erstellen wir mit GNES eine semantische Gedichtsuchmaschine. Im Gegensatz zum vorherigen Beispiel für die Blumensuche führen wir hier jeden Dienst als isolierten Docker-Container aus und orchestrieren ihn dann über Docker Swarm. Es stellt ein häufiges Szenario in den Cloud-Einstellungen dar. Sie erfahren, wie Sie leistungsstarke und benutzerdefinierte GNES-Bilder vom GNES-Hub verwenden.

? Bitte schauen Sie sich dieses Repository an, um Einzelheiten zu erfahren, und befolgen Sie die Anweisungen zum Reproduzieren.

?‍️ Nachrichten zum Mitnehmen

Lassen Sie uns kurz zusammenfassen, was wir gelernt haben.

GNES ist ein All-in-Microservice und besteht aus vier Grundkomponenten: Präprozessor, Encoder, Indexer und Router.
GNES verfügt über drei typische Arbeitsabläufe: Trainieren, Indexieren und Abfragen.
Man kann die GNES Flow API nutzen, um einen Workflow zu definieren, zu ändern, zu exportieren oder sogar zu visualisieren.
GNES benötigt eine Orchestrierungs-Engine, um alle Microservices zu koordinieren. Es unterstützt Kubernetes, Docker Swarm oder integrierte Multiprozess-/Thread-Lösungen.

Dokumentation

Die offizielle Dokumentation von GNES wird auf doc.gnes.ai gehostet. Es wird bei jeder neuen Version automatisch erstellt, aktualisiert und archiviert.

Anleitung

? Das Tutorial befindet sich noch im Aufbau. Bleiben Sie dran! In der Zwischenzeit heißen wir Sie herzlich willkommen, Ihre eigene Lernerfahrung/Fallstudie mit GNES einzubringen!

So schreiben Sie Ihre GNES YAML-Konfiguration
So schreiben Sie eine komponentenweise YAML-Konfiguration
Modellverwaltung mit GNES Hub
- Portierung PyTorch-Transformers in GNES
- Mehrere Module hintereinander portieren
- Wählen Sie Abhängigkeiten aus und erstellen Sie Ihr eigenes GNES
Präprozessor, Encoder, Indexer und Router verstehen
Textdaten mit GNES indizieren und abfragen
Bilddaten mit GNES indizieren und abfragen
Videodaten mit GNES indizieren und abfragen
Verwendung von GNES mit Kubernetes
Verwendung von GNES in einer anderen Sprache (außer Python)
Verarbeitet HTTP-Anfragen mit GNES durchgängig
Migration von bert-as-service

Benchmark

Wir haben dieses Repository eingerichtet, um die Netzwerklatenz über verschiedene GNES-Versionen hinweg zu verfolgen. Als Teil der CICD-Pipeline wird dieses Repo automatisch aktualisiert, wenn der GNES-Master aktualisiert oder eine neue GNES-Version veröffentlicht wird.

Mitwirken

❤️ Der Anfang ist immer der Schwierigste. Aber keine Angst, selbst wenn Sie einen Tippfehler, eine fehlende Dokumentzeichenfolge oder einen Komponententest finden, können Sie diese einfach korrigieren, indem Sie einen Commit bei GNES durchführen. Hier sind die Schritte:

Erstellen Sie einen neuen Zweig, sagen wir fix-gnes-typo-1
Korrigieren/verbessern Sie die Codebasis
Übernehmen Sie die Änderungen. Beachten Sie, dass die Commit-Nachricht dem Namensstil folgen muss , z. B. fix(readme): improve the readability and move sections
Stellen Sie eine Pull-Anfrage. Beachten Sie, dass die Pull-Anfrage dem Namensstil folgen muss . Es kann einfach eine Ihrer Commit-Nachrichten sein, kopieren Sie sie einfach und fügen Sie sie ein, z. B. fix(readme): improve the readability and move sections
Senden Sie Ihre Pull-Anfrage und warten Sie, bis alle Prüfungen bestanden wurden (normalerweise 10 Minuten).
- Codierungsstil
- Commit- und PR-Style-Check
- Alle Unit-Tests
Fordern Sie Bewertungen von einem der Entwickler aus unserem Kernteam an.
Holen Sie sich ein LGTM? und PR werden zusammengeführt.

Gut gemacht! Sobald eine PR zusammengeführt wird, geschieht Folgendes:

Alle mit -latest getaggten Docker-Images werden innerhalb einer Stunde automatisch aktualisiert. Sie können den Baustatus hier überprüfen
Jeden Freitag, wenn eine neue Version veröffentlicht wird, werden PyPi-Pakete und alle mit -stable markierten Docker-Images entsprechend aktualisiert.
Ihr Beitrag und Ihre Zusagen werden in unserer wöchentlichen Veröffentlichungsmitteilung enthalten sein. ?

Weitere Einzelheiten finden Sie in den Richtlinien für Mitwirkende.

Unter Berufung auf GNES

Wenn Sie GNES in einer wissenschaftlichen Arbeit verwenden, können Sie gerne zitieren. Es gibt zwei Möglichkeiten, GNES zu zitieren:

 footnote{https://github.com/gnes-ai/gnes}

@misc{tencent2019GNES,
  title={GNES: Generic Neural Elastic Search},
  author={Xiao, Han and Yan, Jianfeng and Wang, Feng and Fu, Jie and Liu, Kai},
  howpublished={ url {https://github.com/gnes-ai}},
  year={2019}
}

Lizenz

Wenn Sie eine Kopie der GNES-Binärdatei oder des Quellcodes heruntergeladen haben, beachten Sie bitte, dass sowohl die GNES-Binärdatei als auch der Quellcode unter der Apache-Lizenz, Version 2.0, lizenziert sind.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-26
Größe 46.94MB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

gnes