awesome colab notebooks
1.0.0
Die Seite wird möglicherweise nicht richtig gerendert. Bitte öffnen Sie die Datei README.md direkt
Repositories | Papiere |
---|---|
|
|
Name | Beschreibung | Autoren | Links | kollaborativ | aktualisieren |
---|---|---|---|---|---|
CoTracker | Architektur, die mehrere Punkte in einem gesamten Video gemeinsam verfolgt |
andere |
| 16.10.2024 | |
PIFu | Pixelausgerichtete implizite Funktion für die hochauflösende Digitalisierung bekleideter Menschen |
| 08.10.2024 | ||
DifFace | Methode, die in der Lage ist, unsichtbare und komplexe Verschlechterungen eleganter und ohne komplizierte Verlustdesigns zu bewältigen |
|
| 05.10.2024 | |
Alles segmentieren 2 | Grundlagenmodell zur Lösung einer sofortigen visuellen Segmentierung in Bildern und Videos |
andere |
| 01.10.2024 | |
Open-Unmix | Eine Referenzimplementierung für ein tiefes neuronales Netzwerk zur Musikquellentrennung, anwendbar für Forscher, Audioingenieure und Künstler |
|
| 25.09.2024 | |
Tiefe malerische Harmonisierung | Der Algorithmus liefert deutlich bessere Ergebnisse als Foto-Compositing oder globale Stilisierungstechniken und ermöglicht kreative malerische Bearbeitungen, die sonst nur schwer zu erreichen wären |
|
| 23.09.2024 | |
audio2photoreal | Framework zur Generierung vollständiger fotorealistischer Avatare, die entsprechend der Gesprächsdynamik einer dyadischen Interaktion gestikulieren |
andere |
| 13.09.2024 | |
Alles schnell segmentieren | Das CNN-Segment-Anything-Modell wurde mit nur 2 % des von SAM-Autoren veröffentlichten SA-1B-Datensatzes trainiert |
andere |
| 10.09.2024 | |
Neuralangelo | Framework für die hochauflösende 3D-Oberflächenrekonstruktion aus RGB-Videoaufnahmen |
andere |
| 02.09.2024 | |
BiRefNet | Bilateraler Referenzrahmen für hochauflösende dichotome Bildsegmentierung |
andere |
| 23.08.2024 | |
DREHEN | Lernen, die menschliche 3D-Pose und -Form durch Modellanpassung in der Schleife zu rekonstruieren |
|
| 21.08.2024 | |
YOlov10 | Ziel ist es, die Leistungs-Effizienz-Grenze von YOLOs sowohl in der Nachbearbeitung als auch in der Modellarchitektur weiter voranzutreiben |
andere |
| 20.08.2024 | |
SpecVQGAN | Zähmung der visuell gesteuerten Klangerzeugung durch Verkleinerung eines Trainingsdatensatzes auf einen Satz repräsentativer Vektoren |
|
| 12.07.2024 | |
LivePortrait | Videogesteuertes Porträtanimations-Framework mit Schwerpunkt auf besserer Verallgemeinerung, Steuerbarkeit und Effizienz für den praktischen Einsatz |
andere |
| 10.07.2024 | |
TAPIR | Verfolgen Sie jeden Punkt mit Initialisierung pro Frame und zeitlicher Verfeinerung |
andere |
| 05.07.2024 | |
Wav2Lip | Ein Lip-Sync-Experte ist alles, was Sie für die Sprach- und Lippenerzeugung in freier Wildbahn benötigen |
|
| 27.06.2024 | |
DeepLabCut | Effiziente Methode zur markerlosen Posenschätzung basierend auf Transferlernen mit tiefen neuronalen Netzen, die mit minimalen Trainingsdaten hervorragende Ergebnisse erzielt |
andere |
| 05.06.2024 | |
PoolFormer | MetaFormer ist genau das, was Sie zum Sehen brauchen |
andere |
| 01.06.2024 | |
StoryDiffusion | Methode der Selbstaufmerksamkeitsberechnung, die als konsistente Selbstaufmerksamkeit bezeichnet wird und die die Konsistenz zwischen den generierten Bildern erheblich erhöht und gängige vorab trainierte diffusionsbasierte Text-zu-Bild-Modelle im Zero-Shot-Verfahren erweitert |
|
| 04.05.2024 | |
PuLID | Pure- und Lightning-ID-Anpassung, eine optimierungsfreie ID-Anpassungsmethode für die Text-zu-Bild-Generierung |
|
| 03.05.2024 | |
FILM | Ein Frame-Interpolationsalgorithmus, der mehrere Zwischenframes aus zwei Eingabebildern mit großen Zwischenbewegungen synthetisiert |
andere |
| 03.05.2024 | |
VoiceCraft | Token-füllendes neuronales Codec-Sprachmodell, das modernste Leistung sowohl bei der Sprachbearbeitung als auch bei der Zero-Shot-Text-to-Speech-Umwandlung in Hörbüchern, Internetvideos und Podcasts erreicht |
|
| 21.04.2024 | |
ZeST | Verfahren zur schussfreien Materialübertragung auf ein Objekt im Eingabebild anhand eines Materialexemplarbildes |
|
| 16.04.2024 | |
InstantMesh | Feed-Forward-Framework für die sofortige 3D-Netzgenerierung aus einem einzigen Bild, mit modernster Generierungsqualität und erheblicher Trainingsskalierbarkeit |
andere |
| 16.04.2024 | |
AlphaFold | Hochpräzise Vorhersage der Proteinstruktur |
andere |
| 15.04.2024 | |
Würstchen | Architektur für die Text-zu-Bild-Synthese, die wettbewerbsfähige Leistung mit beispielloser Kosteneffizienz für groß angelegte Text-zu-Bild-Diffusionsmodelle kombiniert |
| 06.04.2024 | ||
AQLM | Extreme Komprimierung großer Sprachmodelle durch additive Quantisierung |
andere |
| 08.03.2024 | |
YOLOv9 | Lernen Sie mithilfe programmierbarer Verlaufsinformationen, was Sie lernen möchten |
|
| 05.03.2024 | |
Multi-LoRA-Komposition | LoRA Switch und LoRA Composite, Ansätze, die darauf abzielen, traditionelle Techniken in Bezug auf Genauigkeit und Bildqualität, insbesondere bei komplexen Kompositionen, zu übertreffen |
andere |
| 03.03.2024 | |
AMARETTO | Multiskalige und multimodale Inferenz regulatorischer Netzwerke zur Identifizierung von Zellkreisen und ihren Treibern, die innerhalb und zwischen biologischen Systemen menschlicher Krankheiten gemeinsam und unterschiedlich sind |
andere |
| 28.02.2024 | |
LIDA | Tool zum Generieren grammatikunabhängiger Visualisierungen und Infografiken | Victor Dibia |
| 06.02.2024 | |
ViT | Vision Transformer und MLP-Mixer-Architekturen |
andere |
| 06.02.2024 | |
3D Ken Burns | Eine Referenzimplementierung des 3D-Ken-Burns-Effekts aus einem einzelnen Bild mit PyTorch – bei einem einzelnen Eingabebild wird dieses Standbild mit einem virtuellen Kamerascan und Zoom unter Berücksichtigung der Bewegungsparallaxe animiert | Manuel Romero | 24.01.2024 | ||
VALL-E X | Sprachübergreifendes neuronales Codec-Sprachmodell für die sprachübergreifende Sprachsynthese |
andere |
| 19.01.2024 | |
PhotoMaker | Effiziente Methode zur personalisierten Text-zu-Bild-Generierung, die hauptsächlich eine beliebige Anzahl eingegebener ID-Bilder in eine Stapel-ID-Einbettung codiert, um ID-Informationen beizubehalten |
andere |
| 18.01.2024 | |
DDColor | End-to-End-Methode mit zwei Decodern zur Bildkolorierung |
andere |
| 15.01.2024 | |
PASD | Pixelbewusstes stabiles Diffusionsnetzwerk zur Erzielung eines robusten Real-ISR sowie einer personalisierten Stilisierung |
|
| 12.01.2024 | |
HandRefiner | Verfeinerung missgebildeter Hände in generierten Bildern durch diffusionsbasiertes bedingtes Inpainting |
|
| 08.01.2024 | |
GraphCast | Erlernen geschickter mittelfristiger globaler Wettervorhersagen |
andere |
| 04.01.2024 | |
ESM | Modellierung im evolutionären Maßstab: Vortrainierte Sprachmodelle für Proteine |
andere |
| 28.12.2023 | |
LLaVA | Large Language and Vision Assistant, ein durchgängig trainiertes großes multimodales Modell, das einen Vision-Encoder und LLM für allgemeines visuelles und Sprachverständnis verbindet |
|
| 22.12.2023 | |
Hintergrundmattierung V2 | Hochauflösende Hintergrundersetzungstechnik in Echtzeit, die mit 30 Bildern pro Sekunde in 4K-Auflösung und 60 Bildern pro Sekunde für HD auf einer modernen GPU arbeitet |
andere |
| 22.12.2023 | |
Gaußsches Splatting | Hochmoderne visuelle Qualität bei gleichzeitiger Beibehaltung konkurrenzfähiger Trainingszeiten und – was noch wichtiger ist – ermöglichen eine hochwertige Echtzeit-Synthese (≥ 100 fps) neuartiger Ansichten mit einer Auflösung von 1080p |
|
| 19.12.2023 | |
SMPler-X | Skalierung von EHPS in Richtung des ersten generalistischen Basismodells mit bis zu ViT-Huge als Rückgrat und Training mit bis zu 4,5 Millionen Instanzen aus verschiedenen Datenquellen |
andere |
| 18.12.2023 | |
DeepCache | Trainingsfreies Paradigma, das die Verbreitung von Modellen aus der Perspektive der Modellarchitektur beschleunigt |
|
| 18.12.2023 | |
MagicAnimate | Diffusionsbasiertes Framework, das darauf abzielt, die zeitliche Konsistenz zu verbessern, das Referenzbild originalgetreu zu bewahren und die Animationstreue zu verbessern |
andere |
| 18.12.2023 | |
DiffBIR | Auf dem Weg zur Wiederherstellung blinder Bilder mit generativer Diffusion Prior |
andere |
| 18.12.2023 | |
AudioLDM | Text-zu-Audio-System, das auf einem latenten Raum aufbaut, um die kontinuierlichen Audiodarstellungen aus kontrastiven Sprach-Audio-Vortrainingslatenten zu lernen |
andere |
| 02.12.2023 | |
TabPFN | Neuronales Netzwerk, das gelernt hat, tabellarische Datenvorhersagen durchzuführen |
|
| 29.11.2023 | |
Konzeptschieberegler | Plug-and-Play-Low-Rank-Adapter, die auf vorab trainierten Modellen angewendet werden |
|
| 26.11.2023 | |
Qwen-VL | Satz groß angelegter Vision-Sprachmodelle, die darauf ausgelegt sind, sowohl Text als auch Bilder wahrzunehmen und zu verstehen |
andere |
| 24.11.2023 | |
AnimeGANv3 | Generatives gegnerisches Double-Tail-Netzwerk für schnelle Fotoanimationen |
|
| 23.11.2023 | |
Ithaka | Erstes tiefes neuronales Netzwerk zur Textrestaurierung, geografischen und chronologischen Zuordnung antiker griechischer Inschriften |
andere |
| 21.11.2023 | |
PixArt-Σ | Schwach-zu-stark-Training des Diffusionstransformators für die 4K-Text-zu-Bild-Generierung |
andere |
| 07.11.2023 | |
Null123++ | Bildbedingtes Diffusionsmodell zur Generierung 3D-konsistenter Mehransichtsbilder aus einer einzigen Eingabeansicht |
andere |
| 26.10.2023 | |
UniFormerV2 | Einheitlicher Transformator für effizientes räumlich-zeitliches Repräsentationslernen |
andere |
| 20.10.2023 | |
Show-1 | Hybridmodell, genannt Show-1, das pixelbasierte und latentbasierte VDMs für die Text-zu-Video-Generierung vereint |
andere |
| 15.10.2023 | |
AudioSep | Grundlagenmodell für die Trennung von Audioquellen im offenen Bereich mit Abfragen in natürlicher Sprache |
andere |
| 12.10.2023 | |
DA-CLIP | Degradationsbewusstes Vision-Sprachmodell zur besseren Übertragung vorab trainierter Vision-Sprachmodelle auf Low-Level-Vision-Aufgaben als universelles Framework für die Bildwiederherstellung |
|
| 11.10.2023 | |
SadTalker | Erzeugt 3D-Bewegungskoeffizienten des 3DMM aus Audio und moduliert implizit ein neuartiges 3D-fähiges Gesichtsrendering für die Erzeugung sprechender Köpfe |
andere |
| 10.10.2023 | |
Musika | Musikgenerierungssystem, das mit einer einzigen Consumer-GPU an Hunderten von Stunden Musik trainiert werden kann und eine viel schnellere Generierung von Musik beliebiger Länge auf einer Consumer-CPU als in Echtzeit ermöglicht |
|
| 09.10.2023 | |
YOLOv6 | Einstufiges Objekterkennungs-Framework für industrielle Anwendungen |
|
| 08.10.2023 | |
DreamGaussian | Algorithmus zum Konvertieren von 3D-Gaußschen in texturierte Netze und Anwenden einer Feinabstimmungsphase zur Verfeinerung der Details |
|
| 04.10.2023 | |
SYMBOL | Ausgehend von einer Reihe von Bildern schätzt die Methode aus jedem Bild eine detaillierte 3D-Oberfläche und kombiniert diese dann zu einem animierbaren Avatar |
|
| 31.08.2023 | |
DINOv2 | Erstellen Sie leistungsstarke visuelle Funktionen, die direkt mit einfachen Klassifikatoren wie linearen Schichten für eine Vielzahl von Computer-Vision-Aufgaben eingesetzt werden können. Diese visuellen Funktionen sind robust und funktionieren domänenübergreifend gut, ohne dass eine Feinabstimmung erforderlich ist |
andere |
| 31.08.2023 | |
OWL-ViT | Einfache Objekterkennung mit offenem Vokabular mit Vision Transformers |
andere | 21.08.2023 | ||
StilGAN3 | Aliasfreie generative gegnerische Netzwerke |
andere |
| 13.08.2023 | |
FateZero | Textbasierte Zero-Shot-Bearbeitungsmethode für reale Videos ohne Schulung pro Eingabeaufforderung oder anwendungsspezifische Maske |
andere |
| 13.08.2023 | |
Großes GAN | Groß angelegtes GAN-Training für die Synthese natürlicher Bilder mit hoher Wiedergabetreue |
| 03.08.2023 | ||
Lama | Auflösungsrobustes Large Mask Inpainting mit Fourier-Faltungen |
andere |
| 02.08.2023 | |
MakeItTalk | Eine Methode, die aus einem einzigen Gesichtsbild mit Audio als einziger Eingabe ausdrucksstarke Talking-Head-Videos generiert |
andere |
| 27.07.2023 | |
HiDT | Ein generatives Bild-zu-Bild-Modell und ein neues Upsampling-Schema, das die Anwendung der Bildübersetzung mit hoher Auflösung ermöglicht |
|
| 24.07.2023 | |
CutLER | Einfacher Ansatz zum Trainieren unbeaufsichtigter Objekterkennungs- und Segmentierungsmodelle |
|
| 24.07.2023 | |
Alles erkennen und Tag2Text markieren | Pre-Training-Framework für Vision-Sprache, das Bild-Tagging in Vision-Sprachmodelle einführt, um das Erlernen visuell-linguistischer Funktionen zu unterstützen |
andere |
| 09.07.2023 | |
Spline-Bewegungsmodell für dünne Platten | End-to-End-Framework für die unbeaufsichtigte Bewegungsübertragung |
|
| 07.07.2023 | |
DragGAN | Ziehen Sie Ihr GAN: Interaktive punktbasierte Manipulation auf dem generativen Bildverteiler |
andere |
| 03.07.2023 | |
MobileSAM | Auf dem Weg zu leichtgewichtigem SAM für mobile Anwendungen |
andere |
| 30.06.2023 | |
Erdung DINO | Verbindung von DINO mit geerdetem Vortraining zur Erkennung offener Objekte |
andere |
| 28.06.2023 | |
T5X | Modulares, zusammensetzbares, forschungsfreundliches Framework für leistungsstarkes, konfigurierbares Self-Service-Training, Bewertung und Inferenz von Sequenzmodellen auf vielen Skalen |
andere |
| 27.06.2023 | |
CodeTalker | Setzen Sie sprachgesteuerte Gesichtsanimationen als Codeabfrageaufgabe in einen endlichen Proxy-Raum des erlernten Codebuchs um, was die Lebendigkeit der erzeugten Bewegungen effektiv fördert, indem die Unsicherheit bei der modalübergreifenden Zuordnung verringert wird |
andere |
| 16.06.2023 | |
Bewegungsmodell erster Ordnung für Bildanimation | Gesichtsbewegungen vom Video auf das Bild übertragen | Aliaksandr Siarohin |
| 04.06.2023 | |
Paralleles WaveGAN | Hochmoderne nicht-autoregressive Modelle zum Erstellen Ihres eigenen großartigen Vocoders | Tomoki Hayashi |
| 01.06.2023 | |
WIRTSCHAFT | Entwickelt für die „Digitalisierung des Menschen aus einem Farbbild“, das die besten Eigenschaften impliziter und expliziter Darstellungen kombiniert, um aus Bildern in freier Wildbahn hochauflösende 3D-bekleidete Menschen abzuleiten, selbst mit lockerer Kleidung oder in herausfordernden Posen |
|
| 31.05.2023 | |
MMS | Das Massively Multilingual Speech-Projekt erweitert die Sprachtechnologie von etwa 100 Sprachen auf über 1000, indem es ein einziges mehrsprachiges Spracherkennungsmodell erstellt, das über 1100 Sprachen unterstützt, Spracherkennungsmodelle, die über 4000 Sprachen identifizieren können, vorab trainierte Modelle, die über 1400 Sprachen unterstützen, und Text-zu- Sprachmodelle für über 1100 Sprachen |
andere |
| 26.05.2023 | |
Fabelhaft | Flow AIS Bootstrap verwendet AIS, um Proben in Regionen zu generieren, in denen die Strömung eine schlechte Annäherung an das Ziel darstellt, und erleichtert so die Entdeckung neuer Modi |
|
| 29.04.2023 | |
CodeFormer | Transformatorbasiertes Vorhersagenetzwerk zur Modellierung der globalen Zusammensetzung und des Kontexts von Gesichtern mit geringer Qualität für die Codevorhersage, was die Entdeckung natürlicher Gesichter ermöglicht, die den Zielgesichtern sehr nahe kommen, selbst wenn die Eingaben stark beeinträchtigt sind |
|
| 21.04.2023 | |
Text2Video-Null | Text-zu-Bild-Diffusionsmodelle sind Zero-Shot-Videogeneratoren |
andere |
| 11.04.2023 | |
Segmentieren Sie alles | Das Segment Anything Model erzeugt hochwertige Objektmasken aus Eingabeaufforderungen wie Punkten oder Kästchen und kann zum Generieren von Masken für alle Objekte in einem Bild verwendet werden |
andere |
| 10.04.2023 | |
Folgen Sie Ihrer Pose | Zweistufiges Trainingsschema, das Bildposenpaare und Posenfreie Videodatensätze sowie das vorab trainierte Text-zu-Bild-Modell nutzen kann, um die Posen-steuerbaren Charaktervideos zu erhalten |
andere |
| 07.04.2023 | |
EVA3D | Hochwertiges, bedingungsloses menschliches generatives 3D-Modell, das für das Training nur 2D-Bildsammlungen erfordert |
|
| 06.04.2023 | |
Stabile Traumfusion | Verwendung eines vorab trainierten 2D-Text-zu-Bild-Diffusionsmodells zur Durchführung einer Text-zu-3D-Synthese |
|
| 04.04.2023 | |
PIFuHD | Mehrstufige, pixelausgerichtete implizite Funktion für die hochauflösende 3D-Digitalisierung des Menschen |
|
| 26.03.2023 | |
VideoReTalking | System zum Bearbeiten der Gesichter eines realen Talking-Head-Videos entsprechend dem Eingangsaudio, um ein hochwertiges und lippensynchrones Ausgangsvideo auch mit einer anderen Emotion zu erzeugen |
andere |
| 19.03.2023 | |
Visueller ChatGPT | Verbindet ChatGPT und eine Reihe von Visual Foundation-Modellen, um das Senden und Empfangen von Bildern während des Chats zu ermöglichen |
andere |
| 15.03.2023 | |
Tune-A-Video | One-Shot-Tuning von Bilddiffusionsmodellen für die Text-zu-Video-Generierung |
andere |
| 23.02.2023 | |
GPEN | GAN Prior Embedded Network für die Wiederherstellung blinder Gesichter in freier Wildbahn |
|
| 15.02.2023 | |
PyMAF-X | Кegressionsbasierter Ansatz zur Wiederherstellung parametrischer Ganzkörpermodelle aus monokularen Bildern |
andere |
| 14.02.2023 | |
Disco-Verbreitung | Eine frankensteinische Zusammenstellung von Notizbüchern, Modellen und Techniken zur Erstellung von KI-Kunst und Animationen |
|
| 11.02.2023 | |
GrooVAE | Einige Anwendungen des maschinellen Lernens zum Erzeugen und Bearbeiten von Beats und Schlagzeugspielen |
|
| 02.02.2023 | |
Mehrspurige MusikVAE | Die Modelle in diesem Notebook sind in der Lage, einzelne Takte von bis zu 8 Spuren zu kodieren und zu dekodieren, optional abhängig von einem zugrunde liegenden Akkord |
andere |
| 02.02.2023 | |
MusicVAE | Ein hierarchisches latentes Vektormodell zum Erlernen der Langzeitstruktur in der Musik |
|
| 02.02.2023 | |
Malen lernen | Malen lernen mit modellbasiertem Deep Reinforcement Learning | Manuel Romero | 01.02.2023 | ||
Instant-NGP | Sofortige neuronale Grafikprimitive mit einer Hash-Kodierung mit mehreren Auflösungen |
|
| 18.01.2023 | |
Fourier-Feature-Netzwerke | Fourier-Funktionen ermöglichen es Netzwerken, Hochfrequenzfunktionen in niederdimensionalen Domänen zu lernen |
andere |
| 17.01.2023 | |
AlphaPose | Regionale Ganzkörper-Posenschätzung und -verfolgung für mehrere Personen in Echtzeit |
andere |
| 07.01.2023 | |
HybrIK | Hybride analytisch-neuronale inverse Kinematiklösung für die 3D-Posen- und Formschätzung des Menschen |
andere |
| 01.01.2023 | |
Scoring-Jakobianische Verkettung | Wenden Sie die Kettenregel auf die erlernten Farbverläufe an und propagieren Sie die Punktzahl eines Diffusionsmodells durch den Jacobi-Wert eines differenzierbaren Renderers, den wir als Voxel-Strahlungsfeld instanziieren |
|
| 05.12.2022 | |
Demucs | Hybridspektrogramm und Wellenformquellentrennung | Alexandre Défossez |
| 21.11.2022 | |
StyleCLIP | Textgesteuerte Manipulation von StyleGAN Imager |
|
| 30.10.2022 | |
MotionDiffuse | Das erste Diffusionsmodell-basierte Framework zur textgesteuerten Bewegungsgenerierung, das gegenüber bestehenden Methoden mehrere gewünschte Eigenschaften aufweist |
andere |
| 13.10.2022 | |
VToonify | Nutzt die Ebenen mittlerer und hoher Auflösung von StyleGAN, um hochwertige künstlerische Porträts basierend auf den von einem Encoder extrahierten mehrskaligen Inhaltsfunktionen zu rendern, um die Bilddetails besser zu bewahren |
|
| 07.10.2022 | |
PyMAF | Feedbackschleife zur Pyramidennetzausrichtung im Regressionsnetzwerk für die Wiederherstellung eines gut ausgerichteten Körpernetzes und deren Erweiterung für die Wiederherstellung ausdrucksstarker Ganzkörpermodelle |
andere |
| 06.10.2022 | |
AlphaTensor | Entdecken Sie schnellere Matrixmultiplikationsalgorithmen mit Reinforcement Learning |
andere |
| 04.10.2022 | |
Swin2SR | Neuartiger Swin Transformer V2, um SwinIR für Bild-Superauflösung und insbesondere das komprimierte Eingabeszenario zu verbessern |
|
| 03.10.2022 | |
Funkta | Von Daten zu Funktionen: Ihr Datenpunkt ist eine Funktion und Sie können ihn wie eine solche behandeln |
|
| 24.09.2022 | |
Flüstern | Automatisches Spracherkennungssystem, das auf 680.000 Stunden mehrsprachiger und multitaskingüberwachter Daten aus dem Internet trainiert wurde |
andere |
| 21.09.2022 | |
DeOldify (Video) | Kolorieren Sie Ihre eigenen Videos! | Jason Antic |
| 19.09.2022 | |
DeOldify (Foto) | Kolorieren Sie Ihre eigenen Fotos! |
|
| 19.09.2022 | |
Echt-ESRGAN | Erweitern Sie das leistungsstarke ESRGAN zu einer praktischen Wiederherstellungsanwendung, die mit rein synthetischen Daten trainiert wird |
|
| 18.09.2022 | |
IDE-3D | Interaktive entwirrte Bearbeitung für hochauflösende 3D-fähige Porträtsynthese |
andere |
| 08.09.2022 | |
Entscheidungstransformatoren | Eine Architektur, die das Problem von RL als bedingtes Sequenzmodell umsetzt
Expandieren
Zusätzliche Informationen
Ähnliche Anwendungen
Empfohlen für Sie
Ähnliche Nachrichten
Alle
|