Téléchargement de txtmarker - Téléchargement du code source txtmarker

txtmarker

Autre code source

v1.0.0

Télécharger

txtmarker met en évidence le texte dans les documents. txtmarker prend une liste de paires (nom, texte), numérise un document d'entrée et crée une version modifiée avec des surbrillances intégrées.

Formats de fichiers actuellement pris en charge :

pdf

Installation

Le moyen le plus simple d'installer est via pip et PyPI

 pip install txtmarker

Vous pouvez également installer txtmarker directement depuis GitHub. L'utilisation d'un environnement virtuel Python est recommandée.

 pip install git+https://github.com/neuml/txtmarker

Python 3.8+ est pris en charge

Exemples

Le répertoire d'exemples contient une série d'exemples et de cahiers donnant un aperçu de txtmarker. Voir la liste des cahiers ci-dessous.

Carnets

Carnet de notes	Description
Présentation de txtmarker	Aperçu des fonctionnalités fournies par txtmarker
Mise en évidence avec des transformateurs	Mise en évidence basée sur l'IA avec Transformers

Configuration

La section suivante donne un aperçu des surligneurs et des méthodes/configurations disponibles. Voir les cahiers ci-dessus pour des exemples détaillés.

Créer un nouveau surligneur

 from txtmarker . factory import Factory
highlighter = Factory . create ( "pdf" )

extension

 extension : string

Type de surligneur à créer (ex. pdf)

Arguments de constructeur facultatifs :

formateur

 formatter : callable

Formate les requêtes et saisit le texte à l’aide de cette méthode. Aide au nettoyage des fichiers contenant de nombreux symboles et autres contenus.

morceaux

 chunks : int

Divise les requêtes en plusieurs morceaux. Ceci est conçu pour les correspondances de texte très longues.

Surligner le texte

 highlighter . highlight ( "input.pdf" , "output.pdf" , [( "name" , "text to highlight" )])

fichier d'entrée

 infile : string

Chemin complet vers le fichier d'entrée

fichier extérieur

 outfile : string

Chemin complet vers le fichier de sortie, c'est-à-dire le fichier en surbrillance

points forts

 highlights : list of (string, string|regex)

Liste des éléments marquants. Chaque paire a un nom (peut être Aucun) et une valeur de texte. Le texte peut être une chaîne ou une expression régulière.

Développer

Informations supplémentaires

Version v1.0.0
Type Autre code source
Date de mise à jour 2024-12-25
taille 752.18KB
Provenant de Github

Applications connexes

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
wp functions

Autres catégories

1.0.0
termwind

Autres catégories

v2.3.0

Actualités connexes Tout