Загрузка txtmarker - Загрузка исходного кода txtmarker

txtmarker

Другой исходный код

v1.0.0

Скачать

txtmarker выделяет текст в документах. txtmarker берет список пар (имя, текст), сканирует входной документ и создает измененную версию со встроенными выделениями.

Текущие поддерживаемые форматы файлов:

PDF

Установка

Самый простой способ установки — через pip и PyPI.

 pip install txtmarker

Вы также можете установить txtmarker прямо с GitHub. Рекомендуется использовать виртуальную среду Python.

 pip install git+https://github.com/neuml/txtmarker

Поддерживается Python 3.8+

Примеры

В каталоге примеров есть серия примеров и блокнотов, дающих обзор txtmarker. См. список блокнотов ниже.

Ноутбуки

Блокнот	Описание
Представляем текстовый маркер	Обзор функциональности, предоставляемой txtmarker
Мелирование трансформерами	Подсветка на основе искусственного интеллекта с помощью Transformers

Конфигурация

В следующем разделе представлен обзор маркеров и доступных методов/конфигураций. Подробные примеры см. в блокнотах выше.

Создайте новый маркер

 from txtmarker . factory import Factory
highlighter = Factory . create ( "pdf" )

расширение

 extension : string

Тип маркера для создания (например, pdf)

Необязательные аргументы конструктора:

форматтер

 formatter : callable

Форматирует запросы и вводит текст с помощью этого метода. Помогает очистить файлы с большим количеством символов и другого содержимого.

куски

 chunks : int

Разбивает запросы на несколько частей. Это предназначено для очень длинных текстовых совпадений.

Выделить текст

 highlighter . highlight ( "input.pdf" , "output.pdf" , [( "name" , "text to highlight" )])

инфиль

 infile : string

Полный путь к входному файлу

исходный файл

 outfile : string

Полный путь к выходному файлу, т.е. выделенному файлу.

основные моменты

 highlights : list of (string, string|regex)

Список выделенных элементов. Каждая пара имеет имя (может быть «Нет») и текстовое значение. Текст может быть строкой или регулярным выражением.

Расширять

Дополнительная информация

Версия v1.0.0
Тип Другой исходный код
Время обновления 2024-12-25
размер 752.18KB
От Github

Связанные приложения

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

txtmarker

Установка

Примеры

Ноутбуки

Конфигурация

Создайте новый маркер

расширение

Необязательные аргументы конструктора:

форматтер

куски

Выделить текст

инфиль

исходный файл

основные моменты

waymo open dataset

SmartTube

Sunamu

MySchedule.py

viptools for eslam

VITAident

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind