txtmarkerダウンロード - txtmarkerソースコードのダウンロード

txtmarker

その他のソースコード

v1.0.0

ダウンロード

txtmarker はドキュメント内のテキストを強調表示します。 txtmarker は、(名前、テキスト) ペアのリストを取得し、入力ドキュメントをスキャンし、ハイライトが埋め込まれた修正バージョンを作成します。

現在サポートされているファイル形式:

pdf

インストール

最も簡単なインストール方法は、pip と PyPI を使用することです。

 pip install txtmarker

txtmarker を GitHub から直接インストールすることもできます。 Python 仮想環境の使用をお勧めします。

 pip install git+https://github.com/neuml/txtmarker

Python 3.8以降がサポートされています

例

サンプルディレクトリには、txtmarker の概要を説明する一連のサンプルとノートブックが含まれています。以下のノートブックのリストを参照してください。

ノート

ノート	説明
txtマーカーの紹介	txtmarker が提供する機能の概要
トランスフォーマーによるハイライト	Transformers による AI 主導のハイライト表示

構成

次のセクションでは、ハイライターと利用可能なメソッド/設定の概要を説明します。詳細な例については、上記のノートブックを参照してください。

新しいハイライトを作成する

 from txtmarker . factory import Factory
highlighter = Factory . create ( "pdf" )

拡大

 extension : string

作成するハイライターのタイプ (つまり PDF)

オプションのコンストラクター引数:

フォーマッタ

 formatter : callable

このメソッドを使用してクエリと入力テキストをフォーマットします。シンボルやその他のコンテンツが多く含まれるファイルのクリーンアップに役立ちます。

チャンク

 chunks : int

クエリを複数のチャンクに分割します。これは、非常に長いテキストの一致用に設計されています。

テキストを強調表示する

 highlighter . highlight ( "input.pdf" , "output.pdf" , [( "name" , "text to highlight" )])

インファイル

 infile : string

入力ファイルへのフルパス

アウトファイル

 outfile : string

出力ファイル、つまり強調表示されたファイルへのフルパス

ハイライト

 highlights : list of (string, string|regex)

ハイライト要素のリスト。各ペアには名前 (None も可) とテキスト値があります。テキストは文字列または正規表現のいずれかです。

拡大する

追加情報

バージョン v1.0.0
タイプその他のソースコード
更新時間 2024-12-25
サイズ 752.18KB
から Github

txtmarker

インストール

例

ノート

構成

新しいハイライトを作成する

拡大

オプションのコンストラクター引数:

フォーマッタ

チャンク

テキストを強調表示する

インファイル

アウトファイル

ハイライト

waymo open dataset

SmartTube

Sunamu

MySchedule.py

viptools for eslam

VITAident

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind