hf for legal загрузки - hf for legal загрузки исходного кода

hf for legal

AI Исходный код

0.0.12

Скачать

HF for Legal: пакет сообщества для юридических приложений?

Добро пожаловать в пакет HF for Legal, библиотеку, призванную устранить непрозрачность языковых моделей для юристов. Наша миссия — предоставить практикующим юристам, ученым и исследователям знания и инструменты, необходимые им для навигации в сложном мире искусственного интеллекта в юридической сфере. В HF for Legal мы стремимся:

Демистифицируйте языковые модели искусственного интеллекта для юридического сообщества
Делитесь тщательно подобранными ресурсами, включая специализированные правовые модели, наборы данных и инструменты.
Содействие сотрудничеству в проектах, которые расширяют юридические исследования и практику с помощью ИИ.
Предоставить платформу для обсуждения этических последствий и лучших практик применения ИИ в законодательстве.
Предлагайте учебные пособия и семинары по использованию технологий искусственного интеллекта в юридической работе.

Объединяя экспертов по праву, исследователей искусственного интеллекта и энтузиастов технологий, мы стремимся создать открытую экосистему, в которой юристы смогут легко получать доступ, понимать и использовать модели искусственного интеллекта, адаптированные к их потребностям. Независимо от того, являетесь ли вы практикующим адвокатом, ученым-юристом или технологом, интересующимся юридическим применением ИИ, HF for Legal — это ваш центр исследований, обучения и инноваций в развивающейся сфере юридической практики с использованием ИИ.

Установка

Чтобы использовать hf-for-legal, вам необходимо установить следующие пакеты Python:

numpy
datasets
tqdm

Вы можете установить эти пакеты через pip:

pip install numpy datasets hf-for-legal tqdm

Использование

Сначала инициализируйте класс DatasetFormatter своим набором данных:

 import datasets
from hf_for_legal import DatasetFormatter

# Load a sample dataset
dataset = datasets . Dataset . from_dict (
  {
    "document" : [
      "This is a test document." , 
      "Another test document."
    ]
  }
)

# Create an instance of DatasetFormatter
formatter = DatasetFormatter ( dataset )

# Apply the hash and UUID functions
formatted_dataset = formatter ()
print ( formatted_dataset )

Класс: DatasetFormatter

Параметры:

набор данных ( datasets.Dataset ): набор данных, который нужно отформатировать.

Атрибуты:

набор данных ( datasets.Dataset ): исходный набор данных.

Методы

hash(self, имя_столбца: str = "документ", имя_столбца_hash: str = "хеш") -> наборы данных.Набор данных

Добавьте в набор данных хэш-столбец SHA-256.

Параметры:

имя_столбца ( str , необязательно): имя столбца, содержащего текст для хеширования. По умолчанию — «документ».
hash_column_name ( str , необязательно): имя столбца для хранения хэш-значений. По умолчанию используется «хэш».

Возврат:

datasets.Dataset : набор данных с новым хеш-столбцом.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

uuid(self, uuid_column_name: str = "uuid") -> datasets.Dataset

Добавьте столбец UUID в набор данных.

Параметры:

uuid_column_name ( str , необязательно): имя столбца для хранения значений UUID. По умолчанию — «uuid».

Возврат:

datasets.Dataset : набор данных с новым столбцом UUID.

normalize_text(self, имя_столбца: str, имя_столбца_normalized: необязательный[str] = нет) -> наборы данных.Набор данных

Нормализовать текст в указанном столбце путем преобразования в нижний регистр и удаления пробелов.

Параметры:

имя_столбца ( str ): имя столбца, содержащего текст, который нужно нормализовать.
normalized_column_name ( str , необязательно): имя нового столбца для хранения нормализованного текста. Если он не указан, он перезаписывает исходный столбец.

Возврат:

datasets.Dataset : набор данных с нормализованным текстовым столбцом.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

filter_rows(self, условие: Callable) -> datasets.Dataset

Фильтровать строки по заданному условию.

Параметры:

условие ( Callable ): функция, которая принимает строку (dict) и возвращает True, если строка должна быть включена в отфильтрованный набор данных.

Возврат:

datasets.Dataset : отфильтрованный набор данных.

rename_column(self, old_column_name: str, new_column_name: str) -> datasets.Dataset

Переименуйте столбец в наборе данных.

Параметры:

old_column_name ( str ): текущее имя столбца, который нужно переименовать.
new_column_name ( str ): новое имя столбца.

Возврат:

datasets.Dataset : набор данных с переименованным столбцом.

Поднимает:

ValueError : если указанное имя_старого_столбца не существует в наборе данных.

drop_column(self, имя_столбца: str) -> datasets.Dataset

Удалите указанный столбец из набора данных.

Параметры:

имя_столбца ( str ): имя столбца, который нужно удалить.

Возврат:

datasets.Dataset : набор данных с удаленным указанным столбцом.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

add_constant_column(self, имя_столбца: str, константное_значение) -> наборы данных.Набор данных

Добавьте новый столбец с постоянным значением.

Параметры:

имя_столбца ( str ): имя нового добавляемого столбца.
константное_значение : постоянное значение, которое будет присвоено каждой строке в новом столбце.

Возврат:

datasets.Dataset : набор данных с новым столбцом постоянного значения.

Convert_column_type(self, имя_столбца: str, new_type: Union[type, str]) -> datasets.Dataset

Преобразуйте столбец в указанный тип данных.

Параметры:

имя_столбца ( str ): имя столбца, который нужно преобразовать.
new_type ( Union[type, str] ): новый тип данных для столбца, например, int, float, str.

Возврат:

datasets.Dataset : набор данных с преобразованным столбцом.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

fill_missing(self, имя_столбца: str, fill_value) -> наборы данных.Набор данных

Заполните недостающие значения в столбце указанным значением.

Параметры:

имя_столбца ( str ): имя столбца с пропущенными значениями, которые необходимо заполнить.
fill_value : значение, которое нужно заполнить для отсутствующих значений.

Возврат:

datasets.Dataset : набор данных с заполненными пропущенными значениями.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

Compute_summary(self, имя_столбца: str) -> Dict[str, float]

Вычисление сводной статистики для числового столбца.

Параметры:

имя_столбца ( str ): имя числового столбца, для которого вычисляется сводная статистика.

Возврат:

Dict[str, float] : словарь, содержащий сводную статистику (среднее, медиана, стандартное значение) для столбца.

Поднимает:

ValueError : если указанное имя_столбца не существует в наборе данных.

вызов (self, hash_column_name: str = "hash", uuid_column_name: str = "uuid") -> datasets.Dataset

Примените к набору данных функции хеширования и UUID.

Параметры:

hash_column_name ( str , необязательно): имя нового столбца для хранения хеш-значений. По умолчанию используется «хеш».
uuid_column_name ( str , необязательно): имя нового столбца для хранения значений UUID. По умолчанию — «uuid».

Возврат:

datasets.Dataset : набор данных со столбцами хеша и UUID.

Разногласия в сообществе

Теперь вы можете присоединяться, общаться и делиться информацией на сервере сообщества HF for Legal в Discord.

Ссылка на сервер: https://discord.gg/adwsfUUhw8

Этот сервер упростит общение между членами организации и обеспечит синергию вокруг различных проектов в трех областях: интерактивные приложения, базы данных и модели.

Пример проекта, который скоро будет опубликован: дублирование базы данных Laws, но на этот раз содержащее встраивания, уже рассчитанные для разных моделей, чтобы обеспечить упрощенную интеграцию в Spaces (чат-бот RAG?) и сэкономить затраты на развертывание для пользователей, желающих использовать эти технологии. для своих профессиональных и личных проектов.

Цитирование и авторы

Если вы используете этот код в своих исследованиях, используйте следующую запись BibTeX.

 @misc { louisbrulenaudet2024 ,
  author =       { Louis Brulé Naudet } ,
  title =        { HF for Legal: A Community Package for Legal Applications } ,
  year =         { 2024 }
  howpublished = { url{https://github.com/louisbrulenaudet/hf-for-legal} } ,
}

Обратная связь

Если у вас есть какие-либо отзывы, напишите по адресу [email protected].

Расширять

Дополнительная информация

Версия 0.0.12
Тип AI Исходный код
Время обновления 2024-12-26
размер 32.17KB
От Github

Связанные приложения