nom Download - nom Source Code Скачать

nom

Другой исходный код

Скачать

nom, питание данных по байту

NOM - это библиотека комбинаторов анализаторов, написанная в Rust. Его цель состоит в том, чтобы предоставить инструменты для создания безопасных анализаторов без ущерба для скорости или потребления памяти. С этой целью он использует сильную печати Руста и безопасность памяти для производства быстрых и правильных анализаторов, а также предоставляет функции, макросы и признаки, чтобы абстрагировать большую часть сантехники склонности к ошибкам.

Ном с радостью возьмет байт из ваших файлов :)

Пример
Документация
Зачем использовать ном?
- Бинарный формат анализации
- Текст формат анализации
- Парсеры по программированию
- Потоковые форматы
Комбинаторы анализаторов
Технические функции
Требования к версии ржавчины
Установка
Связанные проекты
Парсеры, написанные с ном
Участники

Пример

Шестнадцатеричный цветовой анализатор:

 use nom :: {
  bytes :: complete :: { tag , take_while_m_n } ,
  combinator :: map_res ,
  sequence :: Tuple ,
  IResult ,
  Parser ,
} ;

# [ derive ( Debug , PartialEq ) ]
pub struct Color {
  pub red : u8 ,
  pub green : u8 ,
  pub blue : u8 ,
}

fn from_hex ( input : & str ) -> Result < u8 , std :: num :: ParseIntError > {
  u8 :: from_str_radix ( input , 16 )
}

fn is_hex_digit ( c : char ) -> bool {
  c . is_digit ( 16 )
}

fn hex_primary ( input : & str ) -> IResult < & str , u8 > {
  map_res (
    take_while_m_n ( 2 , 2 , is_hex_digit ) ,
    from_hex
  ) . parse ( input )
}

fn hex_color ( input : & str ) -> IResult < & str , Color > {
  let ( input , _ ) = tag ( "#" ) ( input ) ? ;
  let ( input , ( red , green , blue ) ) = ( hex_primary , hex_primary , hex_primary ) . parse ( input ) ? ;
  Ok ( ( input , Color { red , green , blue } ) )
}

fn main ( ) {
  println ! ( "{:?}" , hex_color ( "#2F14DF" ) )
}

# [ test ]
fn parse_color ( ) {
  assert_eq ! (
    hex_color ( "#2F14DF" ) ,
    Ok ( (
      "" ,
      Color {
        red: 47 ,
        green: 20 ,
        blue: 223 ,
      }
    ) )
  ) ;
}

Документация

Справочная документация
Nominomicon: руководство по использованию Nom
Различные дизайнерские документы и учебные пособия
Список комбинаторов и их поведение

Если вам нужна помощь в разработке ваших анализаторов, пожалуйста, пинг- geal на IRC (Libera, Geeknode, OFTC), перейдите к #nom-parsers на Libera IRC или в чате-комнате с друтком.

Зачем использовать ном

Если вы хотите написать:

Бинарный формат анализации

NOM был разработан для правильного разбора бинарных форматов с самого начала. По сравнению с обычными рукописными аналогичными анализаторами, анализаторы Nom так же быстры, свободны от уязвимостей переполнения буфера и обрабатывают для вас общие закономерности:

TLV
Бит -уровни диапазона
Шестнадцатеричный просмотр
Потоковые анализаторы для сетевых форматов и огромных файлов

Пример проектов:

FLV Parser
Матроска Паризер
Стоашн для смолы

Текст формат анализации

В то время как NOM был сделан для бинарного формата поначалу, вскоре он работал так же хорошо с форматами текста. От форматов на основе линий, таких как CSV, до более сложных, вложенных форматов, таких как JSON, NOM может управлять им, и предоставляет вам полезные инструменты:

Быстрое нечувствительное сравнение
Узнаватели для сбежавших струн
Регулярные выражения могут быть встроены в томенугольные анализаторы, чтобы кратко представлять сложные характерные паттерны
Специальная помощь была уделена правильному управлению персонажами не ASCII

Пример проектов:

Http -прокси
Toml Parser

Парсеры по программированию

В то время как анализаторы языка программирования обычно пишутся вручную для большей гибкости и производительности, NOM может (и успешно) используется в качестве прототипирования анализатора для языка.

NOM быстро запустит вас с мощными пользовательскими типами ошибок, которые вы можете использовать с помощью NOM_LOCATE, чтобы определить точную строку и столбец ошибки. Нет необходимости в отдельных этапах токенизации, лексинга и диапазона: NOM может автоматически обрабатывать диапазон пробелов и построить AST на месте.

Пример проектов:

PHP VM
Xshade Language

Потоковые форматы

В то время как многие форматы (и код обращаются с ними) предполагают, что они могут соответствовать полным данным в памяти, есть форматы, для которых мы получаем только часть данных одновременно, например, форматы сети или огромные файлы. NOM был разработан для правильного поведения с частичными данными: если не хватает данных, чтобы решить, NOM скажет вам, что ему нужно больше, вместо того, чтобы молча вернуть неправильный результат. Независимо от того, поступают ли ваши данные полностью или в кусках, результат должен быть таким же.

Это позволяет вам создавать мощные, детерминированные государственные машины для ваших протоколов.

Пример проектов:

Http -прокси
Использование NOM с генераторами

Комбинаторы анализаторов

Комбинаторы анализаторов - это подход к анализаторам, который сильно отличается от программного обеспечения, такого как Lex и YACC. Вместо того, чтобы записать грамматику в отдельном файле и генерировать соответствующий код, вы используете очень небольшие функции с очень специфической целью, например, «Take 5 байтов» или «распознавать слово« http »и собирать их по значимым шаблонам, как», такие как » Признайте «http», затем пространство, затем версия ». Полученный код маленький, и выглядит как грамматика, которую вы бы написали с другими подходами анализатора.

Это имеет несколько преимуществ:

Паризеры маленькие и легко писать
Компоненты анализаторов легко повторно используют (если они достаточно общие, добавьте их в ном!)
Компоненты анализаторов просты в отдельности (модульные тесты и тесты на основе свойств)
Код комбинации анализатора выглядит близко к грамматике, которую вы бы написали
Вы можете создавать частичные анализаторы, специфичные для данных, которые вам нужны в данный момент, и игнорировать остальные

Технические функции

Стоимость парсеров для:

Байто-ориентированный : базовый тип IS &[u8] и анализаторы будут работать как можно больше на ломтиках байтовых массивов (но не ограничиваются им)
бит-ориентированный : nom может обратиться к байтовому ломтике как бит-поток
ориентированный на строки : такой же комбинаторы также могут применяться на строках UTF-8
Zero-Copy : если анализатор возвращает подмножество своих входных данных, он вернет ломтик этого ввода, без копирования
потоковая передача : NOM может работать над частичными данными и обнаружить, когда ему нужно больше данных для получения правильного результата
Описательные ошибки : анализаторы могут собирать список кодов ошибок с указателями на экскриминированный входной срез. Эти списки ошибок могут быть сопоставлены с шаблоном для предоставления полезных сообщений.
Пользовательские типы ошибок : вы можете предоставить определенный тип для улучшения ошибок, возвращаемых анализаторами
Безопасный анализ : nom использует безопасную обработку памяти и мощные типы Rust, а аналогичные анализаторы обычно размываются и протестируются с помощью данных реального мира. До сих пор единственные недостатки, найденные Fuzzing, были в коде, написанном за пределами Nom
Скорость : тесты показали, что парсеры NOM часто превосходят многие библиотеки комбинаторов синтаксисов, такие как Parsec и AttoParsec, некоторые регулярные двигатели выражения и даже рукописные анализаторы C

Некоторые тесты доступны на GitHub.

Требования к версии ржавчины (MSRV)

Серия NOM 7.0 поддерживает Rustc версию 1.56 или более .

Текущая политика заключается в том, что это будет обновлено только в следующем крупном выпуске Nom.

Установка

Nom доступен на Crates.io и может быть включен в ваш проект с поддержкой груза, подобный этим:

[ dependencies ]
nom = " 7 "

Есть несколько функций компиляции:

alloc : (активируется по умолчанию) Если отключен, NOM может работать в no_std сборки без распределителей памяти. Если включено, комбинаторы, которые выделяют (например, many0 ) будут доступны
std : (активируется по умолчанию, активирует также alloc ), если отключен, NOM может работать в no_std BUILDS

Вы можете настроить эти функции, подобные этим:

[ dependencies . nom ]
version = " 7 "
default-features = false
features = [ " alloc " ]

Связанные проекты

Получить информацию о строке и столбце в типе ввода NOM
Использование NOM в качестве Lexer и Parser

Парсеры, написанные с ном

Вот (не исчерпывающий) список известных проектов, использующих NOM:

Форматы текстовых файлов: Ceph Crush, Cronenberg, электронная почта, статистика времени выполнения XFS, CSV, FASTA, FASTQ, INI, ISO 8601 даты, формат файла, подобного LibConfig, веб-архив, PDB, Proto Files, Fountain Markup, Vimwiki & Vimwiki_macros, Fountain Markupplay, Vimwiki & Vimwiki_Macros, фондовый сценарий Vimwiki & Vimwiki Язык Kconfig, шаблоны Askama
Языки программирования: PHP, базовый калькулятор, GLSL, LUA, Python, SQL, ELM, SystemVerilog, Turtle, CSML, WASM, Pseudocode, Filter для Meilisearch, Potterscript
Форматы определения интерфейса: комиссия
Форматы аудио, видео и изображений: GIF, Magicavoxel .vox, MIDI, SWF, WAVE, MATROSKA (MKV), SARSER EXIF/METADATA для JPEG/HEIF/HEIC/MOV/MP4
Форматы документов: TAR, GZ, GDSII
Криптографические форматы: x.509
Форматы сетевого протокола: Bencode, D-BUS, DHCP, HTTP, URI, IMAP (ALT), IRC, PCAP-NG, PCAP, PCAP + PCAPNG, IKEV2, NTP, SNMP, Kerberos V5, DER, TLS, IPFIX / NetFlow V10 , GTP, SIP, SMTP, Prometheus
Языковые спецификации: BNF
Форматы разной: Game Boy Rom, Ant Fit, номера версий, Telcordia/Bellcore SR-4731 SOR OTDR файлы, двоичный журнал MySQL, URI, Furigana, Result, NBT, NBT

Хотите создать новый анализатор, используя nom ? Список еще не реализованных форматов доступен здесь.

Хотите добавить здесь анализатор? Создайте запрос на это!