Caixa de pesquisa de arquivos extremamente rápida construída em Rust
Por favor, relate quaisquer problemas que você encontrar ao usar a pesquisa de ferrugem aqui: Problemas
Adicione rust_search = "2.0.0"
em Cargo.toml.
[ dependencies ]
rust_search = " 2.0.0 "
use rust_search :: SearchBuilder ;
fn main ( ) {
let search : Vec < String > = SearchBuilder :: default ( )
. location ( "~/path/to/directory" )
. search_input ( "what to search" )
. more_locations ( vec ! [ "/anotherPath/to/search" , "/keepAddingIfYouWant/" ] )
. limit ( 1000 ) // results to return
. ext ( "extension" )
. strict ( )
. depth ( 1 )
. ignore_case ( )
. hidden ( )
. build ( )
. collect ( ) ;
for path in search {
println ! ( "{}" , path ) ;
}
}
use rust_search :: { SearchBuilder , similarity_sort } ;
fn main ( ) {
let search_input = "fly" ;
let mut search : Vec < String > = SearchBuilder :: default ( )
. location ( "~/Desktop/" )
. search_input ( search_input )
. depth ( 1 )
. ignore_case ( )
. build ( )
. collect ( ) ;
similarity_sort ( & mut search , & search_input ) ;
for path in search {
println ! ( "{:?}" , path ) ;
}
}
pesquisa sem classificação de similaridade
["afly.txt", "bfly.txt", "flyer.txt", "fly.txt"]
pesquise com classificação por similaridade
["fly.txt", "flyer.txt", "afly.txt", "bfly.txt",]
use rust_search :: SearchBuilder ;
let files : Vec < String > = SearchBuilder :: default ( )
. location ( "/path/to/directory" )
. ext ( "file_extension" )
. build ( )
. collect ( ) ;
use rust_search :: SearchBuilder ;
let files : Vec < String > = SearchBuilder :: default ( )
. location ( "/path/to/directory" )
. depth ( 1 )
. build ( )
. collect ( ) ;
Para filtrar arquivos por date_created, date_modified, file_size e/ou custom_filter, use:
use rust_search :: { FileSize , FilterExt , SearchBuilder } ;
use std :: time :: { Duration , SystemTime } ;
let search : Vec < String > = SearchBuilder :: default ( )
. location ( "~/path/to/directory" )
. file_size_greater ( FileSize :: Kilobyte ( 200.0 ) )
. file_size_smaller ( FileSize :: Megabyte ( 10.0 ) )
. created_after ( SystemTime :: now ( ) - Duration :: from_secs ( 3600 * 24 * 10 ) )
. created_before ( SystemTime :: now ( ) )
. modified_after ( SystemTime :: now ( ) - Duration :: from_secs ( 3600 * 24 * 5 ) )
. custom_filter ( |dir| dir . metadata ( ) . unwrap ( ) . is_file ( ) )
. custom_filter ( |dir| !dir . metadata ( ) . unwrap ( ) . permissions ( ) . readonly ( ) )
. build ( )
. collect ( ) ;
Para mais exemplos, consulte a Documentação
A diferença no tamanho da amostra se deve ao fato de fd e glob serem ferramentas diferentes e terem casos de uso diferentes. fd é uma ferramenta de linha de comando que procura arquivos e diretórios. glob é uma biblioteca que pode ser usada para pesquisar arquivos e diretórios. O benchmark é feito em um MacBook Air M2, 16 GB de memória unificada.
Os benchmarks são feitos usando hyperfine. Os arquivos de benchmarks estão disponíveis na pasta da unidade de benchmarks.
O benchmark foi feito em diretórios contendo 300 mil arquivos.
Comando/Biblioteca | Significa] | Min [s] | Máx.[s] | Relativo |
---|---|---|---|---|
rust_search | 1,317±0,002 | 1.314 | 1.320 | 1,00 |
glob | 22,728±0,023 | 22.690 | 22.746 | 17,25±0,03 |
O benchmark foi feito em diretórios contendo arquivos de 45K.
Comando/Biblioteca | Média [ms] | Mín [ms] | Máx. [ms] | Relativo |
---|---|---|---|---|
rust_search | 680,5±2,1 | 678,3 | 683,6 | 1,00 |
fd -e .js | 738,7±10,2 | 720,8 | 746,7 | 1,09±0,02 |
+ rust_search is 17.25 times faster than Glob.
+ rust_search** is 1.09 times faster than FD.
Qualquer contribuição seria muito valorizada, pois esta biblioteca ainda está em seus estágios iniciais.
Se você quiser contribuir com este projeto, siga os passos abaixo:
Este projeto está licenciado sob os termos da licença do MIT.
Clique no botão abaixo para entrar no servidor discord ou Linkedin