Um mecanismo de pesquisa de texto que suporta pesquisa difusa mista em chinês e inglês
Leia-me
Um mecanismo de pesquisa de texto baseado em programação dinâmica que suporta pesquisa difusa mista em chinês e inglês, retornando os resultados de correspondência de maior peso.
Confira esta demonstração online se você estiver interessado.
npm i text-search-engine
Suporta ambientes Node.js
e Web
.
import { search } from 'text-search-engine'
const source = 'nonode'
search ( source , 'no' ) //[[0, 1]]
// Matches 'no', continuous characters have higher weight
search ( source , 'nod' ) // [[2, 4]]
search ( source , 'noe' ) // [[0, 1], [5, 5]]
search ( source , 'oo' ) // [[1, 1],[3, 3]]
search('nonode', 'noe')
Resultado da correspondência: não acenar e
import { search } from 'text-search-engine'
const source = '地表最强前端监控平台'
search ( source , 'jk' ) // [[6, 7]]
search ( source , 'qianduapt' ) // [[4, 5],[8, 9]]
search('地表最强前端监控平台', 'qianduapt')
Resultado da partida: 地表最强前端监控平台
import { search } from 'text-search-engine'
search ( 'Node.js 最强监控平台 V9' , 'nodejk' ) //[[0, 3],[10, 11]]
const source_2 = 'a_nd你你的就是我的'
search ( source_2 , 'nd' ) //[[2, 3]]
// Matches '你你的'
search ( source_2 , 'nnd' ) //[[4, 6]]
// Matches 'a_'n'd你你的就'是我的'
search ( source_2 , 'nshwode' ) //[[2, 2],[8, 10]]
search('Node.js 最强监控平台 V9', 'nodejk')
Resultado da correspondência: Nó .js novo监控Versão V9
Adicionar espaços torna cada termo independente. Cada termo começa a corresponder desde o início e os termos correspondentes serão removidos, de modo que o próximo termo começa a corresponder desde o início e ignora os termos correspondidos anteriormente.
const source_1 = 'Node.js 最强监控平台 V9'
search ( source_1 , 'jknode' ) // undefined
search ( source_1 , 'jk node' ) // [[10, 11],[0, 3]]
search('Node.js 最强监控平台 V9', 'jk node')
Resultado da correspondência: Nó .js novo监控Versão V9
const source_1 = 'zxhxo zhx'
search ( source_1 , 'zh' ) //[[6, 7]])
// Even though the weight of 'zh' is higher, but the next term 'o' is not matched, so hit the previous one
search ( source_1 , 'zho' ) //[[0, 0],[2, 2],[4, 4]])
Esta API é usada para validar rapidamente os destaques de correspondência de texto. Ele retorna códigos de escape ANSI que podem ser gerados usando console.log em ambientes Web e Node.js para ver o texto destacado.
import { highlightMatches } from 'text-search-engine'
console . log ( highlightMatches ( 'Node.js 最强监控平台 V9' , 'nodev9' ) )
O console produzirá: Nó .js 最强监控平台V9
Padrão: false
const source = 'chrome 应用商店'
search ( source , 'meyinyon' ) //[[4, 5], [7, 8]])
// would merge blank spaces between each index of the matched term
search ( source , 'meyinyon' , { mergeSpaces : true } ) //[[4, 8]])
Padrão: undefined
const source = 'Node.js 最强监控平台 V8'
search ( source , 'nozjk' ) //[[0, 1], [8, 8], [10, 11]]
// When the strictnessCoefficient is 0.5 and nozjk is five characters long, Math.ceil(5 * 0.5) equals 3. If the match is less than or equal to 3 characters, it will return normally.
search ( source , 'nozjk' , { strictnessCoefficient : 0.5 } ) //[[0, 1], [8, 8], [10, 11]]
search ( source , 'nozjk' , { strictnessCoefficient : 0.4 } ) //undefined
Dê uma olhada na demonstração online do CodeSandbox
import { HighlightWithTarget } from 'text-search-engine/react'
function Test ( ) {
return < HighlightWithTarget source = 'Node.js 最强监控平台 V9' target = 'nodejk' / >
}
import { HighlightWithRanges } from 'text-search-engine/react'
import { search } from 'text-search-engine'
export default function DemoForHighlightWithTarget ( ) {
const ranges = search ( 'Node.js 最强监控平台 V9' , 'nodejk' )
return < HighlightWithRanges source = 'Node.js 最强监控平台 V9' hitRanges = { ranges } / >
}
Complexidade de tempo | Complexidade Espacial | |
---|---|---|
Melhor | O(M(fonte)) | O(M(fonte)) |
Pior | O(M(fonte) * N(destino)) | O(M(fonte) * N(destino)) |
Consulte as diretrizes de contribuição para saber mais.
Um grande obrigado a todos os nossos incríveis colaboradores ❤️
Sinta-se à vontade para se divertir e enviar um PR!
bem-vindo para levantar o problema, você pode entrar em contato comigo por wx ou e-mail se tiver alguma boa sugestão (notas: mecanismo de pesquisa de texto)