Текстовая поисковая система, поддерживающая смешанный нечеткий поиск на китайском и английском языках.
中文 README
Система текстового поиска на основе динамического программирования, которая поддерживает смешанный нечеткий поиск на китайском и английском языках и возвращает результаты сопоставления с наибольшим весом.
Если вам интересно, посмотрите эту онлайн-демо.
npm i text-search-engine
Поддерживает как Node.js
, так и Web
-среды.
import { search } from 'text-search-engine'
const source = 'nonode'
search ( source , 'no' ) //[[0, 1]]
// Matches 'no', continuous characters have higher weight
search ( source , 'nod' ) // [[2, 4]]
search ( source , 'noe' ) // [[0, 1], [5, 5]]
search ( source , 'oo' ) // [[1, 1],[3, 3]]
search('nonode', 'noe')
Результат совпадения: нет кивок е
import { search } from 'text-search-engine'
const source = '地表最强前端监控平台'
search ( source , 'jk' ) // [[6, 7]]
search ( source , 'qianduapt' ) // [[4, 5],[8, 9]]
search('地表最强前端监控平台', 'qianduapt')
Результат совпадения: 地表最强前端监控平台
import { search } from 'text-search-engine'
search ( 'Node.js 最强监控平台 V9' , 'nodejk' ) //[[0, 3],[10, 11]]
const source_2 = 'a_nd你你的就是我的'
search ( source_2 , 'nd' ) //[[2, 3]]
// Matches '你你的'
search ( source_2 , 'nnd' ) //[[4, 6]]
// Matches 'a_'n'd你你的就'是我的'
search ( source_2 , 'nshwode' ) //[[2, 2],[8, 10]]
search('Node.js 最强监控平台 V9', 'nodejk')
Результат совпадения: Узел .js: поддержка监控平台 V9
Добавление пробелов делает каждый термин независимым. Каждый термин начинает соответствовать с самого начала, и совпавшие термины будут удалены, поэтому следующий термин начинает совпадать с самого начала и игнорирует ранее совпавшие термины.
const source_1 = 'Node.js 最强监控平台 V9'
search ( source_1 , 'jknode' ) // undefined
search ( source_1 , 'jk node' ) // [[10, 11],[0, 3]]
search('Node.js 最强监控平台 V9', 'jk node')
Результат совпадения: Узел .js: поддержка监控平台 V9
const source_1 = 'zxhxo zhx'
search ( source_1 , 'zh' ) //[[6, 7]])
// Even though the weight of 'zh' is higher, but the next term 'o' is not matched, so hit the previous one
search ( source_1 , 'zho' ) //[[0, 0],[2, 2],[4, 4]])
Этот API используется для быстрой проверки выделения текстовых совпадений. Он возвращает escape-коды ANSI, которые можно вывести с помощью console.log как в веб-среде, так и в среде Node.js, чтобы увидеть выделенный текст.
import { highlightMatches } from 'text-search-engine'
console . log ( highlightMatches ( 'Node.js 最强监控平台 V9' , 'nodev9' ) )
Консоль выведет: Узел Использование .js для проверки подлинности V9
По умолчанию: false
const source = 'chrome 应用商店'
search ( source , 'meyinyon' ) //[[4, 5], [7, 8]])
// would merge blank spaces between each index of the matched term
search ( source , 'meyinyon' , { mergeSpaces : true } ) //[[4, 8]])
По умолчанию: undefined
const source = 'Node.js 最强监控平台 V8'
search ( source , 'nozjk' ) //[[0, 1], [8, 8], [10, 11]]
// When the strictnessCoefficient is 0.5 and nozjk is five characters long, Math.ceil(5 * 0.5) equals 3. If the match is less than or equal to 3 characters, it will return normally.
search ( source , 'nozjk' , { strictnessCoefficient : 0.5 } ) //[[0, 1], [8, 8], [10, 11]]
search ( source , 'nozjk' , { strictnessCoefficient : 0.4 } ) //undefined
Взгляните на онлайн-демо CodeSandbox.
import { HighlightWithTarget } from 'text-search-engine/react'
function Test ( ) {
return < HighlightWithTarget source = 'Node.js 最强监控平台 V9' target = 'nodejk' / >
}
import { HighlightWithRanges } from 'text-search-engine/react'
import { search } from 'text-search-engine'
export default function DemoForHighlightWithTarget ( ) {
const ranges = search ( 'Node.js 最强监控平台 V9' , 'nodejk' )
return < HighlightWithRanges source = 'Node.js 最强监控平台 V9' hitRanges = { ranges } / >
}
Временная сложность | Космическая сложность | |
---|---|---|
Лучший | О (М (источник)) | О (М (источник)) |
Худший | O(M(источник) * N(цель)) | O(M(источник) * N(цель)) |
Пожалуйста, ознакомьтесь с рекомендациями по участию, чтобы узнать больше.
Большое спасибо всем нашим замечательным участникам ❤️
Не стесняйтесь присоединиться к веселью и отправить PR!
добро пожаловать, чтобы поднять проблему, вы можете связаться со мной по wx или по электронной почте, если у вас есть хорошее предложение (примечания: текстовая поисковая система)