Reformulação da pergunta: Existe um dicionário de sinônimos contendo cerca de 400.000 palavras comumente usadas. Agora, dado um artigo, use este dicionário de sinônimos para analisar o número de ocorrências de palavras comuns e classifique essas palavras de maior para menor de acordo com o número de ocorrências.
Ideias para melhorar o algoritmo:
1. Normalmente um artigo contém muito menos do que as 400.000 palavras do banco de dados;
2. Após a indexação do banco de dados, o "método de dicotomia" pode ser usado para localizar palavras rapidamente;
3. Limite o intervalo de consulta palavra por palavra. Se o intervalo já for 0 quando um determinado caractere for consultado, pode-se prever que as palavras a seguir definitivamente não existirão (por exemplo, quando a floresta é consultada, não há palavra correspondente. , então pode terminar aqui).
Expandir