//Compara strings e retorna a área onde o primeiro caractere das duas strings é igual
static void php_similar_str(const char *txt1, int len1, const char *txt2, int len2, int *pos1, int *pos2, int *max)
{
caractere *p, *q;
char *end1 = (char *) txt1 + len1;
char *end2 = (char *) txt2 + len2;
intl;
*máx = 0;
//Iterar pela string
for (p = (char *) txt1; p < end1; p++) {
for (q = (char *) txt2; q < end2; q++) {
para (l = 0; (p + l < fim1) && (q + l < fim2) && (p[l] == q[l]); l++);
se (l > *máx) {
//Salva as mesmas informações da área
*máx = eu;
*pos1 = p - txt1;
*pos2 = q - txt2;
}
}
}
}
//Função recursiva, compare o número dos mesmos caracteres em txt1 e txt2
static int php_similar_char(const char *txt1, int len1, const char *txt2, int len2)
{
soma interna;
int pos1, pos2, max
php_similar_str(txt1, len1, txt2, len2, &pos1, &pos2, &max);
if ((sum = max)) {//Qual é o significado de escrever desta forma????!!!!!!
//Recurse a parte frontal das diferentes partes da última vez
if (pos1 && pos2) {
soma += php_similar_char(txt1, pos1, txt2, pos2);
}
//Recursa a última parte das diferentes partes
if ((pos1 + max <len1) && (pos2 + max <len2)) {
soma += php_similar_char(txt1 + pos1 + max, len1 - pos1 - max,
txt2 + pos2 + máx, len2 - pos2 - máx);
}
}
//Retorna o número de caracteres idênticos após esta comparação
soma de retorno;
}
//A própria função PHP, um monte de macros, faz algumas conversões de string e conversão de valor de retorno, e a função principal é feita pelas duas funções acima.
PHP_FUNCTION(texto_semelhante)
{
zval **t1, **t2, **porcentagem;
int ac = ZEND_NUM_ARGS();
intsim;
if (ac < 2 || ac > 3 || zend_get_parameters_ex(ac, &t1, &t2, &percent) == FALHA) {
WRONG_PARAM_COUNT;
}
convert_to_string_ex(t1);
convert_to_string_ex(t2);
se (ac > 2) {
convert_to_double_ex(porcentagem);
}
se (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2) == 0) {
se (ac > 2) {
Z_DVAL_PP(porcentagem) = 0;
}
RETURN_LONG(0);
}
(
t1), Z_STRVAL_PP(t2), Z_STRLEN_PP(t2));
Z_DVAL_PP(porcentagem) = sim * 200,0 / (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2));
}
RETURN_LONG(sim);
}
Pode-se observar que similar_text é comparado com base em ASCII e o problema da frase não é considerado.
Eu testei e os resultados são os seguintes:
int main(int argc, char *argv[])
{
char *str1="weican wuxin";
char *str2="wuxin weican";
int pos1,pos2,máx;
php_similar_str(str1,strlen(str1),str2,strlen(str2),&pos1,&pos2,&max);
printf("php_similar_str:%d,%d=%dn",pos1,pos2,max);
max=php_similar_char(str1,strlen(str1),str2,strlen(str2));
printf("php_similar_char:%dn",max);
sistema("PAUSA");
retornar 0;
}
php_similar_str:0,6=6
php_similar_char:6
char *str1="Princípio de funcionamento da comunicação do protocolo TCP a";
da
comunicação do protocolo TCPa";
php_similar_char:19