Forum genealogica.ro

General => Proiectul Genealogica.ro => Subiect creat de: andreicucuruz din Noi 14, 2024, 01:03 PM

Titlu: Nume și particule similare
Scris de: andreicucuruz din Noi 14, 2024, 01:03 PM
Am adăugat o funcționalitate care calculează și afișează o listă de nume și particule similare cu numele căutat.

Pentru o mulțime de căutări, utilizatorul folosește o formă ușor diferită de cea disponibilă în baza de date (fie numele are o formă ușor diferită în documentele istorice, fie utilizatorul face o greșeală de tastatură). Cel puțin acum există posibilitatea de a fi informat cu privire la chestiunea asta.

Cu siguranță se poate îmbunătăți dar în general cred că își face treaba.
Titlu: Re: Nume și particule similare
Scris de: Andrei Jipa din Noi 15, 2024, 01:04 AM
Foarte bună funcționalitatea!

Cum funcționează? Este o listă statică, putem adăuga alte variații? E.g. Ghiță la Gheorghe?
Titlu: Re: Nume și particule similare
Scris de: andreicucuruz din Noi 15, 2024, 08:04 AM
Funcționează cu un dicționar și o combinație de funcții care determină similaritatea dintre cuvinte pe baza căutării cu trigrame și a algoritmului levenshtein.

Am să pun și o pagină separată privată cu cursoare pentru a jongla cu ponderile care intră în calculul scorului, să vedem care e cea mai bună variantă pentru limba română.

Dar indiferent, Ghiță e destul de greu să intre pentru Gheorghe. Distanța levenshtein e 6 și scorul de similaritate bazat pe trigrame e mic. Numai dacă lucrăm și cu un dicționar static, populat manual.