Am adăugat o funcționalitate care calculează și afișează o listă de nume și particule similare cu numele căutat.
Pentru o mulțime de căutări, utilizatorul folosește o formă ușor diferită de cea disponibilă în baza de date (fie numele are o formă ușor diferită în documentele istorice, fie utilizatorul face o greșeală de tastatură). Cel puțin acum există posibilitatea de a fi informat cu privire la chestiunea asta.
Cu siguranță se poate îmbunătăți dar în general cred că își face treaba.
Foarte bună funcționalitatea!
Cum funcționează? Este o listă statică, putem adăuga alte variații? E.g. Ghiță la Gheorghe?
Funcționează cu un dicționar și o combinație de funcții care determină similaritatea dintre cuvinte pe baza căutării cu trigrame și a algoritmului levenshtein.
Am să pun și o pagină separată privată cu cursoare pentru a jongla cu ponderile care intră în calculul scorului, să vedem care e cea mai bună variantă pentru limba română.
Dar indiferent, Ghiță e destul de greu să intre pentru Gheorghe. Distanța levenshtein e 6 și scorul de similaritate bazat pe trigrame e mic. Numai dacă lucrăm și cu un dicționar static, populat manual.