Vorbeam cu
@stratocaster despre demararea procesului de separare a particulelor din câmpul principal
nume în câmpuri distincte (e.g. nume de botez, nume de familie sau supranume, apelativ, etc.) .
Chestiunea asta ar facilita căutările prin posibilitatea de a crea dicționare de similiaritate precise pentru fiecare câmp în parte. Și, mai important, ar fi primul pas pentru crearea catalogului onomastic.
Am avea un proces automat care face o separare inițială urmând o fază de verificare manuală cu un formular de editare în serie.
Mă gândeam să nu avem mai mult de 3 câmpuri în primă fază, de pildă:
nume de botez,
supranume și eventual
nume rudă.
Iar apelativele (e.g. popa, dascălu, logofătu, etc.), particule diverse (e.g. ot Dumbrăveni, văduv, etc.) să le avem separate prin spațiu în câmpul supranume, pe considerentul că de fapt toate acestea au reprezentat "bazinul onomastic" din care au luat naștere numele de familie și că ele trebuie considerate la căutarea în baza de date pentru câmpul nume de familie.
Sau credeți că dacă tot începem acest proces, merită să încercăm o separare strictă, exhaustivă în multiple câmpuri distincte (e.g. apelativ, nume de botez, nume de familie, poreclă, domiciliu, stare civilă, etc.)?