Model transcriere (feedback)

Creat de andreicucuruz, Aug 18, 2024, 04:28 PM

« precedentul - următorul »

andreicucuruz

Citat din: andreicucuruz din Sep 05, 2024, 01:04 PMAm pus deocamdată "Unit. Adm. I" și "Unit. Adm. II". Cred că e de ajuns pentru o identificare a localității istorice.

Aa, și comuna se poate înregistra (mai ales pentru Principatele de după 1865) separat față de cele de mai sus.

Petrus

Aș avea un comentariu legat de terminologie, respectiv "transcriere". Ghidul de pe wiki e foarte util pentru a colecta datele într-un model uniform pretabil unei baze de date, dar mi se pare că deviază destul de la o operație de simplă transcriere. Transcrierea ar trebui să fie fidelă originalului, cu limba, cu ortografia, cel mult cu marcări ale contracțiilor sau greșelilor. Ce propune ghidul aduce o anume doză de subiectivism și interpretare a textului, legat de nume de localități, ortografia numelor persoanelor etc. Ceea ce considerăm acum standard în ceea ce privește numele și întinderea așezărilor, ortografierea limbii și a numelor, stabilitatea numelor persoanelor, chiar și datele calendaristice, nu au fost mereu așa, iar maparea de la una la alta nu e mereu evidentă sau fără echivoc.
Până la urmă, care este obiectivul culegerii de date? Să reflecte fidel originalul, sau să uniformizeze datele astfel încât să fie ușor de regăsit raportat la repere contemporane? Oricum am face, nu le putem obține pe ambele, așa că e util să explicităm ce anume vrem să producem.
Eu vorbesc mai mult din experiența din Transilvania, unde există o variație imensă între surse și nu se aplică mereu același șablon. Plus că "adevărul obiectiv" câteodată nu poate fi stabilit.

andreicucuruz

#47
Sunt de acord cu mențiunile expuse.

Scopul ar fi uniformizarea procesului de culegere a datelor și nu uniformizarea datelor. Eu zic că vrem să culegem cât mai fidel cu originalul, pe cât posibil. În plus, să facilităm și introducerea efectivă a datelor în baza de date cu acest format.

In îndrumător se prezintă diferite exemple și instanțe care pot apărea la transcriere, ideea e ca editorii, atunci când întâlnesc o situație, să procedeze unitar. Limba si ortografia, firește, vrem să fie păstrate pe cât posibil. Dar, conștienți fiind de faptul că o normalizare este posibil să apară oricum în transcrierile primite, am zis să anticipăm asta cu câteva norme unitare in sensul ăsta (cred că mențiunile se leagă de partea asta).

De pildă, avem exemplul Breaza. În sursă apare Bréd̦a.

Ideal ar fi să-l înregistrăm așa cum apare, cu caracterele precise. Însă în cele mai multe instanțe editorul nu stă să caute caracterele si operează o normalizare. Unii normalizează caracterele mai dificil de redat (Breda) sau normalizează la forma actuală (Breaza). Eu prefer varianta 2.

Nu știu dacă din îndrumător reiese un standard pentru transcrierea numelor de persoane/localități. Nu ar trebui.

Raportarea la reperele contemporane (aici mă refer la locațiile actuale) se face manual, doar dacă corespondența dintre localitatea istorică și cea actuală este evidentă.

Cel mai bine ar fi dacă am putea discuta direct pe exemplele cu probleme. Să vedem unde sunt necesare modificări. Ăsta cred că e scopul discuțiilor de aici, să găsim împreună cea mai buna formă.

stratocaster

#48
Citat din: Petrus din Sep 05, 2024, 04:46 PMPână la urmă, care este obiectivul culegerii de date? Să reflecte fidel originalul, sau să uniformizeze datele astfel încât să fie ușor de regăsit raportat la repere contemporane?

Într-adevăr, sunt de acord că trebuie stabilit acest scop.

Eu aș fi în favoarea unei transcrieri cât mai fidele, cu editări minime, numai acolo unde nu este loc de ambiguități.

Cred că o transcriere 100% fidelă originalului nu este ideală. Un exemplu este o căsuță în care scrie "idem". Aici cred că este nevoie de intervenția editorului și transcrierea explicită a lucrului la care se referă acel "idem". De asemenea, folosirea altor alfabete (chirilic, ebraic) cred că ar face transcrierea foarte dificilă pe de o parte și pe de altă parte ar fi greu de deslușit pentru utilizatori. De asemenea, substantivele care apar în cazul dativ sau genitiv cred că ar trebui trecute la nominativ (Mariei → Maria). Referitor la caracterele ieșite din uz, nu am o preferință. Aș opta pentru transcrierea ca atare, dar sunt conștient de faptul că asta ar îngreuna transcrierea.

O altă situație în care sunt în favoarea editărilor sunt variațiile de scriere ale unui cuvânt sau loc, care nu implică nicio diferență semantică. De exemplu, sunt registre în care apar multe variante ale aceluiași cuvânt: "agricol", "agricolu", "agricolǔ", "agricollu", "agricollǔ", adesea și cu diverse abrevieri. Personal, nu văd utilitatea cunoașterii exacte a grafiei. Nu cred că putem vorbi neapărat de o ortografie, având în vedere că sunt scrise diferit în același registru. Cred că scrierea contemporană a cuvântului "agricol" este suficientă ca să redea conținutul semantic. Asta nu exclude faptul că un cuvânt poate avea alt sens, sau un loc se referea la altă arie la data întocmirii actului.

De luat în seamă este și faptul că transcrierea 100% ca în act îngreunează transcrierea dacă trebuie ajustată grafia cuvintelor care se repetă de multe ori ("muncitor", "plugar", etc.) pentru fiecare rând.

Referitor la limbă, cred că este o idee bună să păstrăm și originalul, cel puțin dacă este scris cu alfabet latin, dar cred că atunci ar trebui o traducere în limba română între paranteze.

Petrus

Se pare că există un consens în ideea că se dorește o extragere și interpretare (cât mai completă) a informațiilor, și nu neapărat transcrierea verbatim a sursei. În general interpretările vor fi precise, mai ales unde există uniformitate etnică și confesională, dar e bine să rămânem conștienți că acest "bias" există și poate duce la neconcordanțe.
Exemplu ipotetic, avem o căsătorie civilă în maghiară, între Kovács György și Árgyélán Mária, de religie greco catolică. Se înregistrează ca atare sau se interpretează ca Gheorghe Covaci și Maria Ardelean? Dar dacă e familie mixtă? Mai devreme sau mai târziu vor trebui luate decizii bazate mai mult sau mai puțin pe presupuneri.

stratocaster

Eu aș zice că numele se transcriu în limba în care apar, fără traduceri.
Sunt niște exemple la secțiunea "Limba":

https://wiki.genealogica.ro/index.php/%C3%8Endrumar_pentru_transcrieri#Generalit%C4%83%C8%9Bi

Deci în exemplul dat: Kovács György și Árgyélán Mária, dacă așa apar în sursă, indiferent de etnie.

stratocaster

Aș completa că ce am propus este valabil numai pentru numele de persoane (care nu se traduc). Celelalte informații: locuri, ocupații, starea civilă, cauza decesului, religia etc., cred că trebuie să fie în limba română, cel puțin pentru experiența utilizatorului.

Credeți că e necesară și transcrierea originalului?
de exemplu: Gyulafehérvár (Alba Iulia), Szatmár vármegye (Comitatul Sătmar); napszámos (muncitor), görög keleti (greacă orientală), veleszületett gyengeség (slăbiciune congenitală)

andreicucuruz

#52
Citat din: stratocaster din Sep 05, 2024, 09:38 PMDeci în exemplul dat: Kovács György și Árgyélán Mária, dacă așa apar în sursă, indiferent de etnie.

Părerea mea e că în nici un caz nu trebuie să operăm normalizări pe nume (mai ales cum e cazul aici, să trecem în corespondentul românesc) ci transcris fix cum apare. Bineînțeles, cine transcrie înregistrări din zone fără uniformitate etnică și confesională (cum e Transilvania) trebuie să fie familiarizat și capabil, sau măcar dispus să caute și să înregistreze literele corespunzătoare.   

Și eu zic că ghidul nu îndrumă spre o astfel de abordare, adică a normalizării în românește.

În schimb, da, indică o normalizare a celorlanți termeni care pot apărea, de pildă, în maghiară (localitate, profesie, cauza morții, etc.). Aici putem să luăm în considerare să nu normalizăm deloc ci să procedăm la fel ca în cazul numelor. Și într-un proces ulterior, pentru interfață unitară și posibilitatea filtrărilor după aceste câmpuri, să facem o normalizare în bloc, poate în românește/maghiară, urmând niște reguli clare.

 

Lutic

Cred că la localități trebuie transcrisă și versiunea originală, în paranteză sau pe o coloană separată. Dacă urmașul cuiva emigrat din Gyulafehérvár (Alba Iulia, că tot a fost dat exemplul mai sus) își caută strămoșii, în eventualele acte el are denumirea maghiară și asta o să caute. Altfel, trebuie să existe o comandă în spate care la o căutare după denumirile în maghiară sau germană să returneze localitățile după denumirea în română.
Într-o societate care încearcă să ne alinieze pe toți la standard, să ne ,,normalizeze", încep să apreciez din ce în ce mai mult arhaismele și regionalismele. Totuși, dacă formule ca ,,muncitore" sau ,,agricoltu" sunt ușor de intuit, când dai prima oară de cuvinte sau expresii precum ,,surpat", ,,de oftică", ,,de siopîrlaiția", sau ,,de fras" te uiți cruciș.  Astfel de termeni ar trebui explicați la ,,Observații de editare".

Și o întrebare: în unele acte de naștere la numele mamei e trecut doar prenumele (ex. ,, și allu Dei Maria, de ani trei zeci"). E ok dacă la transcriere trec numele soțului în paranteze de ex. Maria (Popescu) sau scriu doar Maria?
În căutarea familiei pierdute: eMAG și Google Play.

stratocaster

Citat din: Lutic din Sep 06, 2024, 09:13 AMCred că la localități trebuie transcrisă și versiunea originală, în paranteză sau pe o coloană separată. Dacă urmașul cuiva emigrat din Gyulafehérvár (Alba Iulia, că tot a fost dat exemplul mai sus) își caută strămoșii, în eventualele acte el are denumirea maghiară și asta o să caute. Altfel, trebuie să existe o comandă în spate care la o căutare după denumirile în maghiară sau germană să returneze localitățile după denumirea în română.
Din câte știu există în baza de date înregistrate variațiile numelor de localități. Cred că e o idee bună să fie folosite ca sinonime pentru căutări.
Cum să transcriem atunci? doar numele în limba originală? sau cu traducerea între paranteze? Coloane suplimentare ar trebui mai multe, nu știu dacă e neapărat justificat (pentru locul nașterii, locul decesului, domiciliu)

Citat din: Lutic din Sep 06, 2024, 09:13 AMTotuși, dacă formule ca ,,muncitore" sau ,,agricoltu" sunt ușor de intuit, când dai prima oară de cuvinte sau expresii precum ,,surpat", ,,de oftică", ,,de siopîrlaiția", sau ,,de fras" te uiți cruciș.  Astfel de termeni ar trebui explicați la ,,Observații de editare".
Îndrumarul nu sugerează înlocuirea "de oftică" cu "de tuberculoză". Ci doar ajustarea la ortografia actuală. Deci "de șopârlaiță" în loc de "de siopîrlaiția", și nu înlocuirea cu "anghină difterică". Cred că explicații ar putea fi adăugate în glosar:
https://wiki.genealogica.ro/index.php/Glosar

Citat din: Lutic din Sep 06, 2024, 09:13 AMȘi o întrebare: în unele acte de naștere la numele mamei e trecut doar prenumele (ex. ,, și allu Dei Maria, de ani trei zeci"). E ok dacă la transcriere trec numele soțului în paranteze de ex. Maria (Popescu) sau scriu doar Maria?
În îndrumar acum apare că "Maria soția sa" să se transcrie explicit "Maria soția lui Ion Popescu". Poate sunt însă sugestii mai bune.

andreicucuruz

#55
Citat din: stratocaster din Sep 06, 2024, 09:43 AMDin câte știu există în baza de date înregistrate variațiile numelor de localități. Cred că e o idee bună să fie folosite ca sinonime pentru căutări.
Cum să transcriem atunci? doar numele în limba originală? sau cu traducerea între paranteze? Coloane suplimentare ar trebui mai multe, nu știu dacă e neapărat justificat (pentru locul nașterii, locul decesului, domiciliu)

Eu zic să înregistrăm precis cum apare în original (limbă, scriere, etc.) și detaliile cu privire la locație. Oricum în interfață apare și localitatea corespondentă curentă (în românește).

Citat din: stratocaster din Sep 06, 2024, 09:43 AMÎndrumarul nu sugerează înlocuirea "de oftică" cu "de tuberculoză". Ci doar ajustarea la ortografia actuală. Deci "de șopârlaiță" în loc de "de siopîrlaiția", și nu înlocuirea cu "anghină difterică". Cred că explicații ar putea fi adăugate în glosar:
https://wiki.genealogica.ro/index.php/Glosar

Aici mă gândeam ca în pagina afișării înregistrării, în câmpurile unde de obicei apar termeni arhaici (e.g. status, ocupație, cauză a decesului, etc.) să punem un link pe denumire care trimite la dexonline sau să ne conectăm la api-ul lor și să afișăm direct o definiție, dacă variația de scriere este recunoscută (e.g. eventual o definiție din dicționarele Șăineanu (1929)/Scriban(1939)).

https://dexonline.ro/definitie/birnic/definitii/json

bendorna

Citat din: andreicucuruz din Sep 06, 2024, 10:20 AMAici mă gândeam ca în pagina afișării înregistrării, în câmpurile unde de obicei apar termeni arhaici (e.g. status, ocupație, cauză a decesului, etc.) să punem un link pe denumire care trimite la dexonline sau să ne conectăm la api-ul lor și să afișăm direct o definiție, dacă variația de scriere este recunoscută (e.g. eventual o definiție din dicționarele Șăineanu (1929)/Scriban(1939)).

E super funcționalitatea, dar ce-i mai rămâne genealogistului dacă totul este mestecat?

Lutic

Citat din: stratocaster din Sep 06, 2024, 09:43 AMÎn îndrumar acum apare că "Maria soția sa" să se transcrie explicit "Maria soția lui Ion Popescu".
Asta am înțeles, dar am situații (destul de multe) în care nu se precizează că e ,,soția sa", cum am arătat mai sus. 
În căutarea familiei pierdute: eMAG și Google Play.

andreicucuruz

Citat din: Lutic din Sep 06, 2024, 12:46 PM
Citat din: stratocaster din Sep 06, 2024, 09:43 AMÎn îndrumar acum apare că "Maria soția sa" să se transcrie explicit "Maria soția lui Ion Popescu".
Asta am înțeles, dar am situații (destul de multe) în care nu se precizează că e ,,soția sa", cum am arătat mai sus. 

În acest caz, eu aș spune să nu mergem mai departe, chiar dacă contextul ne spune că era vorba de soția lui cutare, să lăsăm "Maria".

În schimb, unde avem "Maria, soția lui", aici vorbim despre o referință în text, pronumele "lui" indică clar persoana soțului, tatălui copilului șamd. La fel cu ditto , idem , tij și altele - însă din motive ce țin în mare parte de chibzuință în folosirea spațiului, cernelii, etc., scriitorul nu completează întotdeauna numele. Aici cred că se poate interveni.

De pildă, făcând transcrierea recensământului de la 1774 în foarte multe instanțe avem următorul tip de înregistrare :

1. Ștefan Bâtlan
2. Ion sin / brat / zet / ginere lui

Referirea la persoana recenzată deasupra este clară. În cazurile astea eu am ales să copiez numele de deasupra și să înregistrez:

2. Ion sin / brat / zet / ginere lui Ștefan Bâtlan

Sigur, asta înseamnă că nu am transcris efectiv după textul sursă ci am făcut o interpretare (interpretare fără de care, părerea mea, informația "Ion sin lui" era goală în afara contextului (contextul, totuși, există, căci utilizatorul poate vizualiza și listele integral, cu ordinea din sursă păstrată). Despre asta cred că e vorba aici, dacă facem această interpretare sau nu.

stratocaster

În regulă, am adăugat ceea ce s-a discutat aici (folosirea limbii originale și pentru numele de locuri, clarificări în legătură cu "soția sa").

În plus, am reorganizat articolul astfel încât să evităm repețiția instrucțiunlor. De exemplu, instrucțiunile pentru nume sunt necesare pentru coloanele "nume", "părinți", și la "observații". Locurile acoperă coloanele pentru domiciliu, locul nașterii, decesului și observații. Ca să nu repetăm de fiecare dată regulile, m-am gândit că este mai bine să le grupăm la începutul articolului și apoi să facem referire la ele când explicăm funcționalitatea tabelului dedesubt.

Formatul pe care l-am propus are acum are trei părți:

A: introducerea cu scopul paginii și recomandările de abordare a transcrierilor

B: reguli de transcriere (forma: limbă, ortografie, abrevieri) separate in patru parti: 1-generalitati, 2-persoane, 3-locuri și 4-altele

C: folosirea tabelului cu îndrumări pentru conținutul fiecărei căsuțe.

Ce părere aveți?