Vocabularul sau lexicul unei limbi înseamnă totalitatea unităților lexicale, numite în mod obișnuit cuvinte, care există la un moment sau care au existat, vreodată, în limba respectivă.

Atunci când vorbim de lexic vorbim de fapt de straturi lexicale suprapuse, rezultate din interacțiunea noastră cu alte popoare și cu limbile vorbite de ele. Din acest motiv putem considera cuvintele limbii române un tezaur lexical în care este înscrisă istoria societății noastre. După cum vom vedea din structura vocabularului, din lexicul limbii române pot fi recunoscute etapele evoluției noastre istorice, contactele noastre ca popor și influențele altor civilizații suprapuse peste fondul originar (geto-dac și latin).

Vocabularul limbii române este înregistrat de dicționare în diverse moduri, conform unor criterii diferite.

Pentru mai multe detalii despre dicționare, vezi Dicționare ale limbii române.

Atunci când vorbim de vocabularul actual al limbii române (sau vocabularul limbii române contemporane) avem în vedere totalitate cuvintelor aflate în uz începând cu mijlocul secolului al XIX-lea. De la această dată a început procesul de modernizarea lexicului limbii române.

Lexic sau vocabular?

Se observă chiar din definiția de mai sus că pentru a desemna ansamblul cuvintelor unei limbi se pot folosi doi termeni: lexic și vocabular. De regulă, în manualele școlare, termenul preferat este cel de vocabular. Pentru unii cercetători cei doi termeni sunt sinonimi, deci, conform acestor opinii oricare din cei doi termeni ar putea fi folosiți. Pe de altă parte, alți lingviști consideră că între cei doi termeni există o relație de subordonare, în sensul ca lexicul este format dintr-o serie de vocabulare. În plus, spun aceștia, numele disciplinei, lexicologie, se află în relație cu lexemul (cuvânt privit semantic), lexicografie, lexicon (dicționar). Astfel, pentru aceștia din urmă, termenul lexic este preferabil. Cu toate acestea, în majoritatea lucrărilor școlare se folosește termenul de vocabular pentru a numi totalitatea cuvintelor unei limbi.

Vocabular vs. limbă

Vocabularul și limba nu trebuie confundate, ele nefiind noțiuni sinonime. Între cele două noțiuni distincte există mai degrabă o relație de incluziune, în sensul că vocabularul face parte din limbă. Pentru a fi mai preciși, putem spune că o limbă are nevoie de un vocabular, adică o sumă de cuvinte mono și polisemantice, cu care să opereze. Dar pentru ca aceste cuvinte să fie pe deplin utile pentru limbă între ele trebuie să se stabilească anumite relații, precum cele de schimbare a flexiunii sau sintactice. Prin urmare, limba este formată dintr-un vocabular și din relațiile gramaticale care se stabilesc între elementele acestuia, toate acestea având la bază nivelul fonologic, nivelul la care se realizează învelișul sonor al cuvintelor.

Organizarea vocabularului

Cu toate că este partea cea mai dinamică dintre toate domeniile limbii și mai puțin stabil, fiind format din cele mai numeroase unități constitutive, vocabularul poate fi organizate în submulțimi unitare.

Există mai multe criterii după care cuvintele vocabularului pot fi împărțit. Pentru mai multe detalii, vezi Organizarea vocabularului.

Compoziția etimologică a lexicului românesc

Din analizarea celor aproximativ 1500 de cuvinte din fondului principal lexical a reieșit că în jur de 60-66% au origine latină.

Un număr mai mare de cuvinte a analizat D. Macrea, studiind Dicționarul limbii române moderne (DLRM). Din statistica efectuată de acesta pe cele 49.642 de cuvinte a reieșit că elementele latine moștenite, împreună cu elementele împrumutate de origine romanică (din franceză și italiană) se păstrează în aceeași marjă ca în cazul fondului principal lexical, mai exact 62,55%.

Statistică D. Macrea, pe baza DLRM

Cel 49.642 de cuvinte cuprinse în DLRM au fost împărțit după origine de D. Macrea în 76 de grupe. Dintre acestea, următoarele 14 grupe depășesc 1%:
elemente latine moștenite 20,02%
elemente latine literare 2,39%
elemente franceze 38,42%
elemente italiene 1,72%
elemente vechi slave 7,98%
elemente bulgărești 1,78%
elemente bulgaro-sârbești 1,51%
elemente turcești 3,62%
elemente maghiare 2,17%
elemente neogrecești 2,37%
elemente germane 1,77%
elemente onomatopeice 2,24%
elemente origine nesigură 2,73%
elemente origine necunoscută 5,58%

Caracterul latin al vocabularului românesc

Din punct de vedere etimologic, caracterul latin al vocabularului românesc s-a dezvoltat de-a lungul secolelor prin împrumuturi din limbile romanice europene. În limba română contemporană predomină cuvintele moștenite din latină și neologismele moștenite în special din franceză, astfel încât putem spune că limba română este în fapt o limbă latină. O definiție în acest sens a formulat reputatul lingvist român, Al. Rosetti:

Limba română este limba latină vorbită în mod neîntrerupt în partea orientală a Imperiului Roman, cuprinzând provinciile dunărene romanizate (Dacia, Pannonia de Sud, Dardania, Moesia superioară și inferioară), din momentul pătrunderii limbii latine în aceste provincii și până în zilele noastre.Al. Rosetti în Istoria limbii române

Vocabularul în cifre

Teoretic, vocabularul este format dintr-o infinitate de cuvinte, numărul acestora fiind proporțional cu aspectele din realitate care trebuie desemnate. Practic însă, vocabularul nu este infinit, dar este foarte greu de stabilit cu exactitate câte cuvinte există într-o anumită limbă. Principalul motiv pentru incapacitatea de a ști câte unități există în vocabular este caracteristica acestuia de a fi un sistem deschis, adică permite adăugarea permanentă de unități noi. Prin vocabular, lexicologia se deosebește de fonetică și de gramatică, acestea din urmă fiind compartimentele limbii care lucrează cu sisteme închise.

Numărul cuvintelor comune care aparțin lexicului general a fost aproximat la 140.000. Micul dicționar academic (MDA) inventariază 175.000 de cuvinte, din care 125.000 cuvinte propriu-zise, iar 50.000 reprezintă variante lexicale. Spre comparare, Dicționarul explicativ al limbii române (DEX) înregistrează aproximativ de 60.000 de cuvinte și variante.

Dacă adăugăm și numărul neologismelor introduse după anii ’90, precum și pe cei științifici și tehnici, lexicul general românesc se apropie de 180.000 de cuvinte.

Dacă am socoti absolut toate cuvintele folosite în limba română, aici incluzând numele proprii (spre exemplu toponime, antroponime etc.), toți termenii tehnici și științifici, denumiri de specii și animale (fără cele savante), nume de personaje, autori, afixe, precum și împrumuturile neadaptate încă la limba română, numărul total de unități lexicale s-ar apropia de 1.000.000.

Indiferent de numărul exact al cuvintelor vocabularului în ansamblul său, lingviștii au estimat că un vorbitor cult al limbii române folosește în jur de 30.000 de cuvinte.

Închide meniul