Rječnik i korpus

Od kunilingvistike do pravopižđenja
ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Rječnik i korpus

Post by ostruznicagornja » 16 Jun 2016, 16:27

Valjda je ovaj Glosbe rječnik jedini koliko toliko pristojan rječnik srpskog ili hrvatskog na engleski i obrnuto. Sasvim solidan nema šta. https://glosbe.com/en/hr/precarious

Nevjerovatno mi je i to sam i prije rekao, da srpski jezik nema onlajn korpus jezika, bar ja ne znam da ima. Imaju gomile sajtova sa nekim osamnaestim bajanjima o jeziku, ali korpusa nema.

Ovaj korpus hrvatskog jezika http://riznica.ihjj.hr/philocgi-bin/sho ... 9.Cijelihr izgleda odlično nema šta, i vele da "Trenutačno HNK v3.0 obasiže 216,8 milijuna pojavnica." Jebote koji jezik ovo obasiže i pojavnice :) Ali dobar je nema veze što obasiže i riječi koje ja nisam imao priliku da vidim obasegnute do sad. I vidio sam da ima 7560 rezultata za obje i samo 19 za obije u korpusu. I sad ne znam koliko je od ovih 7560 rezultata proizvod revnosne hiperkorekcije revnosnih pravopisnih službenika, ali moja pretpostavka je da mora biti da se dosta od toga prepravljalo, jer odnos ove dvije upotrebe na Guglu nije tako drastičan.



User avatar
MmeTipfeler
Katica za sve
Posts: 7602
Joined: 24 Mar 2012, 20:31

Post by MmeTipfeler » 16 Jun 2016, 16:55

Kontekst, kolega, kontekst. Propustio si činjenicu da se oblik obije u dvije trećine navedenih primjera pojavljuje kao 3. l. sg. prezenta glagola obiti. Ostalo su tekstovi s interneta gdje su pogreške češće nego u tiskanim izdanjima. Bez obzira na sve, standardni je oblik obje.


Kad piješ, ne piši po forumu; kad pišeš po forumu, ne pij!

ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 16 Jun 2016, 17:36

Pa nije bitno od samo 19 rezultata je li ima neki koji je oblik glagola "obiti" kad je samo 19. Gugl sam prije pretraživao za "obije su" upravo zato da bih izbjegao taj oblik. U našoj varijanti ijekavice odje, "obije" je standardnija varijanta, sad nisam siguran regionalne varijacije, sigurno da bi se tu mogle izvući razlike.
Pretraga za "obije su" za hrvatski domen je izbacila 97 rezultata, a pretraga "obje su" je izbacila 130 rezultata.
Na bosanskom i crnogorskom domenu je bilo oko devedeset rezultata i za jednu i za drugu pretragu.

To zašto ima ovo "obije" na Guglu, i u svim mogućim kontekstima zaista, i registrima, a nema u korpusu, na to pitanje ne mogu sa sigurnošću da odgovorim, jer nemam takav kontakt sa hrvatskim jezikom da bih znao. Ali zato mogu da nagadjam, i moja pretpostavka je da je dobar broj rezultata za "obje" ili hiperkorekcija ljudi koji su to pisali, ili je rezultat stvarne korekcije lektora pa profesionalnih ili amaterskih, na osnovu instrukcija iz pravopisa.
S obzirom da ni Gugl pretraga nije sasvim pouzdan pokazatelj stvarnog stanja, ne isključujem mogućnost naravno da je "obje" upotrebljavanija varijanta od "obije" u govoru u hrvatskom jeziku. Ipak velim da nisam sklon da takav odnos rezultata gledam kao na grešku u pisanju, mislim da će prije biti da je "obije" sasvim uobičajena varijanta u jeziku.



ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 16 Jun 2016, 18:29

Jedan primjer dje brojanje izgleda da ide protiv moje intuicije je padež sa imenicama "pridržavanje" odnosno "nepridržavanje", to sam skoro uočio da ponekad koristim dativ/instrumental umjesto češćeg genitiva, na primjer, nepridržavanje načelima umjesto nepridržavanje načela. Nije da sam i u jednom trenutku pomislio da je to moja izmišljotina, ali jeste da mi je sa više razmišljanja genitiv postajao sve neizbježniji sa većinom imenica. A otkud mi ovo "načelima", na to pitanje naravno mogu odmah da odgovorim, ne znam odakle mi to. Ali sam vidio da nisam jedini naravno, i našao sam u zakonima, zvaničnim dokumentima na svim domenima, i u raznim registrima. U Dačićevom govoru kao predsjedavajućeg OEBSA:
Kao predsedavajući, imam obavezu prema Organizaciji i svim njenim državama učesnicama da se pobrinem za poštovanje osnovnih vrednosti OEBS-a i pridržavanje ovim načelima.
u ovim hrvatskim propisima o pomorskom agentu http://asbac.hr/wp-content/uploads/2016/01/5.pdf
Državne vlasti/strukovne udruge (prema okolnostima) osigurati će pridržavanje ovim pravilima.
U svakom slučaju, to su imenice koje su izvedene iz odgovarajućih glagola, i sa glagolima ta dilema naravno ne postoji, "pridržavamo se nečega", znači genitiv. I da kažem da su imenice odje, pa ne zvuče nešto ni sa genitivom ni sa dativom, nekako kvrgavo to ispadne. Bolje preformulisati pa glagol izabrati za to značenje ako je moguće.



ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 18 Jun 2016, 08:53

Rekao bih da ovo što su jezički izvori na internetu bogatiji u hrvatskoj varijanti nego u srpskoj govori o tome da se tamo ozbiljnije radi na jeziku nego na ovoj mojoj strani. Korpus je odličan nema šta, a na ovom Glosbe sajtu za dvojezične rječnike sam vidio da su profesionalci iz Hrvatske uključeni u projekat, i dobar je englesko hrvatski/srpski rječnik nema šta. Format modernog rječnika, uglavnom prilično obuhvatan pregled mogućih prevoda riječi, mada fale malo moguće kolokacije riječi, što je posebno važno sa glagolima ali okej. To je nadoknađeno kroz ogroman broj odrednica koje sadrže veliki broj fraza, i što je najbolje naravno je ovaj pregled prevoda koji se daje u segmentiranoj formi kao u prevodilačkim programima. To je odlično, i nema veze što nije svaki prevod pouzdan, i nisu svi jednako dobri, ali u principu se dobije dobra slika o upotrebi riječi i fraza u kontekstu i u veoma preglednom formatu, a i zgodno je što je osjenčena pretraga tako da to sve u svemu to izgleda zaista dobro.



ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 19 Jun 2016, 13:20

I napokon sam našao korpus srpskog jezika, nevjerovatno ali istinito. I pogledao sam ono besprizoran http://nl.ijs.si/noske/all.cgi/first?iq ... name=srwac što vele u priručniku da je besmisleno kad znači nečuven, bezobrazan ili tako, a smisleno je kad znači napušten i bez nadzora. http://www.academia.edu/4426749/Ivan_Kl ... _nedoumica i našao sam i odje, značenje srpskih riječi, isto to vele http://staznaci.com/besprizoran Samo što u ovom korpusu nisam uočio nijedan rezultat sa tim značenjem ove riječi, a ima 256 za ono besmisleno značenje.

Ima i korpus hrvatskog naravno, i šta sam prvo potražio u korpusu, pa naravno da sam prvo pogledao ono "obije" i "obje", još to nisam raščistio sa drugaricom Tipfeler. I šta veli korpus, veli evo ovo
http://nl.ijs.si/noske/all.cgi/first?iq ... name=hrwac

57 rezultata za "obije su" , forumi uglavnom.

A onda rezultati za "obje su " http://nl.ijs.si/noske/all.cgi/first?iq ... name=hrwac
i odje je već drugačije i šarenije, tjednik ovaj onaj, večernji list itd.



User avatar
haram
persona non grata
Posts: 3719
Joined: 24 Jul 2015, 04:13
Location: scorched earth

Post by haram » 19 Jun 2016, 14:27

Po meni je "besprizoran" zapravo potpuno slavenska inačica latinizma "opskuran". A značenje riječi "opskuran" je prilično jasno (pomalo paradokaslno, zar ne?).

Za "obije" bih rekao da više spada u neki "korienski", arhaični rječnik, iako principijelno korektan (iliti dosljedno ispravan ;D).

Ali ja sam laik :D.


what we've got here is failure to communicate

ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 19 Jun 2016, 16:19

Nije bitno porijeklo riječi haram, mogla je riječ značiti prije nešto drugo, i u ruskom da znači nešto drugo, ali ovo je srpski ili hrvatski ili je srpsko-hrvatski ili hrvatsko-srpski kako god nazovemo ovaj jezik. Radi mene može kako god, i crnogorski i bosanski, sve dok znam o čemu pričamo. O ovome sam pričao dosta i onda da ne dužim, svako može za sebe da procijeni koliko mu to ima smisla ili ne. Samo bih ponovio što sam rekao prije više puta, da za mene ne postoji pravilan i nepravilan jezik, samo standardni jezik u upotrebi i nestandardni jezik u upotrebi. To je osnovni okvir posle koga bi to moglo analizirati beskonačno, samo je to dobar okvir. I standardni jezik na određenom prostoru, pa hrvatskom ili srpskom ili kojem je najbolje shvatiti kao svaku upotrebu jezika za koju ne možemo ničim da pokažemo da je nestandardna. Pa šta će ko o tome da misli, i je li mu problem ili treba li mu uopšte da zna koliko je jezik koji proizvodi mejnstrim u okvirima toga što sam krsti kao svoj maternji jezik, to je njegova stvar da to ocijeni. U formalnim prilikama obično nije njegova stvar jezik koji proizvodi nego je očekivano da to prevede u očekivani jezik za tu priliku i to je i stvar manira, i razumijevanja i komunikacije uopšte.

Znači, je li možemo da kažemo za ovu riječ "besprizoran" da je regionalno to značenje za koje vele da je besmisleno, i je li zbog toga besmisleno? Je li to omladina na čatovima, fudbalski ovi orjunaši ili možda samo babe i đedovi od sto godina to tako vele, je li to možeš da kažeš da je to karakteristično za neobrazovanu populaciju? Ima li nešto na osnovu čega možemo da tvrdimo da će to značenje nekome iz bilo kojeg razloga da struže po ušima? Ako nema, šta sad da radimo što je u ruskom drugo značenje, kod nas se to izvrnulo nekako u to značenje, i sad kad se rodilo valja ga i ljuljati. To ima smisla, a nema smisla da na osnovu svojih dubioznih estetskih shvatanja, pljuc olovku u ruke i sad ću ja pravopis da napišem, da pokažem ja marvi nepismenoj kako treba. To je siledžijski pristup jeziku.
Ili da uzmem primjer ovaj, nasmijala me riječ, ima neki prizvuk ovo "korpus obasiže toliko i toliko pojavnica", i pojavnica mi nije nešto ali "obasiže" je, ne zvuči nikako. Ali ono, to je sa stanovišta čovjeka koji nije upoznat sa modernim hrvatskim jezikom, trendovima u normiranju i to, pa onda okej. Ali interesantno je, to nije standardna riječ, nije mi bezveze zaparala uši, to je riječ, pa valjda jedna od bog te pita koliko ovih koje normiraju kao ispravne i onda guraju to, a što guraju, to opet bog te pita. Pretpostavljam da je tome nekome ko to gura to pravi, neiskvareni hrvatski jezik, ni nalik nedajbože pljuc pljuc srpskom ili nekom drugom, nego svoj, i vazda je bio svoj nikad nije bio moj. I onda nije "obuhvata" za koju ovaj hrvatski korpus izbacuje 3122 rezultata, mnogi sigurno u potpuno istom kontekstu, i sa kojom nema nikakav problem, neutralna riječ, potpuno odgovara formalnom kontekstu i zašto onda obasiže za koju korpus daje 21 rezultat, odnosno 148,7 puta manje rezultata. I interesantno da ima i varijanta "obaseže", 35 rezultata, a infinitiva nema i nisam onda siguran je li ide obasizati, obasezati, obasegnuti ili kako.
I to sve nebi bio problem, iako mi izgleda vjerovatno da će i čovjeka koji govori hrvatski jezik ta riječ saplesti, ali okej, meni ne smeta šarenilo u jeziku, naprotiv, ali problem je zaista veliki kad od tvorca ove prilično grbave riječi dobiješ pravopisom po ušima da si nepismen što ne koristiš obasiže kad je to pravilno, a nije pravilna riječ koja je 148,7 puta više zastupljena u jeziku. Ili beskonačno puta kao ono sa besprizoran.
Meni je i 21 rezultat u korpusu dovoljan da shvatim riječ kao dio jezika naravno, i jasno mi je i značenje i smisao tu nema zbora, ali kad su sinonimne riječi raspoložive u kontekstu, ne kvare ništa, ne oduzimaju ili dodaju ništa u kontekstu, onda bih da lektorišem u hrvatskom jeziku, u ovom kontekstu, i vjerovatno u 99.9 % svih mogućih konteksta precrtao ovo obasiže i zamijenio očekivanijom varijantom. I to nije kao sa ovima što normiraju jezik, pa nije ispravno, i ne bih je ja precrtao nego su je precrtali iz upotrebe milioni ljudi, i tu nema pomoći, i nema veze je li meni okej ili nije ako je upotrebljena u uvodnoj rečenici za korpus jezika kojim je kako bih rekao, obasegnuta i ta riječ. Ne ide. Mogu na forumu kako oću da prevrćem jezik, ali za svaku situaciju odgovarajući jezik.



User avatar
judolino
Swine Who Must Be Obeyed
Posts: 6091
Joined: 25 Sep 2011, 09:03

Post by judolino » 19 Jun 2016, 21:59

O jebem li ti mater mrtvu u ladnom grobu... :facepalm:



ostruznicagornja
Posts: 799
Joined: 08 Aug 2015, 00:41

Post by ostruznicagornja » 20 Jun 2016, 08:14

Pa Swambo ja ću sad da potražim neko drugo mjesto za zezanje na internetu, ne moram da čitam tvoje baljezganje za moje pare.



User avatar
judolino
Swine Who Must Be Obeyed
Posts: 6091
Joined: 25 Sep 2011, 09:03

Post by judolino » 20 Jun 2016, 14:37

Uopće nisi fer, ja napišem jednu rečenicu a ti pišeš plahtu za plahtom - na koju je foru tebi teže nego meni?



User avatar
MmeTipfeler
Katica za sve
Posts: 7602
Joined: 24 Mar 2012, 20:31

Post by MmeTipfeler » 20 Jun 2016, 17:02

judolino » wrote:Uopće nisi fer, ja napišem jednu rečenicu a ti pišeš plahtu za plahtom - na koju je foru tebi teže nego meni?
On tvoju rečenicu mora pročitati, a ti njegovu plahtu preskočiš. :cerek:


Kad piješ, ne piši po forumu; kad pišeš po forumu, ne pij!