• Nie Znaleziono Wyników

w języku czes kim

W dokumencie 1/2014 (Stron 35-42)

Słowa klu cze: języ koz na w stwo ko r pu so we, języ koz na w stwo mate ma ty cz ne, Cze ski Ko r pus Na ro do wy, imiesłów cza su przeszłego, ilo czas sa mogłosek Ke y words: co r pus lin gu i stics, mat he ma ti cal lin gu i stics, The Czech Na tio nal Co r pus,

past par ti ci p le, length vo wel Abs tract

This article presents the results of a study, the aim of which was finding and lo gi -cal ly grouping verbs that retain the the ma tic vowel length pre ce ding the de te r mi nant of the past tense in Czech. The research ma te rial is based on corpus SYN2010 of the Czech Na tio nal Corpus. The ten most frequent verbs are in clu ded in the list of words exa mi ned by the author. At ten tion is also focused on the verbs with the lowest fre qu -en cy, which the ma jo ri ty of Czech native speakers con si der to be in cor rect, or they don’t know them.

Ni nie j szy artykuł pre zen tu je wyniki badania, którego celem było od na le zie nie i lo gi cz ne po gru po wa nie cza so w ni ków zachowujących długość samogłoski tema-tycznej po prze dzającej wy zna cz nik czasu przeszłego w języku czeskim. Materiał badawczy został po zy ska ny na pod sta wie korpusu SYN2010 należącego do Cze skie -go Korpusu Na ro do we -go. Autor prze sta wia dziesięć naj czę st szych cza so w ni ków wśród ba da nych wyrazów. Skupia również swą uwagę na cza so w ni kach o naj ni ż szej fre k wen cji, które w odczuciu wię kszo ści ro dzi mych użyt ko w ni ków języka cze skie go są nie po pra w ne bądź nie są im znane.

Współcześnie wykorzysty wa nie kom pu te ra znajdu je sze ro kie za-stoso wa nie w różnych obsza rach życia człowie ka. Nau kow cy – szcze- gólnie językoznaw cy – co raz powszechniej do pra cy ba dawczej wy-korzys tują osiągnię cia językoznawstwa kor pu so we go, które zajmu je

P a ł y s P., 2006, »Perła Korony Czeskiej« czy »Stare piastowskie ziemie«? Ar gu -men ta cja stan konfliktu o przy na le ż ność państwową Ziemi Kłodzkiej w latach 1945–1947, „Kladský sborník” 7, s. 291–296.

P e r n a r o w s k i L., 1958, Typy osiedli Ziemi Kłodzkiej, „Rocznik Kłodzki”, t. III.

Słownik ety molo gi cz ny nazw geo gra fi cz nych Śląska, 1970–2011, t. I–XVI, Warszawa–Wrocław–Opole.

Studia z dziejów Ziemi Kłodzkiej, 1990, Wrocław.

się ana lizą języka w kor pu sach językowych (Le wan dowska To -maszc zyk 2005, s. 11). Dzię ki te mu można o wie le szyb ciej wyd zie lić ma te riał ba dawczy, ale trze ba mieć na uwad ze, iż niez będ na jest zna -jo mość re guł i praw języka na tu ralne go. Umożli wia to efek tywnie jsze sfor mułowa nie zapy ta nia, co nie sie ze sobą maksy malne wykorzys ta -nie for malnych cech języka (Osolsobě 2012, s. 174).

Wie le pra widłowoś ci i re guł języka na tu ralne go jest le piej znane przez os oby, dla których ten język nie jest językiem ojc zystym. Poszu kują one bo wiem au to ma tyc znie reguł czy sche matów w opa nowy wa nej mo wie oraz ana lo gii z językiem ojc zystym, do cze go bard zo do -brze nadają się kor pusy języko we. Mogą one służyć i służą rów nież do nau ki języka, która opie ra się na sa mod zielnej pra cy uc znia z teks tem.

Uc zeń sam lub pod okiem nauc zy cie la ob serwu je w teks tach jednostki języka i poszu ku je uogólnio nych wniosków odnoszących się do funk -cjo no wa nia języka. Tę me todę nauc za nia, która dla języka czes kie go zac zy na się sto pniowo rozwi jać, nazwa no DDL. Jest to skrót an giel-skie go ter mi nu da ta dri ven lear ning (Osolsobě 2012, s. 174).

W ni nie jszym ar tyku le przeds ta wię wstępne ba da nie prze pro wa-d zone na cza sow ni kach za chowujących wa-długość sa mogłoski te matyc znej po przed zającej wy znac znik cza su przeszłego w języku czes kim. Celem ba da nia jest świa do mość u od bior cy wspom nianych cza -sow ników oraz stwierd ze nie, ja ki pro cent sta no wią one w Czes kim Kor pu sie Na ro dowym. In te re su je mnie, czy jest możli we lo gic zne po -gru po wa nie tych leksemów, aby ułatwić ich za pa mię ta nie przez os oby uczące się języka czes kie go ja ko ob ce go.

Ma te riał ba dawczy po chod zi z kor pusu SYN2010 (kor pus zrów-noważo ny ga tunkowo1 z prze ważającą częś cią tekstów z lat 2005–

–2009), za wie rającego 100 mi lionów słów. Do eks cerpcji wykorzy-stałem wyszu ki warkę kor pu sową Bo ni to opra co waną dla Czes kie go

Kor pusu Na ro do we go (CKN) przez Pavla Rychle go w 2003 roku (http://www.kor pus.cz/bo ni to/in dex.php). Wyszu ki warkę kor pu sową Bo ni to wykorzys tu je rów nież Chorwacki Kor pus Na ro dowy (Hrvats ki na ci nalni kor pu(Hrvats; http://hnk. ffzg.hr), który je(Hrvatst zbu do wa ny na za -sa dach opi -sa nych w czes kim językoznaw stwie kor pu sowym. Trze ba tu do dać, że odkry cia czes kich nau kow ców były przełomo we dla ba -dań kor pu sowych, po nie waż au to ma tyc zna ana li za mor fo lo gic zna i składnio wa ty po wa dla języków fleksy jnych pos ta wiła tech no lo gii wię ksze wy zwa nie (por. Bańko 2012, s. 5).

Za nim przeds ta wię wy ni ki ba dań, przy toc zę re guły tworze nia cza -su przeszłego w języku czes kim z uwzględnie niem form imiesłowo-wych. Jak po dają au torzy Českiej mluvnicy (Havránek, Jed lička 1960, s. 246), for ma cza su przeszłego składa się z imiesłowu cza su prze-szłego (zwa ne go też imiesłowem czyn nym bądź par ti ci pium l- o vym) i cza sow ni ka po siłko we go být w cza sie te raźnie jszym, np. psal jsem.

Przed mio tem moich dalszych zain te re so wań będ zie ów imiesłów.

Zgodnie z re gułą sa mogłoska te ma tyczna po przed zająca wy znac znik cza su przeszłego nie za chowuje długoś ci, np. dát : dal, krýt : kryl, šít : šil itd. Ac zkol wiek wystę pu ją w czeszc zyźnie odstępstwa od tej re -guły: w przy pad ku niek tórych (jedno sy la bowych) be zo ko lic zników z te ma tem za końc zo nym na długą sa mogłoskę formy imiesłowu za -chowują iloc zas, por. hrát : hrál, přát : přál itd. (Rešková, Pin ta rová 2007, s. 87). Są to jed nak tylko niek tóre cza sow ni ki te go typu.

Powyższe infor macje posłużyły do zbu do wa nia zapy ta nia do kor -pusu [word=”.*[ýáíé]l[aoyi]”] | [word=”.*[ýáíé]l”]2, dzię ki które mu w wyszu ki warce Bo ni to uzyskałem 108 cza sow ników, z cze go dwa – udělat i ubílit3 – odr zu ciłem. W ten sposób w wyniku ko rek cji lem ma

-2 Za py ta nie zawiera in fo r ma cję, że po szu ku je my wyrazu (word), którego koniec zawiera samogłoski długie [ý], [á], [í], [é] w pozycji przed wy zna cz ni kiem czasu przeszłego -l- oraz wy zna cz nikiem rodzaju gra maty cz ne go -a, -o, -y, -i, oraz wyrazu (word), którego koniec zawiera samogłoski długie [ý], [á], [í], [é] w pozycji przed wy zna cz ni kiem czasu przeszłego -l- oraz bez wy zna cz ni ka rodzaju gra ma ty-cznego. Oczy wi ście należało jeszcze prze fi l tro wać materiał za py ta niem [tag=“V.*“], aby otrzymać jedynie cza so w ni ki.

1 Czyli taki, który zawiera różne teksty w od po wied nich pro po r cjach, żaden ro-dzaj tekstów nie stanowi ponad 50%. Dla po wy ższe go udział tekstów przed sta wia się następująco: teksty bele try sty cz ne – 40%, li te ra tu ra fachowa – 27% i pub li cy -sty ka – 33%.

ty zacji otrzy małem 106 wy razów będących przed mio tem dalsze go ba da nia.

Znając ilość cza sow ników, w których w formach cza su przeszłego sa mogłoski te ma tyczne po przed zające wy znac znik cza su przeszłego za chowują długość, można oblic zyć, ja ki pro cent sta no wią one wśród wszystkich cza sow ników kor pusu SYN2010. Jest to za led wie 0,54%, co świadczy o tym, iż za chowy wa nie długiej sa mogłoski w imiesło-wie czyn nym jest rac zej zja wis kiem spo ra dyc znym (nie mal wyjąt-kiem od ogólnej re guły gra ma tyc znej). Na to miast ana li za bu dowy grama tyc znej oma wia nych cza sow ników pozwa la zauważyć, że łączą się one w grupy, które umożli wią łatwie jsze ich przys wo je nie. Po -nadto wie le z nich to cza sow ni ki twor zone za po mocą de ry wacji przedrostko wej. Przy jrzy jmy się po niższej ta be li.

Tabela 1. Cza sow ni ki za chowujące długość sa mogłoski te ma tyc znej w imiesłowie cza su przeszłego w porządku al fa be tyc znym

L.p. Pod sta wa

słowo twó r cza Wy ra zy na leżące do da nej gru py Li cz ba wy ra -zów w da nej

gru pie

1. -bát bát, zabát 2

2. -dát udát, nadát, zazdát, zdát 4

3. -dít dít 1

4. -hrát

hrát, vyhrát, prohrát, odehrát, zahrát, sehrát, nahrát, přehrát, dohrát, uhrát, přihrát, rozehrát, pohrát, ohrát, obehrát, předehrát,

vehrát

17

5. -hřát hřát, zahřát, ohřát, přehřát, rozehřát, prohřát,

přihřát, dohřát, nahřát, vyhřát, předehřát 11

6. -kát kát 1

7. -klát proklát, sklát, rozeklát, vklát 4

8. -lát lát, vylát 2

9. -okřát okřát, pookřát 2

10. -pla no ut pla no ut, za pla no ut, vzpla no ut 3

11. -přát přát, dopřát, popřát, blahopřát, poblahopřát,

zapřát 6

12. -ržát ržát, zaržát 2

13. -sát sát, nasát, vysát, přisát, odsát, vsát 6

14. -smát smát, usmát, zasmát, rozesmát, pousmát,

vysmát, nasmát, dosmát, vynasmát 9

15. -stát stát, přistát, obstát, ustát, dostát, přestát,

vystát, prostát, odstát, postát 10

16. -tát tát, roztát,odtát, vytát 4

17. -vát vát, odvát, přivát, navát, rozvát, svát, provát,

ovát, převát, vyvát, zavát 11

18. -vlát vlát, zavlát, rozevlát, dovlát 4

19. -plát vzplát 1

20. -zrát zrát, dozrát, vyzrát, uzrát, nazrát, přezrát 6

Oma wia nych 106 cza sow ników utworzyło 20 grup – rod zin wy -razów, z których najwię cej de ry watów za wie rają grupy hrát, hřát i vát. Biorąc więc pod uwagę kry te rium słowotwórc ze, do opa no wa nia

3 Korpus odnalazł formy uďál i ubíli. Nie dopa so wa nie polega na tym, że pierw-szy wyraz to nie li te ra cka forma cza so w ni ka udělat, a drugi został naj pra wdo po do-bniej źle oz na ko wa ny.

całko wi tej wied zy w tym za kre sie mu simy za pa mię tać jedy nie cza -sow ni ki: stát, hrát, smát, přát, bát, pla nout/plát4, hřát, vlát, tát, sát, zrát, vát, kát, okřát, lát, dít5, rát oraz cza sow ni ki z za końc ze niem -dát6 i -klát7.

Nauc zy cie lom języka czes kie go dane te mogą posłużyć do opra co wa nia odpo wiednich ćwic zeń, po le gających na utrwa la niu w roz mai tych struk tu rach zda niowych słów, które po sia dają największą częs -totli wość wystę po wa nia w różne go rod zaju teks tach. Ko le jna tabe la pre zen tu je dzie sięć najc zęstszych cza sow ników wystę pujących w kor pu sie, które za chowują długość sa mogłoski te ma tyc znej w ana li zo wa nych for mach imiesłowowych, a także przeds ta wia ud ział pro -cen towy (zaokrąglo ny do trze cie go miejsca po prze cinku) owych form w uzyska nym z kor pusu ma te riale językowym, który tworzy zbiór 14 2783 imiesłowów.

Tabela 2. Cza sow ni ki o najwyższej frekwencji wśród cza sow ników za chowujących w imiesłowach długość sa mogłoski te ma tyc znej po przed zającej wy -znac znik cza su przeszłego

Lp. Wy raz Fre k wen cja Udział pro cen to wy w zbio

-rze imiesłowów (%)

1. stát 33096 23,179

2. hrát 17429 12,207

3. zdát 16087 11,267

4. vyhrát 10973 7,685

5. usmát 10829 7,584

6. přát 8157 5,713

7. bát 6306 4,416

8. prohrát 4959 3,473

9. zasmát 4896 3,429

10. smát 4159 2,913

Na leży tu do dać, że frekwencja cza sow ni ka stát jest pra wie dwukrot nie wyższa od hrát ze względu na to, iż stát jest wy ra zem po sia -dającym dwa znac ze nia: pierwsze z nich odpo wia da polskie mu ‘stać’, a dru gie – ‘być war tym, kosz to wać’.

Cza sow ni ki ohrát, vehrát, ro zeklát, dovlát, vklát, převát, vyvát, vy nasmát po ja wiły się w kor pu sie tylko raz. Ich ud ział pro cen towy wy -no si w zaokrągle niu 0,0007 %. Są to więc wy razy rzad ko uży wa ne w czeszc zyźnie, a można na wet przypuszc zać, że niek tóre z nich nie są znane wię kszoś ci Czechów. Potwierd za to wstęp na an kie ta prze -pro wad zo na na lo sowo wy bra nej gru pie dzie sięciu rod zimych użytkow ników języka czes kie go. Ba da nie po le gało na po da niu przez res -pon dentów znac ze nia powyższych wy razów (zob. Aneks). Niek tóre odpo wied zi wskazują, że sze reg ba da nych po raz pierwszy spotkało się z da nym cza sow ni kiem. Mi mo to w for mach opi sowych niek tórzy an kie to wa ni prze ja wia li chęć wy jaśnie nia jego znac ze nia. Odno to wa -liśmy także, iż niek tóre wy razy zos tały przekrę cone bądź po mi nię te.

Kil ka ba da nych osób po my liło ohrát z ohřát, a niek tóre błędnie zin -ter pre to wały znac ze nie poszc zególnych cza sow ników. Przy jrzy jmy się po niższym ta be lom. Pierwsza nich (ta be la 3) przeds ta wia najr -zadsze w kor pu sie cza sow ni ki wraz z ich znac ze niem oraz przykładem ich uży cia w kon tekś cie. Ko le jna zaś – ta be la 4 – pre zen -tu je sto pień po prawnoś ci odpowied zi poszc zególnych ba da nych.

4 Korpus kla sy fi ku je te cza so w ni ki jako odmienne formy, choć są to – jak podaje portal prirucka.ujc.cas.cz – formy wa rian ty w ne. Forma czasu przeszłego może mieć również formę planul.

5 Posiada dwie formy czasu przeszłego děl i dál na podstawie danych z Lingea Lexicon 5.

6 Czasownik dát ma formę czasu przeszłego dal.

7 Według danych uzyskanych z portalu prirucka.ujc.cas.cz czasownik klát nie istnieje.

Tabela 3. Cza sow ni ki najr zadsze wśród ba da nych

Wy raz Zna cze nie Uży cie w zda niu

ohrát grać tak długo, aż

nam się to znu dzi P.C.’s Blu es od Le ste ra Yo un ga jsem si hrál od rána do večera, až jsem tu de sku úplně ohrál.

vehrát od gry wać jakąś ro -lę

Vehrál se do ro le slušného člověka, kterému se závidí je ho peníze, pre zen to val se ja ko „hnací síla

místní eko no mi ky“.

rozeklát po dzie lić na czę ści Když blesk rozeklál hrdlo kli s ny, krev kle s la k Ze -mi a je ho slza za zvo ni la o hřbet ze bry.

dovlát sko ń czyć po wie wa -nie

So t va kapesníky dovlály, a už je na sta vil do jiné po lo hy – tentokrát pra vou ru kou upažil a le vou ne

-chal kle s no ut k ze mi.

vklát po ety c kie wy ra że -nie słowa

‘rozszarpać, ukłuć’

Je ho přísný zrak se ni k dy neusmál / když od te ti vy šíp nám do srdce vklál.

převát prze sunąć z mie j s -ca na mie j s ce przez

wiatr

Ostré erozní hra ny ledových a prachových po loh musí být ve l mi mladé, de jme to mu v měřítku několika desítek tisíc let, pro tože ji nak by je sub li

-ma ce le du zničila a prách převál.

vyvát wy wiać Jde se jí le h ce, pro tože starý sníh od tud vyvál vít.

vynasmát śmiać się aż do wy

-cze r pa nia sił Když se všichni do sy to sti vynasmáli a pochválili pa na ra du, pan ra da pohlédl na stůl do brot a řekl

Tabela 4. Sto pień po prawnoś ci odpo wied zi poszc zególnych ba da nych* Osoba

Wy raz 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

ohrát Ź Ź Ź D Ź Ź D Ź D Ź

vehrát Ź NP Ź Ź NW Ź Ź NW Ź Ź

rozeklát D D D D NW NW Ź Ź Ź D

dovlát D Ź D NP D D Ź NP D D

vklát NP NP NW NW NW NW Ź NW NW Ź

převát Ź NP D D NW D Ź NW D D

vyvát Ź NP D D NW D D NW Ź D

vy

na-smát D NP D D D D D Ź Ź D

* W tabeli użyto skrótów: D – dobrze, Ź – źle, NW – nie wiem/nie mam pojęcia, NP – nie podano.

Żad na z an kie to wa nych osób nie po dała po praw nego znac ze nia wszystkich wy razów. Os oby, które uzyskały najwię cej do brych odpo wied zi, wy jaśniły po praw nie pięć wy razów. Były to dwie os oby: jed -na w wieku 47 lat z wyksz tałce niem średnim i dru ga w wieku 24 lat z wykształce niem nie pełnym wyższym. Wię kszość ana li zo wa nych leksemów była w odczu ciu ba da nych „nie na tu ral na” i rzad ko spo -tyka na. Jed na z osób stwierd ziła na wet, że nie są to słowa z języka czes kie go. Nikt nie wy jaśnił po praw nie wy razu vklát, który ma cha rak ter poe tyzmu. Je den z an kie to wa nych nie ud zie lił ani jed nej po praw nej odpo wied zi. Na pods ta wie tej nie wiel kiej prób ki trudno ge -nera li zo wać, ale można przyjąć hi po tezę (może punkt wy jś cia do dalszych ba dań w tym kierunku), że nie zawsze wiek czy wyksz tałce -nie mają wpływ na zna jo mość okreś lo nych wy razów.

Prze pro wad zone w ni nie jszym ar tyku le ba da nia w opar ciu o kor -pus języka czes kie go pozwo liły wyłonić grupę imiesłowów czyn nych za chowujących długość sa mogłoski te ma tyc znej po przed zającej wy znac znik cza su przeszłego. Przy jęty pod ział ana li zo wa nych cza sow

Prze pro wad zone w ni nie jszym ar tyku le ba da nia w opar ciu o kor -pus języka czes kie go pozwo liły wyłonić grupę imiesłowów czyn nych za chowujących długość sa mogłoski te ma tyc znej po przed zającej wy znac znik cza su przeszłego. Przy jęty pod ział ana li zo wa nych cza sow

W dokumencie 1/2014 (Stron 35-42)

Powiązane dokumenty