• Nie Znaleziono Wyników

Analiza kryteriów doboru materiału do list wyrazowych

3. Kryteria doboru m ateriału do testów kompetencji leksykalnej

3.5. Analiza kryteriów doboru materiału do list wyrazowych

Ze względu na ogólny, kom petencyjny charakter planowanych badań listy w yra­

zowe będące źródłem ekscerpcji m ateriału leksykalnego pow inny mieć charakter neutralny i jak najbardziej uniwersalny.

Nie m ożna więc w tym celu wykorzystać zestawień słownictwa tematycznego.

Dobór zakresów tematycznych, na którym opiera się kryterium treści, nie ma cha­

rakteru uniwersalnego14, nie sposób bowiem uwzględnić w badaniach wszystkich możliwych kręgów. Nie wszystkie są również jednakowo ważne w poszczególnych stadiach procesu dydaktycznego. O bszar tem atyczny rodzina jest z pew nością istotniejszy w początkow ym okresie nauczania niż państwo i społeczeństwo lub media. Same w yrazy należące do poszczególnych kręgów także nie są „rów no­

wartościowe”. Poszerzając zasób leksykalny uczących się, kierujem y się bowiem użytecznością, która w dużej mierze opiera się na frekwencji. Najpierw więc spo­

śród jednostek należących do kręgu tematycznego rodzina poznają słowa, takie jak matka, siostra, brat, a dopiero później w yrazy teść, stryj15.

W badaniach kompetencji leksykalnej o charakterze ogólnym nie można także wykorzystać „list podręcznikow ych” opartych na kryterium wiedzy ze względu na zróżnicowany charakter nauczania polszczyzny. W celu zapewnienia trafności pom iaru przeprowadzonego na podstawie list wszyscy uczestnicy eksperym entu muszą się uczyć z określonych podręczników, w podobnych w arunkach, na zaję­

ciach o podobnym stopniu intensywności (zob. Konopnicki, Ziemba, 1968; Takala, 1984). Badania opierające się na takich źródłach noszą wyraźne znam iona testu osiągnięć, a nie biegłości.

Wyrazy, których znajomość mogłaby stać się przedm iotem badań kom peten­

cyjnych, znajdują się natom iast na listach leksyki nuklearnej, wspólnej różnym odm ianom polszczyzny (kryterium funkcji). Są to bowiem słowa o znaczeniu ogól­

nym, neutralne, znane większości rodzimych użytkowników języka. Przeszkodę w tym przypadku stanow i jednakże nie tyle sam m ateriał, ile jego organizacja.

W ykaz przygotow any przez M arkowskiego (1992) m a uporządkow anie dwoja­

kie - alfabetyczne i tematyczne. Kręgom tematycznym, których autor wyłania aż 50, tru d n o zapewnić odpow iednią reprezentatyw ność, zwłaszcza że liczebność w yrazów jest w nich bardzo zróżnicow ana. P orządek alfabetyczny z kolei jest

14 C ygal-K rupa (1986) np. b ad ała słow nictw o 23 obszarów tem atycznych, G ougenheim i w spół­

autorzy (1964) jedynie 16.

15 Listy o p a rte n a k ry te riu m treś ci częściej byw ają więc w ykorzystyw ane do p rz y g o to w an ia dydaktycznych słow ników pojęciow ych lub tem atycznych (zob. m .in. Seretny, 2003a) niż w b a d a ­ niach kom petencji leksykalnej.

144

całkow icie ahierarchiczny. W szystkie słowa m ają w n im ró w no rzędn y status, a to uniem ożliwia jakąkolwiek gradację m ateriału, niezbędną z p u n k tu widzenia potrzeb dydaktycznych.

Najbardziej obiektywne i neutralne źródło ekscerpcji m ateriału leksykalnego do list wyrazowych stanowią zatem zestawienia frekwencyjne. Opierają się one na reprezentatywnych i obiektywnych, a zatem niezależnych od kontekstu nauczania, danych liczbowych. Obejmują słownictwo najczęściej używane przez rodzimych użytkowników języka, umożliwiając stopniowanie jego trudności.

Dowodu na to, że opanow anie słów najczęściej używ anych stanow i solidny fundam ent budowli, jaką jest znajomość języka, dostarczają m ateriały ukazujące pokrycie tekstu przez słowa o najwyższej frekwencji - znajomość zaledwie 2000 najczęściej używanych wyrazów gw arantuje dostępność leksykalną16 około 80%

przeciętnego kom unikatu sformułowanego w danym języku (zob. m.in. Zgółkowa, 1992; Nation, W aring, 1997; Nation, 2001), przy czym znajomość każdego kolej­

nego tysiąca zwiększa ją już w nieporów nanie m niejszym stopniu (zob. tabela 22 oraz rysunek 17).

T ab e la 22. P o k ry c ie te k s tu w ję z y k u a n g ie ls k im p r z e z w y ra z y o n a jw y ższe j frek w en c ji W YRAZY

(W TYS.)

POKRYCIE TEKSTU (W %)

1000 74,1

2000 81,3

3000 85,2

4000 87,6

5000 89,4

43 831 99,0

86 741 100,0

Ź ró d ło : za: N a tio n , 2001: 15.

Listy wyrazowe oparte na kryterium frekwencji nie są jednakże m ateriałem doskonałym . W ykorzystując je w badaniach, należy pam iętać o kilku istotnych kwestiach.

Po pierwsze, zestawienia frekwencyjne sporządza się na podstawie częstości występowania słowoform, a nie znaczeń. O pozycji wyrazów wieloznacznych decy­

duje więc tak zwana frekwencja kum ulowana, czyli łączna17, i nie wiadomo, które ze znaczeń danego słowa ma najwyższą częstość występowania. Przyjmuje się więc, że jest to znaczenie podstawowe, czyli takie, które rodzim em u użytkow nikow i

16 D ostępność leksykalna oznacza rozum ienie treści znaczeniow ej wyrazów.

17 Bardzo wiele w yrazów zajmujących najwyższe m iejsca n a listach częstości to słowa o kilku (np.

g łow a) lub naw et k ilk u n a stu (np. iść) znaczeniach. S ło w n ik m in im u m ję z y k a po lskieg o Zofii K urzo­

wej i H aliny Zgółkow ej (1992) zaw iera ok. 1600 a rty k u łó w hasłow ych, definiując, w przybliżeniu, znaczenia około 4000 jed n o stek leksykalnych. 850 w yrazów znajdujących się w zestaw ieniu B asic E nglish V o c a b u la ry m a zaś łącznie około 12 500 różnych znaczeń (zob. N ation, 1983).

100

95 pokrycie tekstu

znajomość słownictwa (w tys.) Źródło: W erf i in., 2005.

R y su n ek 17. Z n a jo m o ść sło w n ic tw a (w tys.) a p o k ry c ie te k s tu (w %)

języka nasuwa się jako pierwsze po usłyszeniu w yrazu w izolacji. Opracow ania biorące pod uwagę frekwencję znaczeń należą do rzadkości (zob. tabela 23).

Po drugie, listy frekwencyjne nie są uszeregowaniem faktycznych jednostek leksykalnych pojawiających się w w ypow iedziach rodzim ych użytkow ników . W badaniach częstości jako jednostki znaczeniowe traktowane są bowiem wyrazy tekstowe18. W yrażenia typu leżeć do góry brzuchem, czuć pism o nosem, siedzieć cicho ja k mysz pod miotłą, w ciągu, w zasadzie, czyli tak zwane ciągi formuliczne19 (zob. Wray, 2002) nie figurują jako osobne hasła. Są one „rozczłonkow yw ane”, a tw orzące je w yrazy porządkuje się alfabetycznie. Deleksykalizacja związków frazeologicznych i innych jednostek wielowyrazowych powoduje więc, że na listach występują słowa, które w rzeczywistości nie są wcale częste. Na to zjawisko, w kon­

tekście doboru słownictwa do nauczania języka polskiego jako obcego, zwracała uwagę D anuta Buttler, pisząc:

(...) o g r o m n ą ro lę w w y z n a c z a n iu c z ę sto śc i u ży ć w y ra z ó w o d g ry w a fra z e o lo g iz a c ja (czy raczej „ s z a b lo n iz a c ja ”) p e w n y c h z w ią z k ó w sło w n y ch . O n a to z a p e w n ia w y s o k ą p o z y cję n a liś c ie w y r a z o m p o z a t y m r z a d k i m (...), a n a w e t w y ją tk o w y m (B u ttle r, 1980b: 164).

18 W b adaniach ilościowych, a tak im i są b ad an ia frekw encyjne, przedm iotem analizy są w yrazy ro zu m ian e jako ciągi liter m iędzy dw iem a spacjam i lub zn ak am i o w arto ści spacji.

19 C iągi form uliczne to, w dydaktyce języków obcych, wieloelem entow e połączenia o różnym stopniu zespolenia, o sztyw nym lub elastycznym układzie (zob. Wray, 2002). N a poziom ie recepcji rozpoznaw ane są jako niepodzielne elementy, niepoddaw ane dalszem u przetw arzaniu, a n a poziomie produkcji w yciągane z p am ięci jako całości, a nie generow ane elem ent po elem encie w w y n ik u sto­

sow ania reguł. Do ciągów takich zalicza się (zob. ESOKJ, 2003: 101-103): u tarte form uły, w yrażenia idiom atyczne, intensyfikatory, szablonow e zwroty, w yuczone i używ ane jako całości bez odrębnej analizy, inne stałe zw iązki w yrazow e składające się ze słów regularnie używ anych razem .

Należy również pamiętać, że listy frekwencyjne opierają się na korpusach języka pisanego20. Rzadziej więc pojawiają się w nich w yrazy potoczne, ekspresywne, dosadne, charakterystyczne dla języka mówionego. Komunikację pisemną cechuje też większe bogactwo leksykalne, czego dowodzi wyższa gęstość leksykalna tekstów pisanych (zob. Ure, 1971; O’Loughlin, 1995).

T a b e la 23. H a s ło H E A D (g ło w a ) z G e n e r a l S e r v ic e L i s t M . W e s ta (1953)

HEAD 2216e

head, n. (1) (part of body) A hat on my head

Head and heart (= inteligence and feeling) (5%)

Will cost him his head (= life) (2%)

W iser head; count heads (= persons) (1%) Phrase: over head (= above)

(2) (top)

(63%)

Head o f a bone, plant, page, procession (3) (idea o f leadership)

Head o f the school Head clerk

13%

At the head of the whole business 14%

Head-rest, head-hunter, etc. 1%

head - / Phrases:

Head to foot 0,2%

Head or tail 0,3%

Keep or lose one's head (=control) [On your head be it 0,4%

Off his head = mad 0%]

0,5%

head, v. Headed the list

All came in headed by Mr. X Gold headed stick

[Heading for = going towards 0,4%]

5%

heading, n. Newspaper heading, etc. 2%

Ź ró d ło : W est, 1953.

Pewną słabością zastosowania w badaniach kompetencyjnych list wyrazowych opartych na badaniach frekwencyjnych jest możliwość niedoszacowania faktycznej wielkości zasobu leksykalnego poszczególnych użytkow ników . M ogą oni znać o wiele więcej słów, których opanow aniem nie m ają szans się wykazać. Syste­

mem odniesień jest bowiem lista o określonym składzie i konkretnej liczebności.

W w ypadku planowanych badań najistotniejszą kwestią jest jednakże ustalenie, jak wiele uczący się opanow ali w yrazów najczęściej używanych, które pow inni

20 Podobnie jest w w y p a d k u list frekw encyjnych języka polskiego - większość źródeł ekscerpcji to m ateriały pisane (zob. Kurcz i in., 1974-1977).

poznawać w pierwszej kolejności. Niedoszacowanie faktycznego potencjału lek­

sykalnego jawi się więc w tym kontekście jako kwestia wtórna.

Zdaniem niektórych badaczy, między innym i Stubbsa (1986), listy wyrazowe oparte na kryterium frekwencji zbyt szybko ulegają dezaktualizacji, a sama czę­

stość występowania niektórych słów nie zawsze idzie w parze z tak zwaną użytecz­

nością komunikacyjną. Argument pierwszy jest łatwy do podważenia. Na starszych listach frekwencyjnych nie ma co prawda słów, które są obecnie powszechnie uży­

wane na skutek rozwoju technologicznego, zasadniczy zrąb pozostał jednakże ten sam. Potwierdza to dużą stabilność słownictwa o wysokiej frekwencji21. A rgum ent drugi natomiast, podnoszony nie tylko przez Stubbsa, spowodował, że listy zaczęto uzupełniać w yrazam i o niższej częstości występowania, kierując się kryteriam i potrzeb i użyteczności.

Podaje się również w wątpliwość psychologiczną realność badań frekwencyj­

nych. John Charles Alderson (2007) wykazał na przykład, że wyrazy, które zajmują wysokie miejsca na listach kompilowanych na podstawie kryterium częstości, nie zawsze są postrzegane jako częste nawet przez wykształconych rodzimych użyt­

kowników22. Słowa funkcjonujące w ich świadom ości jako regularnie używane tworzą ciągi wyraźnie odbiegające od zestawień uzyskiwanych na podstawie badań korpusów tekstów. Podkreślając pilotażowy charakter swoich dociekań, Alderson zwraca uwagę na konieczność prowadzenia dalszych analiz, które bądź podważą zasadność wykorzystywania w dydaktyce języka wyników badań frekwencyjnych prow adzonych dotychczasow ym i m etodam i, bądź doprow adzą do odrzucenia przekonania, iż umiejętności kompetentnego rodzimego użytkow nika mogą w tej kwestii stanowić pu n k t odniesienia. Subiektywna ocena częstości występowania w yrazu prawdopodobnie zawsze będzie odbiegać od obiektywnej, gdyż opiera się na dośw iadczeniach jednostkow ych poszczególnych użytkow ników 23. Badania frekwencyjne odwołują się zaś do doświadczeń zbiorowych. Dane uzyskane na ich podstawie można widzieć zatem jako zobiektywizowany obraz rzeczywistości językowej wspólnej wielu mówiącym.

21 Por. listy E.L. T horndika i I. Lorge’a (1944), M. W esta (1953), H. Kucery i W.N. Francisa (1967) z opracow aniem G. Leecha, P. Raysona i A. W ilsona (2001). Por. także listy frekw encyjne H. Zgół- kowej (1992) oraz k o rp u su PW N (http ://k o rp u s.p w n .p l).

22 U c z e s tn ic y e k s p e ry m e n tu p rz e p ro w a d z o n e g o p r z e z Jo h n a C h a rls a A ld e rs o n a b y li językoznaw cam i.

23 W Polsce oceną subiektyw nego praw dopodobieństw a w yrazów zajm ow ali się m .in. W ik to r Jassem i D an u ta G em biak (1980). Badani, posługując się sześciostopniow ą skalą Likerta, zaznaczali, czy dan y w yraz wydaje się im rzadki, b ard zo rzadki, częsty itp. N astępnie p o rów nano frekw encję 30 najczęstszych w yrazów ze słow nika praw dopodobieństw a subiektyw nego, z 30 słow am i o naj­

wyższej frekw encji o trzy m an y m i w w y n ik u b a d ań praw dopodobieństw a obiektyw nego (Sambor, 1972). Praw dopodobieństw o obiektyw ne i subiektyw ne niektórych leksem ów różniło się znacząco.

148

3.6. Wnioski

W badaniach kompetencji leksykalnej uczących się języka polskiego jako obcego metoda próbki oparta zostanie na listach frekwencyjnych. Mimo pewnych ograni­

czeń pozostają one bowiem najbardziej obiektywnym, niezależnym od kontekstu i uniwersalnym źródłem ekscerpcji materiału.

Listy wyrazowe oparte na kryterium frekwencji umożliwiają precyzyjne wyróż­

nienie klas w yrazów o podobnym „potencjale konieczności” oraz o podobnym stopniu trudności (zob. Polański, 1982; Laufer, 1997b; Vermeer, 2004), czyli takich, które pow inny być opanowane przez uczących się na tym samym etapie kształce­

nia językowego. Klasy te m ożna tworzyć z dowolną regularnością, w zależności od potrzeb poszczególne przedziały mogą liczyć na przykład po 250, 500, 1000 wyrazów. W ykorzystanie tego rodzaju list w badaniach poprzecznych ułatwia nie tylko ustalenie wyrażonego liczbowo zasobu leksykalnego uczących się, lecz także w skazanie obszarów słownictwa częstego, w których m ają braki. W badaniach podłużnych um ożliw ia zaś śledzenie dynam iki przyrostu w arstw y leksykalnej u poszczególnych osób w określonych przedziałach.

W ażnym argum entem przem awiającym na korzyść list frekwencyjnych jest także to, że to one stanowią źródło ekscerpcji m ateriału do słownika m inim um , którego zadaniem , co już w 1956 roku podkreślał w Polsce A ntoni Prejbisz, jest:

(...) u s y s te m a ty z o w a n ie i u ła tw ie n ia n a u c z a n ia (a n ie ję z y k a ) p r z e z p la n o w y d o b ó r i m e to d y c z n e w p r o w a d z a n ie s ło w n ic tw a w to k u n a u k i s z k o ln e j (...) o r a z s tw o r z e n ie b a z y w y jśc io w e j d la w s z e lk ic h f o r m d a ls z e j n a u k i. S ło w n ik m in i m u m , z a p o b ie g a ją c p rz e r o s to w i s ło w n ic tw a o d d z ia ły w a d y s c y p lin u ją c o n a o p ra c o w a n ie te k s tó w i ć w ic z e ń w p o d r ę c z n ik a c h i s tw a r z a p o d s ta w ę a d a p ta c ji u tw o r ó w w j ę z y k u o b c y m . S łu ż y o n r ó w n ie ż jako miara tempa i postępów w nauce [p o d k r. A.S.] (P re jb is z 1956: 6 7 -6 8 ).