• Nie Znaleziono Wyników

"Статистические методы изучения лексики", Р. М. Фрумкина, Москва 1964, Издательство «Наука», Академия Наук СССР, Институт языкознания, s. 114, 2 nlb. : [recenzja]

N/A
N/A
Protected

Academic year: 2021

Share ""Статистические методы изучения лексики", Р. М. Фрумкина, Москва 1964, Издательство «Наука», Академия Наук СССР, Институт языкознания, s. 114, 2 nlb. : [recenzja]"

Copied!
7
0
0

Pełen tekst

(1)

Jadwiga Sambor

"Статистические методы изучения

лексики", Р. М. Фрумкина, Москва

1964, Издательство «Наука»,

Академия Наук СССР, Институт

языкознания, s. 114, 2 nlb. :

[recenzja]

Pamiętnik Literacki : czasopismo kwartalne poświęcone historii i krytyce

literatury polskiej 56/4, 598-603

(2)

leżn o ści, w ra żen ia zm y sło w e. U F ray L uis m ożna — badając P r o fe c i a d e l T a j o — za u w a ży ć p rzew a g ę e le m e n tó w a fe k ty w n y c h (a fek ty w n a w a ria cja , op erow an ie stru k tu rą k lim a k s i an ty k lim a k s), n a to m ia st w O de en S alin as połączone są róż­ n e form y. San J u a n de la Cruz nad e lem en ta m i a fe k ty w n y m i obrazow ym daje p rzew a g ę k o n stru k cji lo g iczn ej. L ope de V ega w sw ojej w ielo ra k o ści u k azu je a sp e k t m ało u n ieg o o c zek iw a n y (poezja filo zo ficzn a ). U Q ueveda w reszcie, u k tó ­ reg o elem en t lo g iczn y jest ta k zagęszczon y, a ob razow y tak ro zw in ięty , dokonuje się — jak m ó w i A lo n so — „najazd a fe k ty w n o śc i”, i jego tw ó rczo ść je s t „ w u lk a ­ n em e m o c ji”.

R ozróżn ien ie sześciu ty p ó w w za sto so w a n iu do p o szczeg ó ln y ch u tw o ró w p o e ­ ty c k ic h prow ad zi jed n a k do ta k w ie lk ie g o zróżn icow an ia — p isarze b ow iem e w o ­ lu u ją , u każdego m ogą w y stą p ić w sz y stk ie m o żliw e rodzaje — że w efe k c ie b ar­ dzo żm udnej ty p o lo g ii o trzy m u je się w ła ś c iw ie to sam o, co na początku: p o ­ tw ierd zen ie jed y n o ści i n iep o w ta rza ln o ści utw oru. D o szed łszy do tego w n iosk u , A lo n so p ow raca w ię c do p u n k tu w y jśc io w e g o , do in tu icji: k ażd y utw ór litera ck i, k ażd y pisarz w y m a g a in n ej, jem u ty lk o w ła śc iw e j m etody.

U r s z u l a D ą m b s k a - P r o k o p

Р. М. Ф р у м к и н а , СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ ЛЕКСИКИ. Моск­ ва 1964. Издательство „Наука”, s. 114, 2 n ib . Академия Наук СССР, Институт языко­ знания.

W ydana n ied a w n o w M osk w ie praca R. M. F ru m k in y n a le ż y do n ieliczn y ch p u b lik a cji z za k resu lin g w is ty k i sta ty sty c z n e j. P rzed m iotem z a in tereso w a ń a u to r­ k i je s t lek sy k o lo g ia , a w szczeg ó ln o ści — za sto so w a n ie m etod sta ty sty c z n y c h przy b ad an iu sło w n ictw a . P race teg o ty p u p rzep row ad zan e są w Z SR R p rzede w s z y s t­ k im na m a teria le języ k a P u szk in a , istn ie je b o w iem sło w n ik języ k a tego p o ety , op a rty na tek sta ch całej je g o tw órczości. L iczn e d otych czas o g łaszan e p u b lik acje F ru m k in y d o ty c z y ły bądź p rob lem ów czysto m etod ologicznych, bądź zagad n ień o ch arak terze teo rety c z n o -sta ty sty c z n y m . W ydana o sta tn io praca je s t w ię c w p e w ­ n y m sen sie p o d su m o w a n ie m d o ty ch cza so w y ch w y n ik ó w badań autorki, a tak że p r zed sta w ien iem o g ó ln o św ia to w eg o stan u b adań w d zied zin ie lek sy k o g r a fii s t a ­ ty sty czn ej.

S tw ierd zić trzeba, że p ro b lem a ty k a te o rety czn o -m eto d o lo g iczn a jest w cią ż p rzed m iotem za in tereso w a n ia w ie lu in n y ch , tak że i zach od n ich badaczy (por. prace M andelbrota, S om ersa, H erdana, M illera) — trw a nadal etap d osk on alen ia narzęd zi i d op a so w y w a n ia ich m o żliw o ści do p rzed m iotu badań. W ynika to z n o ­ w e g o u jęcia fa k tó w języ k o w y ch , jako zdarzeń lo so w y ch p rzeja w ia ją cy ch p ra ­ w id ło w o śc i o ch arak terze ilo ścio w y m . P ra w a sta ty sty c z n e w języ k u zauw ażono n ajw cześn iej w sy s te m ie fo n o lo g iczn y m — ob ecn ie w ie le prac za jm u je się p ra ­ w a m i ilo śc io w y m i w sło w n ic tw ie , a tem a ty k a ta p od ejm ow an a jest w sp ó łcześn ie ty m go rliw iej, że w ięk szo ść bad ań sta ty sty c z n y c h sta n o w i p o d sta w ę do sto so w a ­ n ia teo rii in fo rm a cji w b ad an iach języ k o zn a w czy ch .

P raca F ru m k in y, ja k k o lw ie k za w iera dość o b fity aparat sta ty sty c z n y , je s t dla języ k o zn a w cy ca łk o w icie czy teln a ; lek tu rę zn a k o m icie u ła tw ia zam ieszczon y na k oń cu D o d a te k , k tó ry sta n o w i d osk on ałe w p ro w a d zen ie w p o d sta w o w ą p ro b le­ m atyk ę sta ty sty czn ą badań języ k o zn a w czy ch . A utorka d efin iu je tu p rzede w s z y s t­ kim p ojęcie p r a w a s t a t y s t y c z n e g o w od różn ien iu od p r a w a ś c i s ł e ­ g o i w y k a zu je na p rzy k ła d zie szeregu z ja w isk języ k o w y ch , iż sta n o w ią one p ra­ w id ło w o śc i sta ty sty c z n e .

(3)

W zasad zie n iem a l w sz y stk ie dotychczas fo rm u ło w a n e reg u ły gram atyk o p ie ­ rano na in tu icy jn y m poczuciu częstości form w b liżej n ie ok reślon ej liczb ie te k ­ stów — sto so w a n ie m etod sta ty sty k i m atem atyczn ej p o zw a la te reg u ły u ściślić. N iem ożn ość badania w szy stk ich tek stó w zm usza do w yb oru rep rezen ta ty w n ej próby — o k reślen ie niezb ęd n ej jej w ielk o ści i ocena d ok ład n ości otrzym an ych p aram etrów to dw a p o d sta w o w e zadania, z ja k im i styk a się język ozn aw ca w s w o ­ jej pracy. R ezygn u jąc z w y ja śn ie ń teoretyczn ych (odsyłacze do p od ręczn ik ów s t a ­ ty s ty k i m a tem atyczn ej), autorka ogranicza się do p odaw ania p o d sta w o w y ch w z o ­ rów m eto d y rep rezen tacyjn ej i elem en ta rn y ch p rzyk ład ów język ow ych .

P ierw szy m etap em badań ilo ścio w y ch nad sło w n ictw em jest b u d ow a sło w n i­ k ó w frek w en cy jn y ch . Z godnie z tą chronologią p rob lem atyce sło w n ik ó w p o św ię ­ cony je s t rozdział 1: S ł o w n i k i f r e k w e n c y j n e , ich histo ria, te o r ia i m e t o d o lo g i a

b u d o w y .

Z asadnicze cele, ja k ie sta w ia li sobie au torzy sło w n ik ó w frek w en cy jn y ch , to — zdaniem F ru m k in y — 1) racjon alizacja procesu nau czan ia język a; 2) u lep szen ie różnych sy stem ó w kodow ania; 3) badanie języ k a poszczególn ych au torów , ga tu n ­ k ó w litera ck ich , itp. N a jw ięcej sło w n ik ó w p o w sta ło w zw ią zk u z celem p ie r w ­ szym ; w y k o r z y sty w a n ie sło w n ik ó w fr ek w en cy jn y ch w stu d ia ch nad języ k a m i a u torów je s t w cią ż jeszcze bardzo n ie w ie lk ie . P odając krótk i zarys h isto rii ty ch sło w n ik ó w , F rum kina zw raca u w agę na zn am ien n ą ew o lu cję ich stru k tu ry: s ło w ­ n ik i n a jn o w sze za w iera ją tak że częstości form m orfologiczn ych , od m ien n ych zn a ­ czeń w yrazu , itp.

W zasad zie im b ogatszą k la sy fik a cję le k s y k i podaje dany sło w n ik fr e k w e n - cyjn y, ty m w ięk sza jego w artość, p on iew aż n iezw y k le cen n e są dane liczb o w e d otyczące np. częstości p oszczególn ych k ategorii gram atyczn ych , fle k sy jn y c h , s ło ­ w o tw ó rczy ch , w y ra zó w n a cech o w a n y ch (archaizm y, n eologizm y, em o cjo n a lizm y itp.) — jed n ak że p am iętać trzeba, że zb yt szczeg ó ło w y p od ział n ie je s t m o żliw y tak że ze w zg lęd ó w tech n iczn ych .

N a to m ia st z reg u ły te k sty sta n o w ią ce p o d sta w ę dla dan ego sło w n ik a fr e k w e n - cyjn ego n ależą do różnych sty ló w , rodzajów litera ck ich . Id eałem b yłb y sło w n ik p od ający przy danym h a śle lek sy k a ln y m n ie ty lk o jego częstość ogólną, a le czę­

stości w p oszczególn ych stylach , rodzajach (nie m ów iąc o częstościach w p o szcze­ góln ych tek sta ch , bo to w y d a je się czym ś zgoła n iem o żliw y m do zrealizow an ia). O ile sło w n ik n ie d otyczy języ k a konkretnego autora lu b dzieła (w ted y b ad a­ ną populacją je s t dany tekst), p o w sta je bardzo trudny p roblem w yb oru d o sta tecz­ n ie rep rezen ta ty w n ej próby, p rzy czym rep rezen ta ty w n o ść ta m usi b yć zarów n o jak ościow a, jak też ilo ścio w a . O zesta w ie te k stó w decyd u ją w z g lę d y litera ck ie, języ k o w e itp., w ie lk o ść próby za leż y śc iśle od p rzyjętego stopnia d okładności szacu n k u — je s t to zależność fu n k cy jn a i nie m ożna jej pom ijać.

M ankam entem n iem a l w sz y stk ic h d o tych czasow ych sło w n ik ó w b yło in tu ic y jn e p rzy jm o w a n ie d anego zbioru te k s tó w jako „dużej próby” — ch w a leb n y m w y ją t­ k iem je s t sło w n ik języ k a a n g ielsk ieg o T orn d ik e’a, sło w n ik h iszp ań sk i G arcia H oża oraz sło w n ik i języ k a ro sy jsk ieg o Josselson a i S tein feld ta . A u torzy sło w n i­ ków języ k a a n g ielsk ieg o i h iszp ań sk iego próbują stosow ać bardziej śc isłe k ryteria przy doborze w ielk o ści próby, jed n ak że n ie w y k o rzy stu ją za leżn o ści m ięd zy w ie l­ k ością prób y a dokładnością szacunku, uznać w ię c trzeba ich kryteria za dow oln e. T en błąd u su n ięto przy sło w n ik a ch rosyjsk ich : przyjm u jąc d opuszczalny błąd szacu n k u b n ie w ię k sz y n iż 30% dla w szy stk ich w yrazów , których częstości em p i­ ryczn e są n ie m n iejsze n iż pr = 0,00001, u stalon o w ielk o ść próby N przy za ło ż e ­ niu, że za w a rte w sło w n ik u w y ra zy pokryją założony z góry p rocen t te k stu C.

(4)

F ru m k in a w y p ro w a d za za leż n o ści m ięd zy N, C, p r i <5, w y k o rzy stu ją c ró w n a n ie Z ipfa i em p iryczn ą fu n k cję rozk ład u często ści w y r a z ó w С = F(B), gd zie F(B) =

в

£ Pr- R ozw ażan ia teo r e ty c z n e doprow adzają au to rk ę do w n io sk u , iż do ce ló w

7 = 1

prak tyczn ych w y sta rcza w za sa d zie osza co w a n ie grupy 1500 n a jczęstszy ch w y ­ razów .

W niosek ten w y d a je się tro ch ę za sk a k u ją cy — i na p ierw szy rzut oka ro zcza ­ row u jący, przede w sz y stk im dla tych , k tórzy zn ają stru k tu rę sta ty sty czn ą s ło w ­ n ictw a b adanych p rzez sieb ie te k s tó w i w ied zą , że w k o n k retn y m tek ście n a j­ bardziej in teresu ją cą , „ ch a ra k tery sty czn ą ” w a r stw ę le k s y k i sta n o w ią w y r a z y n a j­ rzadsze, tw orzące „ogon” k rzy w ej na w y k r e sie często ści. W obec teg o w y d a w a ło b y się, że sło w n ik fr e k w e n c y jn y p o w in ien za w iera ć ta k że te w y r a z y rzadkie, a w ię c szacu n ek m ia łb y d o ty czy ć n ie 1500, lecz np. 10 000 w y r a z ó w n a jczęstszy ch .

Ze w zg lęd ó w m ery to ry czn y ch n ic n ie stoi tem u na przeszk od zie, p a m ięta ć ty lk o trzeba, że ab y z d o sta teczn ą d ok ład n ością Ô o szacow ać częstość ta k rzadkich w y ra zó w , n a leży w z ią ć próbę N o w ie le w ię k sz ą , a je s t to często n iem o żliw e ze w zg lęd ó w tech n iczn y ch .

P rop on ow an ą p rzez F ru m k in ę m eto d ę z a sto so w a ł E. S te in fe ld t przy b u d o ­ w ie n a jn o w szeg o sło w n ik a ję z y k a r o sy jsk ieg o , p o m y śla n eg o ja k o „ sło w n ik -m in i- m u m ” dla potrzeb szk o ln y ch , k tó ry p o w sta ł w In sty tu c ie P ed a g o g ik i E stoń sk iej SRR (T allin 1964). S ło w n ik ten oparto p rzed e w sz y stk im na te k sta c h w sp ó łc z e s­ nej litera tu r y m ło d zieżo w ej, a tak że na tek sta ch ro sy jsk iej lite r a tu r y k la sy c z ­ n ej, słu ch o w isk ra d io w y ch , p r a sy itp.

Z p o ja w ien iem się zn aczn ej liczb y sło w n ik ó w fr e k w e n c y jn y c h podjęto też rozw ażan ia teo rety czn e na te m a t za o b serw o w a n y ch p ra w id ło w o ści ilo śc io w y c h w lek sy ce. Jedną z p ierw szy ch i, jak dotąd, n a jw a żn iejszy ch b y ło tzw . p r a w o Z i p f a . P raw o Z ip fa, jego za sto so w a n ia i ogran iczen ia są tem a tem rozdziału 2 w pracy F ru m k in y.

O m aw iając h isto rię odkryć teg o praw a, autorka p rzy jm u je za o stateczn ą je g o p ostać w zór Pr = к • r ~v, gdzie к i у są p aram etram i sta ły m i, a w ię c u ogóln ion ą

postać rów n an ia Z ip fa, k tóry, ja k w iad om o, p rzy jm o w a ł у = 1.

P ra w o Z ipfa, o k reśla ją ce lin io w ą za leż n o ść m ięd zy rangą w y ra zu a jeg o częstością, sta ło się p rzed m iotem szczeg ó ln eg o za in tereso w a n ia w la ta ch 50 -y ch w zw ią zk u z ro zw o jem teo rii in fo rm a cji, p o zw a la ono b o w iem o k reślić p raw d op o­ d ob ień stw o p o ja w ien ia się w y ra zu , a w ię c daje p o d sta w y do o b licza n ia en trop ii. N a gru n cie teo rii in fo rm a cji w y k a za n o (M andelbrot), że języ k sp e łn ia ją c y p raw o Z ipfa jest ró w n o cześn ie o p ty m a ln y m k odem in fo rm u ją cy m . N ie ste ty , w y k a za n o ró w n ież, że ja k k o lw iek w zór p r = кr ~v od p ow iad a o p ty m a ln em u k od ow i, n ie za w sze języ k za ch o w u je to p ra w o (M iller).

Z ależn ość lin io w a m ięd zy rangą w y ra zu a jego p ra w d o p o d o b ień stw em (czyli c zęsto ścią w zg lęd n ą ) n ie je s t sp ełn io n a p rzede w sz y stk im dla w y r a z ó w o m ałych c zęsto ścia ch , gdyż w każdym te k ś c ie is tn ie ją bardzo lic z n e grupy w y r a z ó w o id e n ­ ty czn y ch często ścia ch , ró w n y ch 1, 2, 3, . . . J eśli często ść tra k to w a ć jako zm ien n ą lo so w ą , a liczb ę w zg lęd n ą w y r a z ó w o danej często ści jako p ra w d o p o d o b ień stw o tej zm ien n ej, to zm ien n a lo so w a m a rozkład P o isso n a . F ru m k in a zw raca u w agę, że w y n ik ten, otrzy m a n y po raz p ierw szy p rzez Y u le ’a w r. 1944, p otw ierd za się w e w sz y stk ic h zb ad an ych dotąd tek sta ch , ja k k o lw ie k Y u le sp ra w d za ł ten rozkład na sto su n k o w o n ie w ie lk im m a teria le (N = 20 000 w y ra zó w ). Tak w ię c p raw o Z ipfa n ie zach od zi w w y p a d k u w y r a z ó w rzad k ich , za które u w aża się na ogół w y ra zy o ran gach w ię k sz y c h od 1500 (r >■ 1500).

(5)

M andelbrot w y k a za ł jednak, że lin iow a zależność m ięd zy rangą a częstością w y ra zu n ie je st sp ełn ion a tak że dla w y ra zó w n ajczęstszych , k tó ry ch ran gi są m n iejsze od 50. W su m ie praw u tem u p odlega n iew ielk a grupa w y ra zó w , których ra n g i sp ełn ia ją n ieró w n o ść 50 <C r < 1500 — stw ierd zić jed n ak że trzeba, że ja k ­ k o lw iek sta n o w ią one n iezn aczn y p rocent sło w n ictw a , w sk u te k w y so k ic h częstości p ok ry w a ją bardzo dużą część te k stu (około 75—80%). F rum kina w y k a z u je tak że, że jed y n ie w tym p rzed ziale (granice dla r podane pow yżej tra k to w a ć trzeba jako d an e o rien ta cy jn e) p rzyjąć m ożna param etr y za stały: k orzystając z danych liczb o w y ch różn ych sło w n ik ó w frek w en cy jn y ch , autorka u d ow ad nia dla r > 1500 zależność fu n k cy jn ą y — f(r), gdzie y je s t n iem a leją c ą fu n k cją r.

50

F ru m k in a p rzyjm u je w ie lk o ść J? p r za sta łą dla różn ych języ k ó w . P o d

-r = 1

k reślić trzeb a, że w y p o w ia d a się ona bardzo scep ty czn ie o zm o d y fik o w a n y m ró w ­ n a n iu Z ipfa zaproponow anym przez M andelbrota. Jak w iad om o, M andelbrot p o ­ d a ł ogóln y w zór Z ipfa w p ostaci pr — к [т + q) ~ v, gdzie g je s t p aram etrem z m ie n ­ n ym dla r < 50, zaś dla r > 50 g = 0. W zór Z ip fa-M an d elb rota sp ełn io n y je s t dla w y ra zó w z przed ziału 1 < r < 1500, a w ię c tak że dla w y ra zó w n ajczęstszy ch . M andelbrot n ie podał w p ra w d zie m etod y oszacow an ia p aram etrów y i g (jest to dość trudne ze w zg lęd u na ich u w ik łan ie), n iem n iej jed n ak n ależałob y p rzy jm o ­ w a ć raczej tę p ostać rów n an ia jak o w yrażającą zależność lin io w ą m ięd zy rangą w y ra zu a jego częstością. W spom nieć tu trzeba o bardzo in teresu ją cej propozycji osza co w a n ia p aram etrów y i q z rów n an ia Z ip fa-M an d elb rota, podanej przez J e ­

rzego W oronczaka К Z d an iem F ru m k in y, popraw ka M andelbrota p olegająca na w p ro w a d zen iu g do rów n an ia Z ipfa n ie w n o si n ic now ego, n ie m ożna b ow iem n adać tem u p a ram etrow i żadnej in terp retacji lin g w isty czn ej.

R ozdział 3 p o św ięco n y jest zależn ościom ilo ścio w y m m ięd zy sło w n ik iem (V) a d łu gością tek stu (N ). A u tork a o m aw ia przede w szy stk im sta ty sty czn ą stru k tu rę tek stu , cz y li rozkład P oisson a i jeg o w łasn ości: w dotych czas b ad an ych języ k a ch i tek sta ch n a jliczn iejsze są w y ra zy o częstości f = 1, a w ię c w y ra zy n ajrzadsze. D la f > 1 p raw d op od obień stw a szybko m a leją , do tej pory n ie n atrafion o na te k st, w k tó ry m rozkład w y ra zó w d aw ałb y k rzyw ą z dw om a m ak sim am i. W yda­ je się, że rozkład P oisson a je s t isto tą stru k tu ry ilo ścio w ej sło w n ictw a każdego te k stu , że je s t to cecha sło w n ictw a w szy stk ich języ k ó w n atu raln ych .

N a ogół zw ięk sza n ie p róby prow ad zi do lep szych , d ok ła d n iejszy ch r e z u lta ­ tó w — Y u le w y k a z a ł jednak, że param etry rozkładu P oisson a rosną w ra z ze zw ięk szen iem N, stąd p o ró w n y w a n ie sta ty sty czn ej stru k tu ry te k stó w je s t m o żliw e ty lk o przy tek sta ch tej sam ej d łu gości. Z aproponow aną przez Y u le’a ch a ra k te­ r y sty k ę K, p o zw a la ją cą p o ró w n y w a ć te k s ty o różnych d łu gościach , F ru m k in a uzn aje za p rzydatną jed y n ie w w y p a d k a ch w ą tp liw e g o a u torstw a te k s tó w itp. Z d aniem au tork i, w w ięk szo ści w y p a d k ó w p op rzestaw ać n a leży na u ję c iu dan ych w ta b ele i rysu n k i oraz na in terp reta cji czysto lin g w isty czn ej.

R ozporządzając S ł o w n i k i e m j ę z y k a P u szkin a, F rum kina podaje p e w n e dane d o ty czą ce stru k tu ry sta ty sty czn ej w szy stk ich jeg o tek stó w . C ytu jąc fu n k cję

в

F(B) = £ fr, gdzie f r je st częstością w yrazu o randze r, w sk a zu je autorka na

r = 1

1

Zob. J. W o r o n с z a k, M e t o d y obliczania w s k a ź n i k ó w b o g a c tw a s ł o w n i k o ­

w e g o t e k s t ó w . W: P o e t y k a г m a t e m a t y k a . P raca zbiorow a pod red ak cją M. R. M a y e n o w e j. W arszaw a 1965.

(6)

zn am ien n y w y n ik , że 1000 n a jczęstszy ch w y ra zó w p ok ryw a 70% tek stu — jest to regu larn ość o b serw o w a n a n ie ty lk o w języ k u P u szk in a, a le w e w sz y stk ic h zb ad an ych d otych czas języ k a ch . Z k o lei w y ra zy o częstościach f = 1, f = 2 s t a ­ n o w ią 48% le k sy k i, i one to w ła śn ie w p ły w a ją n a ja k o ścio w y charakter lek sy k i, on e d ecyd u ją o jej cech ach ch a ra k tery sty czn y ch . T ak w ię c o „ b ogactw ie s ło w ­ n ik a ” autora d ecy d u je ilo ść i jak ość w y ra zó w rzadkich. T ezę tę ilu stru je F ru m - kina, pod ając próbę k la sy fik a c ji ja k o ścio w ej w y r a z ó w rzadkich u P u szk in a: w y ­ różnia ona w śró d n ich w y r a z y sty lis ty c z n ie n a cech o w a n e, im ion a i n a zw y lub pochodne od nich, w y ra zy „ ch a ra k tery sty czn e” dla danego autora (Frum kina c y ­ tu je sło w n ictw o w y ra źn ie „ p u szk in o w sk ie”), arch aizm y, n eo lo g izm y i inne.

A n alizu jąc z k o le i 200 n a jc z ę stsz y c h w yrazów , dochodzi autorka do w n iosk u , że 1) n ie m a w śró d n ich a n i jed n eg o sty lis ty c z n ie n a cech o w a n eg o (z p u n k tu w i­ d zen ia ro sy jsk ieg o język a lite r a c k ie g o la t 30-tych X I X w .); 2) p ra w ie w sz y stk ie te w y r a z y są n a jczęstsze ta k ż e i w e w sp ó łczesn y m języ k u litera ck im , w y ją w s z y grupę około 50 w y ra zó w , k tó ry ch często ści u le g ły p rzesu n ięciom w sk u tek p rze­ m ian obyczaj o w o -h isto r y c z n y c h , zm ian y znaczeń, itp.

K o lejn y prob lem , b ęd ą cy p rzed m iotem o sta tn ieg o rozdziału, to m etod y p o ­ r ó w n y w a n ia sło w n ic tw a tek stó w . P o ró w n y w a n ie to d otyczyć m a w y d zielo n ej gru ­ p y le k sy k i, uznanej za ch a ra k tery sty czn ą dla b ad an ych tek stó w ; w in n o ono p o ­ leg a ć n ie ty lk o na w y sz u k iw a n iu w y ra zó w w sp ó ln y ch , ale ta k że na z e sta w ie n iu ich częstości.

F ru m k in a o m a w ia m eto d ę sto so w a n ą p rzez autora fr e k w e n c y jn e g o s ło w ­ n ika języ k a h iszp ań sk iego, H oża. W y szu k iw a ł on sło w n ic tw o w sp ó ln e czterem w y d zielo n y m przez sieb ie grupom te k s tó w (książki, d ok u m en ty o ficja ln e, g azety, koresp on d en cja p ryw atn a) i zesta w ia ją c często ści w y ra zó w w sp ó ln y ch w k o le j­ n y ch parach grup (książki — d ok u m en ty, książk i — gazety, itd.) w tzw . ta b lice k orelacji, badał za leż n o ści m ię d z y sło w n ic tw e m te k s tó w przy pom ocy w sp ó łc z y n ­ n ik a k orelacji r.

Tę m etod yk ę F ru m k in a w zu p ełn ości a k cep tu je, proponując jed y n ie in n y ty p w sp ó łczy n n ik a k orelacji. H oz p o słu g iw a ł się często ścia m i a b so lu tn y m i, co stw a rza tru d n ości ra ch u n k o w e i n ie p o zw a la na p o ró w n y w a n ie te k s tó w o różnej dłu gości, stąd F ru m k in a w y b ie r a w sp ó łczy n n ik k o rela cji ran gow ej p, u ży w a n y przy p o ró w ­ n y w a n iu cech n iem ierza ln y ch . P rop on ow an y przez sie b ie tryb p ostęp ow an ia p o le g a ­ ją c y na: 1) w y d z ie le n iu w tek sta ch le k s y k i w sp ó ln ej; 2) u sta len iu jej często ści w obu tek sta ch ; 3) u szereg o w a n iu w y r a z ó w w obu tek sta ch w e d łu g ich rang; 4) o b liczen iu w sp ó łczy n n ik a k o rela cji — sto su je au tork a, p orów n u jąc cztery p od ­ sta w o w e grupy te k s tó w P u szk in a : w iersze, prozę a rty sty czn ą , p u b licy sty k ę, p rze­ k ład y. W każdej z ty c h czterech grup w y d zielo n o le k s y k ę n a jczęstszą , a zarazem w sp ó ln ą i częstą w p o zo sta ły ch grupach — w ten sposób ob liczan o k orelację dla n ieliczn ej grupy 51 w y ra zó w , w y łą c z a ją c z b a d a ń w sz y stk ie w y r a z y gram a­ tyczn e.

U zy sk a n e w y n ik i dla w sz y stk ic h grup te k stó w w y k a zu ją k o rela cję n ie o c z e k i­ w a n ie m ałą: n iem a l żaden w sp ó łc z y n n ik k orelacji q n ie p rzekracza w a rto ści 0,5. W yk lu czen ie grupy w ierszy n ieco p op raw ia w y n ik , a le k orela cja n a d a l jest dość słab a. B ad an ia H oża w te k sta c h h iszp a ń sk ich w sk a z y w a ły na bardzo w y so k ą w sp ó łza leżn o ść często ści le k s y k i (w sp ółczyn n ik r rzęd u 0,7 — 0,9), jed n ak że w y ­ n ik i ta k ie otrzym an o w sk u te k w lic z e n ia do p orów n yw an ej le k s y k i tak że grupy n a jczęstszy ch w y r a z ó w gram atyczn ych , co F ru m k in a u w aża za zab ieg ca łk o w icie n iesłu szn y : w y r a z y gra m a ty czn e m ają często ści n a jw y ż sz e w e w sz y stk ic h b ad a­ n ych tek sta ch i sztu czn ie zw ię k sz a ją sto p ień w za jem n ej w sp ó łza leżn o ści tek stó w .

(7)

W su m ie n a leży w ię c uznać w y n ik i Hoża i F ru m k in y za zbliżone, m im o rozb ież­ ności d anych liczb ow ych .

J a k k o lw iek m etoda proponow ana przez oboje au torów i ich w y n ik i są in t e ­ resu ją ce ze sta ty sty czn eg o p u n k tu w id zen ia, trudno jed n a k języ k o zn a w cy ukryć rozczarow anie: stw ierd zen ie m alej k orelacji m ięd zy w iersza m i a prozą a r ty s ty c z ­ ną P u szk in a n ie w ie le m ów i, p aram etrom ty m n ie nad aje się tu żadnej in terp re­ ta cji lin g w isty czn ej.

J est jeszcze inna w ą tp liw o ść, która n ie d otyczy te k s tó w P u szk in a, a le m oże b y ć bardzo istotn a np. przy p orów n yw an iu te k s tó w o n iero zstrzy g n ięty m au tor­ stw ie : o n ie w ą tp liw y m „zb liżen iu ” dw óch te k s tó w św ia d czy w ła śn ie m ięd zy in ­ n y m i w y stęp o w a n ie w nich n a w et n ieliczn ej grupy w sp ó ln y ch h a p a x le g o m en o n lu b d is le g o m e n o n o bardzo orygin aln ych zn aczeniach, ety m o lo g ii itp. — w sp ó łw y - stęp o w a n ie tak rzadkich w y ra zó w m oże być fa k tem bardzo zn am ien n ym , stąd ogran iczan ie się do a n a lizy w y łą c z n ie w y ra zó w n a jczęstszy ch n ie w y d a je się w y sta rcza ją ce. In teresu ją cy ch p rzyk ład ów tego typ u w sp ó łza leżn o ści dostarcza np. praca R. M orgenthalera S t a t i s t i k d es N e u t e s t a m e n t l i c h e n W o r ts c h a t z e s (Zu­ rich 1958), gdzie w sp ó łw y stę p o w a n ie n ie z w y k le rzadkich w y ra zó w w y k o r z y sty ­ w a n e je s t jako jeszcze jed en a rgu m en t p rzem a w ia ją cy za p o k rew ień stw em p o ­ szczeg ó ln y ch k sią g N o w e g o T e s ta m e n tu .

P orów n u jąc te k sty ze w zg lęd u na ich le k sy k ę , p a m ięta ć ró w n ież trzeba, że p o ró w n a n ie to d otyczyć p ow in n o przede w sz y stk im stru k tu ry lek sy k i: różnice m ięd zy tek sta m i to tak że różnice struktur sta ty sty czn y ch ich sło w n ictw a . P o ­ ró w n y w a n ie treści elem en tó w języ k o w y ch je s t często b ezow ocn e ze w zg lęd u na różnice w tem a ty ce, ze sta w ie n ie form prow adzi do d aleko ciek a w szy ch rezu lta ­ tów . W ydaje się np., że dla sty lu m łod op olsk iego szczeg ó ln ie ch a ra k tery sty czn y je s t przym iotn ik , a sty l n au k ow y zn am ion u je częste u ży cie d op ełn iacza (w zw ią z ­ k u z przydaw ką dop ełn iaczow ą).

Oprócz załączonego w D o d a tk u II sło w n ik a frek w en cy jn eg o języ k a P u szk in a (1000 n a jczęstszy ch w yrazów ) praca F rum kiny zaw iera jeszcze n ie z w y k le cenną i obszerną b ib lio g ra fię dotyczącą prac z zak resu m etod ilo ścio w y ch w ję z y k o ­ z n a w stw ie rad zieckim i św ia to w y m . T em atyk a tych prac — podobnie jak i o m a­ w ia n ej tu k siążk i — d otyczy w znacznej m ierze zagad n ień bądź m etod ologiczn ych , b ądź teo rety czn o -sta ty sty czn y ch , n ie zaś czysto języ k o w y ch . Jest to chyba p rze­ ja w o g ó ln o św ia to w eg o sta n u bad ań w tej d ziedzinie.

Cytaty

Powiązane dokumenty

[r]

Doświadczenie wielu w ieków pozwoliło poznać, że na podstawie opinii w ym ien ia ­ nych m iędzy sędziami daje się utw orzyć lepszy sąd niż na podstawie

Najwyższego z dnia 11 stycznia 1978 r.. taryfy adwokackiej i wydatków jednego adwokata, np. na przejazdy), ale także ryczałtów pobieranych przez zespół

Glosa do uchwały Sądu Najwyższego z dnia

K ażdy jego fotogram je st p rzem yślaną, skończoną

P otrzebow skiego oraz

[r]

Na koniec oddał hołd