AkadeiaBydgkai.aziiezaWie

(1)

Katedra Filologii Germa«skiej

Mar in Jun zys-Dowmunt

Ein Finite-State-Modell für einfa h und

mehrfa h zusammengesetzte Komposita

Pra a magisterska

napisanapodkierunkiem

prof. MarkaCieszkowskiego

(2)

Katedra Filologii Germa«skiej

Mar in Jun zys-Dowmunt

Model sko« zenie stanowy wyrazów

pojedyn zo i wiel okrotnie zªo»ony h

Pra a magisterska

napisana podkierunkiem

prof. MarkaCieszkowskiego

(3)

Einführung 1

1 Vorbemerkungen zur Komposita-Analyse 3

1.1 DasFinite-State-Modell und Wortbildungsmodel le . . . 3

1.2 Zum Wesender Komposita . . . 7

1.3 Komposita na hWortart desGrundwortes . . . 9

1.3.1 NominaleKomposita . . . 9

1.3.2 Adjektivis heKomposita . . . 10

1.3.3 VerbaleKomposita . . . 11

1.4 Sonderfälle . . . 12

1.4.1 Possessivkomposita . . . 12

1.4.2 Zusammenbildungen . . . 12

1.4.3 Zusammenrü kungen . . . 13

1.5 Komposita-Segment ierung undSegment-Tagging . . . 13

1.5.1 Denitiondes Segmentbeg ries . . . 14

1.5.2 DasLexikonund linguistis hesTagging . . . 16

1.5.3 Lexikaleund strukturelleAmbiguität . . . 17

1.6 DieKompositionsfuge . . . 20

1.6.1 Bildungder Kompositionsstammformen mitFugenelementen. 22 1.6.2 Systematisierungder Regularitäten . . . 27

1.6.3 Einige Wortezum Bindestri h . . . 29

1.6.4 DieFugeim Verhältnis zur Segmentierung . . . 30

2 Verwendete Finite-State-Mittel 32 2.1 Endli he Automaten . . . 32

2.1.1 Denitionen . . . 32

2.1.2 Ni ht-Deterministis he Automatenund Determinieru ng . . . 35

2.1.3 Abs hlusseigens haftenendli her Automaten . . . 39

2.2 Finite-State-Transdu er . . . 43

2.2.1 Denitionen . . . 43

2.2.2 Abs hlusseigens haftenvon Transdu ern . . . 46

2.2.3 Transdu ermit Endausgabefunktio n . . . 48

2.3 Reguläre Spra hen undmens hli hesParsing . . . 49

2.4 Vor- undNa hteilevon Finite-State-Modellen . . . 51

(4)

3.1.1 Lexikoneinträgeund Tagsets. . . 54

3.1.2 Ein Transdu erals Basis-Lexikon . . . 55

3.1.3 Lexikonstruktur und Segmentieru ng . . . 57

3.2 Erstgliedanalyse. . . 61

3.2.1 FST zur Silbenanalyse . . . 61

3.2.2 FSTs zur Sux-undAuslautbestimmung . . . 66

3.3 Distributionsregeln . . . 68

3.3.1 NaiveKompositastruktur . . . 68

3.3.2 Tag-basierteRegeln . . . 73

3.3.3 Lexikalisierte Regeln . . . 77

3.3.4 DieDistributionsregeln als Ganzes . . . 79

3.4 Zusammenspiel der Komponenten . . . 81

Zusammenfassung 86

Literaturverzei hnis 89

(5)

1.1 Bildungder erfasstenKompositionsstammformen . . . 28

2.1 DasTransitionsdiagramm für einenendli hen Automaten . . . 33

2.2 Endli her Automat

M ₁

^(NEA) ^mit

ε

-Transitionen . . . 37

2.3 Endli her Automat

M ₂

^(NEA) ^ohne

ε

-Transitionen . . . 38

2.4 Determinieru ngsergebnis

M ₃

^(DEA) ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ³⁸

2.5 Minimierungsergebnis

M ₄

^(DEA) ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ³⁹

2.6 DieVereinigung zweier endli her Automaten . . . 40

2.7 DieKonkatenation zweier endli her Automaten . . . 41

2.8 DerKleene-Abs hluss eines endli hen Automaten . . . 42

2.9 Ein einfa her FST . . . 43

2.10 Komposition zweier FST . . . 47

2.11 Ein einfa her FST mit Endausgabefunktio n . . . 49

3.1 Bedeutung undmögli he Reihenfolgeder Tags . . . 55

3.2 Ein vereinfa hterLexikon-FST

T

di . . . 56

3.3 DerLexikon-FSTna h demKleeneabs hlus

(T

di

) ⁺

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁵⁹

3.4 Graphematis he Repräsentationen mögli her Silbenkerne . . . 62

3.5 Regel

A ₁

^für ^Erstsilben^mit ^Silbenkern ^a ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶³

3.6 Regel

A ₂

^für ^Erstsilben^mit ^Silbenkern ^e ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶⁴

3.7 Regel

A ₉

^für ^Erstsilben^mit ^Silbenkern ^aa ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶⁴

3.8 Regel

A ₁₆

^für ^Erstsilben ^mit ^Silbenkern ^eu ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶⁵

3.9 Zusätzli he Tagsna hder Sux-und Auslautanalyse. . . 66

3.10 Regel

B ₁₈

^für ^dieSuxerkennung von -ung . . . 67

3.11 Regel

B ₂₀

^für ^dieAuslauterkennung von -t . . . 67

3.12 NominaleKompositionsstammform ohne Fuge (

KS ₁

⁾ ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶⁹

3.13 NominnaleKompositionsstammform mit Fuge (

KS ₂

⁾ ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁷⁰

3.14 AllgemeineKompositastruktur

(KS) ⁺ · N G

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁷²

3.15 Kompositionsstammformen na h bedeutsamen Tags. . . 74

3.16 Kompositionsstammformen s hwa her Substantive Regel

N K ₂

^. ^. ^. ⁷⁴

3.17 Kompositionsstammformen mit spezis hemSux Regel

N K ₉

^. ^. ⁷⁶

3.18 Adj.und verb. Kompositionsstammformen Regeln

AK

^und

V K

^. ^. ⁷⁷

3.19 LexikalisierteKompositionsstammform . . . 78

(6)

Ein Grundsatz der Computerlinguistik beruht auf der Annahme, dass mens hli he

Spra hproze sse mithilfe des Computers bes hrieben und simuliert werden können.

Zwar ordnet man die Computerlinguistik eher der Spra hwissens haft zu, denno h

beziehtsiealsinterdisziplinä reWissens haftvielfa hMethoden undModelleausder

Informatik,derMathematik,derkognitivenPsy hologieundanderenverwandtenBe-

rei hen.Besonders dasKonzeptder formalen Spra hen undGrammatiken sowie die

damit verbundene Automatentheorie, deren Ursprüngein der Mathematikund der

theoretis hen Informatik anzusetzensind, haben einen bedeutenden Einuss sowohl

auf die Grundlagenfors hung als auf konkrete Anwendungen innerhalb der Compu-

terlinguistik.Spra hli he Vorgänge aufmathematis he Modelle zurü kzuführen und

diese ans hlieÿend auf einem Re hnersystem zu realisieren, ist ein erklärtes Ziel.

Unlösbarverbundenmit den formalenSpra hen undden endli hen Automatensind

Parser-Anwendun gen.GrammatikendienenimAllgemeinenzurGenerierungvonfor-

malenSpra hen,Automatensindin derLage zuerkennen,obeinAusdru kzu einer

bestimmten Spra he oder Spra hklasse gehört und Parser s hlieÿli h liefern Struk-

turbes hreibun gen, auf deren Grundlage zum Beispielsemantis he Interpretationen

mögli h sind.

Ein für diedeuts he Spra he typis hes und au h sehr interessantes Phänomen sind

dieKomposita.Ihnenistzuverdanken,dassDeuts halsdieSpra hemitdenlangen

Wörtern bekannt ist.Gerade dieKomposita stellen ni ht nur bei der mas hinellen

Übersetzungeinebesondere Hürdedar,aber au hfürausländis heDeuts hlernerer-

gebensi hS hwierigkeiten. Diesesinddarinbegründet,dasseine Vielzahlder Kom-

posita,vorallemdieDeterminativkomposita, okkasionale Bildungensindunddaher

au h in keinem Wörterbu h enthalten sein können. Ein deuts her Mutterspra hler

hatindenmeistenFällenkeineProbleme,dieBedeutungeinesKompositumsanhand

derBedeutungenseinerKomponentenunddesVerhältnissesdieserKomponente nzu

einander zuerkennen. Istdiesni ht ohne weiteres mögli h, ist eine Betra htung des

unmittelbar en Kontextes übli herweise ausrei hend für dieBedeutungsers hlie ÿung.

EineÜbersetzungsanwendungwirdmiteinemneuen Kompositumnunganzähnli he

Problemehaben:soferndasangetroeneWortni htin seineminternenLexikonent-

halten ist,weiÿ dasProgramm ni htsmit ihm anzufangen. Eine Bestandsaufnahme

aller potentiellen Komposita ist unmögli h, da estheoretis h unendli h viele Kom-

posita gibt und jedes dieser Komposita erneut als Glied einer anderen Zusammen-

setzungauftau hen kann.DieseEigens haftderKompositama hteineStrukturana-

(7)

lysenotwendig, diedie Zusammensetzungen auf seine unmittelbar en Konstituenten

zurü kführt, und zwar soweit, dass diese Konstituenten in einem mehr oder weni-

ger kompletten Lexikon aufgenommen werden können. Aufgrund ihrer besonderen

Eigens haften sind Komposita im Spra hsystem zwis hen Lexik, Morphologie und

Syntax anzusiedeln. Eine zuverlässige Strukturanalyse müsste allen Systemebenen

Re hnung tragenund dabeiau hsemantis he wie au h pragmatis he Informationen

berü ksi htigen.

Diesem Anspru h kann man nur s hwer gere ht werden, weshalb das Modell auf

eineOberä hen analyse(ShallowParse)bes hränktbleibt.Demna histdasParsing

vonKomposita keintrivialesProblem, kann aber aufeineProblemstellung reduziert

werden, die einges hränkt genug ist, um für eine Formalisierung mit Finite-State-

Modellen geeignet zusein.

ZieldieserArbeitistes,einformales,mathematis hbegründetesFinite-State-Modell

für deuts he einfa h undmehrfa h zusammengesetzt e Komposita vorzustellen. Mit-

hilfe diesesModellswird glei hzeitig eine auf mehrerenEbenen arbeitende Parsing-

Anwendungbes hrieben,diedur heineImplementation derbes hriebenenAutoma-

ten direkt funktionsfähigwird. Die Arbeitsebenen desParsersbetreendie graphe-

matis he Form des Kompositums und mehrere voranalysierte Zwis henstufen, die

während des letzten Analysevorgangs disambiguiert werden. Der Parser wird eine

Zusammensetzung segmentieren und die gefundenen Segmente mit entspre henden

linguistis hen Informationen annotieren. Bei morphologis h mehrdeutigen Kompo-

sita werden mehrereInterpretationsmögli hkei t en angegeben, soferndie letzteAna-

lysestufe keine Disambiguierung errei hen konnte, wobei eine semantis he Analyse

der erhaltenenStrukturen und diedamit in Verbindungstehende Untersu hungder

Idiomatisierung ni ht zum Umfang der Arbeit gehören. Grundlage aller Formalis-

men bleiben dabei immer die linguistis hen Eigens haften und Besonderheiten der

Komposita vor allemauf morphologis her Ebene.

(8)

Vorbemerkungen zur

Komposita-Analyse

Komposita sind der linguistis he Gegenstand dieser Arbeit. Im Folgenden werden

Wesen, Eigens haften und Struktur der deuts hen Komposita in Kürze dargestellt.

VorgehensweisenbeiderSegmentierungderKompositawerdenbespro hen.Ans hlie-

ÿend ri htet si h das Augenmerk auf die Kompositionsfuge, da das Finite-State-

Modell au h das Vorkommen der Fugenelement e und deren Varianten bes hreiben

wird. Die herausgearbeit eten Regelmäÿigkeiten werdenspäter zur Disambiguierung

von gefundenen Komposita-Seg ment ier ungen verwendet. Au h werden andere Phä-

nomeneanderKompositionsfugewieTilgungundorthogras heBesonderheitenwie

der Dur hkopplungsbindestri h berü ksi htigt.

1.1 Das Finite-State-Modell und Wortbildungsmodelle

In diesemAbs hnitt wird versu ht, eine Brü ke zwis hen den formalen Mittelnaus

Kapitel2unddemlinguistis henUntersu hungsgegenstand dieserArbeit, denKom-

posita, zus hlagen. Es werdenParallelen undUnters hiede desentwi kelten Finite-

State-Modellszu klassis hen Wortbildungsmodellen aufgezeigt. Weiterhin wird dar-

gelegt,warumbewusstaufdieEinbeziehung bestimmterAspekteindasModellver-

zi htetwurde und teilweise verzi htetwerdenmusste.

Komposita sind Wortbildungsprodukte. Dem Aufbau von Wortbildungsprodukten

liegen bestimmte Wortbildungsmodelle zugrunde. Ein Wortbildungsmodell ist ein

morphologis h-syntaktis h und lexikalis h-semantis h bestimmtes Strukturs hema,

na hdemReihenglei h strukturierterWortbildungsproduktemit unters hiedli h em

lexikalis hemMaterialerzeugtwerdenkönnen ( Fleis herund Barz1995,S.53).

(9)

DieHerausarbeitung der Gemeinsamkeiten alleruntersu hten Elemente ist dasWe-

seneinerModellierung,wobeider AbstraktionsgradeinesModellsvondergewählten

Bes hreibungsgenauigkeitabhängt (vgl.Fleis her und Barz1995, S. 53).

IndervorliegendenArbeitwirdeinModellmitmehrerenAbstraktionsgradenerstellt.

Während bei der morphologis hen Analyse einerseits direkt von der lexikalis hen

Oberä he ausgegangen wird, also kaum abstrahiert wird, werden bei der Model-

lierung der Distributionsregeln der Kompositakonstituent en überwiegend abstrakte

Kategorien verwendet.

Ein Modell, dasauf Transdu ern beruht, kann sowohlzu Analysezwe ken, als au h

zur Generierung von Strukturengenutzt werden.

1

Ähnli h wie beiFleis her und

Barz,diefeststellen,dassihreModellbes hreibu ngni ht ausrei ht,umalsvollstän-

diger generativer Me hanismus zu fungieren, der nur die Bildung ri htiger Wort-

bildungsprodukte zulässt, erhebt au h das in dieser Arbeit vorgestellte Modell der

Kompositani htdenAnspru haufVollständigkeit.WährendFleis herundBarz

dieAusdrü kegenerativ undMe hanismus no hinAnführungszei hensetzen,ist

das in der Arbeit bes hriebene Finite-State-Modell im wörtli hen Sinne generativ,

daseineImplementierung amRe hnerwüns henswertist,wasausdemModellletzt-

endli heinen Parser oder Generator ma ht.

Ein Wortbildungsmodell sollte Angaben über folgende Strukturmerkmale enthalten

(vgl.Fleis her und Barz1995, S. 54):

a) EineMorphem harakteristikderKonstituenten,dasheiÿtInformationen,obes

si hzumBeispielumGrundmorpheme oderGrundmorphemkomplexehandelt.

Im Falle von Grundmorphemen sollten au h Informationen über Wortart und

semantis heKlasse enthalten sein.

b) DieReihenfolge der Konstituenten

) DieWortart undsemantis he Klasse desnalenWortbildungsprodukte s

d) Formativstrukturelle Spezika des Wortbildungsproduktes, wie zum Beispiel

morphophonologis he undgraphis he Charakteristika

e) Satzsyntaktis hesVerhaltendesWortbildungsprodukte s

f) Wortbildungsbede utung

Zu a) Das vorgestellte Finite-State-Modell verfügt über die geforderte Morphem-

harakteristik aufgrund der morphologis hen Informationen, die im Lexikon einem

Lexikoneintragzugeordnetwerden.DerLexikoneintragansi hbeantwortetdieFrage

na hder Morphemklasse,danebendenFugenelement enüberwiegendGrundmorph-

eme und Grundmorphemkomplexe erfasstsind. In der Einführung zu dieser Arbeit

1

Dieskanndur hdieUmkehrungvonTransdu ernoderganzenTransdu erkaskadenerrei htwer-

den(siehe2.2.2).FormalwerdenumgekehrteTransduktionenangenommen,dieeinAnalyseergebnis

aufdieUrsprungsformabbildenkönnen.

(10)

wurde festgestellt, dass semantis he Aspekte ni ht zum Untersu hungsgegenstand

gema ht werden. Insofern bleiben dieAnforderungen in Bezug auf diesemantis hen

Klassen der Konstituenten unberü ksi htigt. Die Wortart hingegen wird na h der

Segmentierung dur hTagging(siehe1.5.1) annotiert.

Zub) EssindgeradeReihenfolgen, dievonFinite-State-Modellenbesondersezient

erfasst werden können. Reguläre Spra hen, die dur h endli he Automaten deniert

werden können, sind entweder links- oder re htsrekursiv, wasdargestellt als Baum-

struktur in einem linearenAbleitungsbaum resultiert.Es sind vor allemdieRegeln,

diedieReihenfolgeder Konstituenten betreen, diein dieserArbeit modelliert wer-

den.

Zu ) Die Wortart von Komposita wird eindeutig dur h die Wortart der letzten

Konstituente bestimmt. Da die Wortarten der Konstituenten erfasst werden, wird

au h die Wortart des nalen Wortbildungsprodukte s berü ksi htigt. Vermeintli he

Sonderfälle der Zusammensetzung, bei denen die Wortart der letzten Konstituente

ni ht der Wortart der Zusammensetzung entspri ht,sind keine Komposita, sondern

na hAuassungdesAutorsDerivate,KonversionenoderInkorporationen(siehe1.4).

Zud) DasModell ist konzipiert für eine omputerlinguistis he Anwendung und be-

s hränktsi haufdieAnalysevons hriftli hvorliegendenDaten.Tatsä hli hmüssen

dieDaten in einer für einen Computer verständli hen Form vorliegen, weshalb hier

von Zei henketten ausgegangen wird. Morphophonologis he Charakteristika bleiben

insofern zwangsläug unberü ksi htigt, wobei die Vors haltung eines Systems, das

akustis he Datenin Zei henketten umwandelt,dur hausrealisierbar ist.

Zue)BisaufdieWortart desWortbildungsprodukteswerdenkeineweiterensyntak-

tis hbedeutungsvollen Merkmale berü ksi htigt. Daswürde ähnli h wie dieseman-

tis heAnalyse dieVerbindungmit weiterenModellenauf vers hiedenenEbenender

Spra he voraussetzen.

Zuf) Die Wortbildungsbede utung wird alssemantis he Gröÿe ni ht behandelt.

Ei hinger(2000, S.9)beruftsi hbeiderBetra htung vonkomplexenWörternauf

dassystematis heWissen einesSpre hersübersyntagmatis he undparadigmati s he

Zusammenhänge, in diedaskomplexeWorteingeordnet werdenkann.

Bei der syntagmatis hen Einbindung unters heidet Ei hinger zwei Ebenen eine

syntagmainterneundeinesyntagmaexterneEbene.AufdersyntagmainternenEbene

wird dieStrukturder komplexenWörter bes hrieben. Dabei kann essi hum Regu-

laritäten derVerkettungvon Bestandteilenhandelnsowieum eineModellierungder

Beziehungen innerhalb der Wörter. Diese Beziehungen können bereits ausrei hen,

umeinigeHypothesenzuderBedeutungdergesamtenKonstruktionanzustellen.Die

zweite,syntagmaexterneEbene umfasstdieEinbettungdeskomplexenWortesin ei-

ne syntagmatis h gröÿere Einheit, wie einen Satz oder allgemeiner einen Text. Die

syntaktis he Umgebung sowie ein weiterer Kontext geben Hinweise zur Bedeutung.

(11)

Ein Beispiel ist die Paraphrasieru ng komplexer Wörter, in der die syntagmatis hen

Beziehungen ausformuliert werden.

Dur h dieLexikalisierungvonTeilkonstituenten ergeben si h mögli he paradigmati -

s heBeziehungen,dieebenfallsaufeinersyntagmainternenundeinersyntagmaexter-

nen Ebene betra htet werdenkönnen. Im ersten Fall sindim Lexikondes Spre hers

bereitsähnli heBildungenbekannt,diebeiderInterpretationdeskomplexenWortes

herangezogenwerdenkönnen.No habstrakteristEi hingersVerständnisvoneiner

syntagmaexternen Paradigmat ik, bei der er von einer Einbettung in Wirkli hkeits-

bezüge, indasWissendesSpre hers über dieZusammenhängezwis henden Dingen

ausgeht.

Die syntagmaexternen Aspekte der bes hriebenen Syntagmatik und Paradigma tik

bleiben in dieser Arbeit zwangsweise ausgespart. Syntagmainterne Aspekte werden

jedo h passend zu beiden Si htweisen erfasst. Beziehungen zwis hen Konstituenten

werden sowohl mithilfe von allgemeingültigen Regeln (Syntagmatik) als au h im

Zusammenhangmit bestimmten konkretenGliedern (Paradigm at ik) modelliert.

Im Fall der Komposita verweisen Fleis her und Barz auf einige Fixpunkte, de-

ren Modellierung aufgrund der genannten Eins hränkungen s hwierig ist. Genannt

werdendabeidiefolgenden Aspekte ( Fleis her und Barz1995, S. 93):

a) Binaritätder UK-Struktur

b) Theoretis h unbegrenzte Komplexität der UK

) Determinatives oder kopulativesVerhältnis der UK

d) Wortart harakteristik der ersten UK

e) Appellativis her, onymis her oder phraseologis her Charakterder ersten UK

Zu a) Die Binarität der Komposita-Struktur ist ohne die semantis he Komponente

ni hteindeutigerfassbar. DasvorgestellteModellverfügt, wie bereitserwähnt,über

keinesemantis hen Datender Konstituenten undkanndementspre hend au h keine

semantis henRegeln beinhalten. Bei einem mehrfa hzusammengesetzten Komposi-

tumkönnen mehrere Strukturtypen zugrundeliegen (vgl. Dudenredaktion 1998,

S. 482) und ohne semantis he Kriterien kann in vielen Fällen nur s hwerli h zwi-

s hen Links- und Re htsverzweigung oder Mis hformen unters hieden werden. Das

Kompositum Armbanduhr ist ein Beispiel für eine linksverzweigende Struktur, die

Konstituenteng renzeverläuftzwis henArmband und Uhr,wobeidieerste Konstitu-

enteweiterhinunterglieder twerdenkann.FüreinenRe hnerohnesemantis heInfor-

mationen gibt esallerdings keinerlei Anhaltspunkte, warum esz. B. keine Banduhr

gebensollte.Es wird alsokeinehierar his heStrukturanalyseunternomme n, dadie-

se ohnehin alle mögli hen Verzweigungsstrukturen zurü kgeben müsste und damit

genausowenigaussagekräftig wäre wie der Mangelan sol hen Strukturen.Bei z.B.

viergliedrigen Komposita gäbe esfünf mögli he Baumstrukturen, beifünfgliedrigen

(12)

Zub)DiesemAspektwirdRe hnunggetragen.Zwar bleibtdieModellierungaufdie

Oberä hederKompositabes hränkt,dafüristbeiderAnalysekeinemaximaleZahl

anKonstituentengegeben.Esisteineder Haupteigens haftenformalerSpra hen im

Allgemeinenund endli her AutomatenimSpeziellen,dasssie mitendli hen Mitteln

unendli he Mengen undStrukturen bes hreiben können.

Zu )Au hhieristeineKlassizierungohnesemantis heEinheitkaumzurealisieren,

da si hDeterminativ- und Kopulativkomposita aufgrund ihrer rein morphemis hen

Strukturni htunters heiden.BeidesindZusammensetzungenvonGrundmorphemen

oderGrundmorphemkon struktionenundbeibeidenkönnenFugenelementeauftreten.

Au hkönnen dieKonstituenten vonKopulativkomposita ander StellevonDetermi-

nante oder Basis einesDeterminativkompositu ms auftau hen und umgekehrt.

Zud)DieWortartendergefundenenKomponente nwerdenerfasst,dieswurdebereits

erwähnt. Bei mehrfa hen Zusammensetzung en kann es jedo h s hwierig werden zu

bestimmen, wann genau dieerste Konstituente endetund diezweitebeginnt.

Zu e) Dieser Aspekt ist abhängig von den Daten, die im Lexikon gespei hert sind.

Esist ansi hkeinProblem, eineeigeneKategorie fürEigennamenanzunehmen und

dieseimModellzuberü ksi htigen.EineVerbindungmitdemDur hkopplungsbind e-

stri hkönnte ebenfallsganzeinfa himplementiert werden.Au hPhrasen könnenso

indasLexikonaufgenommenwerden.EswirdindieserArbeitjedo hauspraktis hen

Gründen daraufverzi htet.

Die Anforderungen an ein Wortbildungsmodell, die von Fleis her und Barz

(1995) gestellt werden, umfassen Aspekte mehrerer Ebenen des Spra hsystems. Es

sollenmorphologis he,syntaktis he,semantis heundau hpragmatis heAspektebe-

rü ksi htigt werden. Diesen Kriterien wird dasvorgestellte Finite-State-Modell nur

bedingt gere ht (siehe oben die Ausführungen zu Syntagmatik und Paradigma tik).

DieVerbindungmitModellen,dieRegelmäÿigkeitenaufvers hiedenenSpra hebenen

bes hreiben, wäre nötig, um alle Bedürfnissezu erfüllen. Stattdessen wird vielmehr

einZwis henergeb nis geliefert, das alsGrundlage zu weiteren Analysen in gröÿeren

Kontextenverwendetwerden kann.

1.2 Zum Wesen der Komposita

Unter Zusammensetzungen (Komposita) verstehen wir Wörter, die ohne zusätzli-

heAbleitungsmittel auszweioder mehrerenselbstständig vorkommenden Wörtern

gebildetsind. Dabei stellt der (isolierbare)erste Bestandteil vonden wenigenKo-

pulativkomposita und Verglei hskomposita des Typus Himmelskuppel abgesehen

das Bestimmungsglied dar, der zweite dasGrundwort (die Basis), das die Wortart

der ganzenZusammensetzung festlegt ( Dudenredaktion 1998, S. 432).

Anderegebräu hli heBezei hnunge nfürBestimmungsgliedundGrundwortsindent-

(13)

IndergenerativenGrammatikwirdeineandereTerminologieverwendet.Sowirddas

GrundwortalsKopfbezei hnetunddasBestimmungsworteinfa halsNi ht-Kopf.Als

Kopfbezei hnet manimAllgemeinen deneinfa herenTeil eineskomplexenGebildes

X, der die grammatis hen Eigens haften von X bestimmt (vgl. Sternefeld 2004,

S. 5).

DerWortbildungsprozess,derzuderEntstehungvonKompositaführt,heiÿtKompo-

sition.Ei hinger(2000, S.71) bezei hnet dieKomposition alsviellei ht zentralste

Artder Wortbildung.

Beide Bestandteile sind in der Regel ebenfalls wortfähig und innerhalb des Kom-

positums ni ht umstellbar (auÿer bei den wenigen Kopulativkomposita) , da auÿer

der Wortart au h diesemantis heKlasse dur h dasGrundwort bestimmt wird (vgl.

Dudenredaktion 1998, S. 432). Deuts he Komposita werden anders als z. B. in

der englis hen Spra he traditionell zusammenges hrieben, was eine Konstituenten-

analysezusätzli h ers hwert.

Die beiden UK 2

können entweder in einer Beziehung der Unter- bzw. Überord-

nung stehen (Subordination), oder sie können glei hgeordnet sein (Koordination).

Im ersten Fall handelt es si h um Determinativkomposita, im zweiten Fall um Ko-

pulativkomposita ( Fleis her und Barz1995, S. 45).

Laut Dudenredaktion(1998, S. 481)spri ht manvonKopulativkomposita,wenn

beideGliederdesKompositumsderglei henBezei hnungsklasseangehören,einander

glei hgeord net sind und wenn die Reihenfolge der Glieder theoretis h vertaus hbar

ist.

DieMögli hkeit, Kopulativkomposita zu bilden, die von der Syntax mit ihren vie-

len Kopulativkonstruktionen her eigentli h sehr nahe liegt, wird im Deuts hen we-

niggenutzt (0,4%; ohne dieNamensverbindungen). Die Bildungensind gröÿtenteils

dasErgebnis einer sehr bewussten Spra hprägung Einzelner. Inder Gemeinspra he

herrs ht eindeutig die Zusammensetzung vom Typ des Determinativkompositu ms

vor ( Dudenredaktion 1998,S. 481).

Determinativkomposita werden von der Dudenredaktion (1998, S. 482)au h als

Haupt-undGrundtypderSubstantivzusammensetzungenbezei hnet.Im Gegensatz

zumKopulativkompositum führteine Verstellungder Glieder zu einer Bedeutungs-

veränderung. Im Unters hiedzu den Kopulativkomposita, diefast immer aus zwei

Lexemenbestehen,tretenbeiDeterminativkompositahäugau hZusammensetzun-

gen alsGrund- oder Bestimmungswörter auf ( Dudenredaktion 1998,S. 482).

VorallembeimSubstantivist dasDeterminativkompositum amhäugsten.Eswird

sogar angezweifelt, ob die im Verglei h so seltenen Kopulativkomposita überhaupt

in stabiler Formexistieren ( Ei hinger 2000,S. 117).

2

UK = Unmittelbare Konstituenten: die beiden Konstituenten, aus denen eine Konstruktion

unmittelbargebildet istund in diesie si h aufder nä hstniedrigeren Ebene zerlegen lässt. (vgl.

(14)

Andersalsbeisyntaktis hen Fügungenund ihren Konstituenten werdenBeziehun-

genzwis hendenKompositionsglie dernni htdur hFlexiveangezeigt ( Glü k2000,

S. 361). Es ndet also übli herweise keine innere Flexion statt, zu einigen wenigen

Ausnahmenexistieren äquivalente Formen ohne innere Flexion.

1.3 Komposita na h Wortart des Grundwortes

AndieserStelle werdendieKomposita na h der Wortart desGrundwortesbzw. des

Zweitgliedes eingeteilt. Fast alle Wortartenbilden Komposita, an dieser Stelle wer-

den jedo h nur die Substantive, Adjektive und Verben bespro hen. Bei den übrigen

Wortarten sind die Komposita überwiegend lexikalisiert und oftmals nur s hwierig

von Zusammenrü kungen zu unters heiden.

EineandereBetra htungsweisederKomposita,diedasErstglied indenVordergrund

stellt, wird in Kapitel 1.6 angewendet. Den Stammparad igmen werden Kompositi-

onsparadigmen zur Seite gestellt. So wird neben der Flexionsstammform und der

Derivationsstammform au heine Kompositionsstammform angenomme n.

1.3.1 Nominale Komposita

Substantivis he Komposita sind unter Verwendung von Einheiten aller Wortarten

als Erstglied bildbar; au h Adverbien, Präpositionen, Konjunktionen und sonstige

Partikeln können dabeiVerwendung nden.Stark ausgeprägt ist dieDeterminativ-

kompositionauszweisubstantivis henUK,währenddiekompositionelleVerbindung

vonUKbeimAdjektivundno hmehrbeimVerbwenigerentwi keltist.Beträ htli h

stärker alsbei den anderen Wortarten ist au hdie polymorphemis he Komposition

(mitvier undmehr Grundmorphemen) vertreten ( Fleis her und Barz 1995,S.

84).

Na h der Klassizierung aufgrund der Wortart des Zweitgliede s können die Kom-

posita na h der Wortart des Erstgliedes subklassiziert werden. Hier werden einige

besonders häuge Typen kurzvorgestellt.

•

^Der^TypSubstantiv+Substanti v:Laut Dudenredaktion(1998, S.483)stellen Bildungen desTyps Substantiv+Substanti v vier Fünftel aller Substantiv-

komposita dar.Beispiele: Gartentor,Kinderges hrei,Armbanduhr

Hierbei können beide unmittelbaren Konstituenten sowohlSimplizia als au h

komplexe Substantive sein.

•

^Der ^Typ Adjektiv(Partizip)+Su bstant iv: Der Anteil dieser Substantivzusam- mensetzungen liegtbei6%. Das Bestimmungswortwird im Allgemeinen ohne

Fugenelement mitdemSubstantivverbunden.Eskommenau hZusammenset-

(15)

zungen mit Superlativformen als Erstglied vor. Beispiele: Kleinkind, Hö hst-

preis,Gebrau htwagen

•

^Der ^Typ Verb+Substantiv: Der Anteil dieses Strukturtyps beträgt je na h Textart510%.Esistuntersyn hronerBetra htungsweiseni htimmermögli h

einverbalesErstglied von einem substantivis henVerbalabstraktum zuunter-

s heiden. In sol hen Fällen sind beide Interpretatione n zutreend. Beispiele:

S hreibmas hine,Mis hgetränk, Lebewesen

•

^Der ^Typ Adverb/Partikel/Präpositi on+Substant iv: Bei diesem Strukturtyp werden Zusammensetzungen mit exionslosen Wörtern als Erstglied zusam-

mengefasst.BesondersZusammensetzungenmitPräpositionensindhäug.Bei-

spiele: Vorstadt, Nebenzimmer ,Unterangebot,Sofortprogramm

AuÿerdenvorgestelltenStrukturtypentretenau hweitereStrukturenalsErstglieder

auf,die ni ht einfa h als Wortartenklassiziert werdenkönnen.Unter Verwendung

desDur hkopplungsbindestri hs könnenEigennamen, Wortgruppen undau hganze

Sätzeals Erstglied verwendetwerden (vgl.Fleis her und Barz1995, S. 122).

1.3.2 Adjektivis he Komposita

Ähnli hwiebeiSubstantivensindbeiadjektivis henKompositaprinzipiellalleWort-

artenalsErstglied mögli h, do hnebenSubstantiven,AdjektivenundVerben treten

andere Wortarten kaum auf. Kopulativkomposita sind bei Adjektivzusammenset-

zungen häuger als bei Substantiven (vgl. Fleis her und Barz 1995, S. 225).

Komposita mit partizipiale m Zweitglied werdenlaut Fleis her und Barz (1995,

S.241)ebenfallszuderGruppeder Adjektivzusammensetzungengezählt.Au hhier

können vers hiedeneStrukturtypen bes hrieben werden:

•

^Der^TypSubstantiv+Adjektv: Adjektivkomposita mit substantivis hemErst- glied sinddur hweg Determinativkomposita. Beispiele: knietief, ofenwarm,al-

terss hwa h

•

^Der ^Typ Adjektiv+Adjektiv: Hier kommen sowohl Determinativkomposita (Beispiele: s hwerkrank, dünnüssig) als au h Kopulativkomposita (Beispiele:

taubblind, süÿsauer) vor.

•

^Der^TypVerb+Adjektiv:LautFleis herund Barz(1995,S.247)istdiead- jektivis heKompositionmit verbalemErstglied im stetigen Ausbaubegrien.

Besonders in te hnis hen Texten treten sol he Konstruktionen auf. Beispiele:

tragfähig, röstfris h, triefnass

(16)

1.3.3 Verbale Komposita

DieKompositionistbeiderBildungderVerbenwenigerrelevantalsbeiSubstantiven

undAdjektiven.Verbzusammensetzungensindstetszweigliedrigundtrennbar,wobei

sie im Innitiv, in der Partizipialform und bei der Endstellung im Nebensatz ni ht

getrennt ers heinen (vgl. Dudenredaktion 1998, S. 448). Man unters heidet au-

ÿerdemdiesogenannten Pseudokompositavondene htenVerbzusammensetzungen.

Optis h handelt essi h um Komposita, beieiner dia hronis hen Betra htungsweise

ergibt si hjedo h, dassdiese Pseudokomposita eigentli h Ableitungen ausSubstan-

tiven darstellen, z. B. wehklagen aus Wehklage. Diese Pseudokomposita sind ni ht

trennbar (vgl. Dudenredaktion 1998,S. 449).

•

^Der^Typ Substantiv+Verb: Nebenden oben genannten Pseudokomposita gibt esau hvereinzelteVerbindungenausSubstantivundVerbna hArtderZusam-

menrü kungen (vgl. Dudenredaktion 1998, S. 449). Beispiele: standhalten,

teilnehmen

Verben,die dur h ein substantivis hes Erstglied näher bestimmt werden, tre-

ten in te hnis hen Texten auf.Sol he Konstruktionen sind jedo h selten (vgl.

Dudenredaktion 1998,S. 450). Beispiele:punkts hweiÿen, feuerverzinken

•

^Der^TypAdjektiv+Verb:VerbindungenmitAdjektivenalsErstgliedsindhäu- geralsverbale ZusammensetzungenmitSubstantivenoder Verben.Siewerden

traditionellzusammenges hrieben(vgl.Dudenredaktion1998, S.450).Bei-

spiele: freis haufeln,heiÿlaufen, ho hstapeln

•

^Der ^Typ ^Verb+Verb: ^Bei ^den ^Verben ^sind ^die ^sonst ^so ^häugen ^Zusammen-

setzungen von Wörtern der glei hen Wortart kaum übli h. Allenfalls in der

expressionistis hen Di htung und in te hnis hen Texten nden si h Beispiele.

Die Einteilung in Kopulativ- und Determinativkomposita ist hier ni ht ein-

fa h.ImAllgemeinensinddielyris henFormeneherkopulativ,diete hnis hen

Ausdrü keeherdeterminativ(vgl.Dudenredaktion1998,S.450).Beispiele:

grinsheu heln , spritzlöten

Auÿerdem treten no h Zusammensetzungen von Innitiven auf, die übli her-

weiseaufdieZweitgliede rbleiben ,lassen undlernenbes hränktsind(vgl.Flei-

s herundBarz1995,S.296).DieseFormenwerdenna hderRe hts hreibre-

formgetrennt ges hrieben,ehemals war dieZusammens hreib ung übli h.

Bei den verbalen Komposita ma ht die Getrennts hreibung der niten Formen es

nötig, si hallein aufdie inniten zusammen ges hriebenen Formen zu bes hränken.

Finite Formen kommen im Textuss vor, wo deren Konstituenten mehrere Wörter

weitvoneinanderentferntpositioniertseinkönnen.DieErkennungsol herElemente

istau h vomStandpunkt der Syntax auskeintrivialesProblem.

(17)

1.4 Sonderfälle

WieesoftbeiderUntersu hungspra hli herPhänomen ederFallist,gibtesau him

Berei hderWortbildungundspeziellbeiderKompositionAusnahmen,diesi hni ht

denherausgearbeit etenallgemeinenRegelnunterwerfenwollen.Teilweiseistesni ht

einfa h eindeutige Bes hreibungen anzugeben, da vers hiedene Quellen ni ht selten

vers hiedener Ansi ht sind, wie bestimmte Ers heinunge n zu interpretieren sind.

EinigedieserAusnahmenwerdenandieserStelleinKürzebespro hen.DiePossessiv-

komposita heben si h strukturell ni ht von den normalen Determinativkomposta

ab,entspre henaberni htderensemantis henEigens haften.BeiZusammenrü kun-

genundZusammenbildunghingegen handeltessi hum Grenzfälleder Komposition

mit anderenWortbildungsarten.

1.4.1 Possessivkomposita

Possessivkomposita sind na h Glü k (2000, S. 539) exozentris he Komposita, die

zwar wortsyntaktis h dem Determinativkompositum entspre hen, semantis h aber

keine Untergruppe der im Grundwort bezei hneten Einheit bilden, so ist z. B. ein

LangbeinkeinlangesBein,sonderneinePersonmitlangenBeinen.Possessivkomposi-

tatretenhauptsä hli halsPersonen-,Tier-undPanzenbezei hnungenaufundsind

nur no hingeringemMaÿe motiviert.Mankannbeiden Possessivkompositaanneh-

men, dass ihr Bestand lexikalisiert ist und okkasionale Bildung eher selten, obwohl

prinzipiell mögli h sind. Mehr zur Handhabung lexikalisierter Zusammensetzungen

unter 1.5.1.

1.4.2 Zusammenbildungen

Laut Glü k (2000, S. 812)handeltessi hbeiden Zusammenbildungen um Grenz-

fällezwis henAbleitungundKomposition,beidenendieWortbildungstruktur ni ht

eindeutigist. Sokann z.B. Autofahrer als Zusammensetzunggesehen werden( auto

+ fahrer)oder als Ableitung( autofahren+ -er).

Erben (2000, S. 35) bezei hnet Zusammenbildungen als besondere Art der Ablei-

tung,woeineWortgruppealsBasiseinersuxalenAbleitungdient.Ein Komposita-

Charakterwird ausges hlossen.

VonInkorporation dagegenspri ht Ei hinger(2000,S. 136)und meint damit eine

allmähli he Univerbierungvon Elementen, diein der syntagmatis henAbfolge eines

Satzesnebeneinander stehen.DamitgrenztEi hingerdieZusammenbildungenvon

den Komposita ab, da das vermeintli he Grundwort einer Zusammenbildung ni ht

als eigenständiges Lexem auftritt. Vielmehr wird eine Art substantivis hes Sux

(18)

angenomme n. Bei Adjektiven ist die Argumentation ähnli h, au h wenn in diesem

Fall dieInterpretation alse htesKompositum häugermögli h ist.

FürdieZwe kedieserArbeitistdieSi htweisevonEi hingerdienützli hste.Sofern

dieseuneigenständig enSubstantiv-SuxekeinenLexem harakterhaben,werdensie

imLexikonunddamitbeiderSegmentierungni htberü ksi htigt(siehe1.5.1).Somit

werdeneventuelle Zusammenbildungen au hni ht fäls hli h alsKomposita erkannt.

Ist ein Sux im oben genannten Sinne denno h im Lexikon enthalten, handelt es

si h um ein homonymes Lexem, womit eine Interpretation als Kompositum wieder

legitimist.

1.4.3 Zusammenrü kungen

Als Zusammenrü kungen bezei hnet Erben (2000, S. 34) einen Sonderfall der Zu-

sammensetzung, wo eine syntaktis he Gruppe unter Beibehaltung der Wortfolge

undeventuellerexivis herRelationsmorphemezueinemWortbzw.einemKompo-

sitionsgliedeinesneuenWorteszusammengerü kt wird,z.B.Brave-Mäd h en-Image

alsKompositum ausZusammenrü kungund Substantiv.

Ei hinger (2000, S. 31) würde Formen wie z. B. Vergiÿmeinni ht am liebsten in

den Berei h der Konversion verbannen, sieht sie aber au h ähnli h wie die Zusam-

menbildungen im Umfeld der Inkorporation.Au h Fleis her und Barz (1995,S.

213)argumentier en ähnli h beiSatz- undWortgruppen-Konversionen.

Das obige Beispiel Brave-Mäd h en-Image und au h Graue-Maus-Dasein sind bei

Fleis her und Barz Komposita mit einem Erstglied, das aus einer Wortgruppe

odereinemganzenSatzbesteht,dieBezei hnungZusammenrü kun g wirdhierni ht

gebrau ht.

ImModellmüssensol heBildungenunberü ksi htigtbleiben,dadieErkennungdie-

serFormen alsKompositionsglie d eine satzsyntaktis he Analysenötig ma hen wür-

de. S hlieÿli h können ganze, sogar komplexe Sätze als Zusammenrü kung en vor-

kommen. Die Fälle von Zusammenrü kungen, die als Konversionen erklärt werden

können,entfallenohnehin ausdemKompositionss hema .

1.5 Komposita-Segmentierung und Segment-Tagging

Spra hli he Ausdrü ke,glei hgültig unter wel hem Gesi htspunktman siebetra h-

ten will, sind ni ht als Mengen diskreter Einheiten gegeben, sondern als Kontinua.

Fürvielespra hpraktis he undspra hwissens haftli heManipulationen istesjedo h

sinnvoll,dieKontinuainMengendiskreterEinheiten,nämli hinFolgenvonSegmen-

tenaufzulösen.DasVerfahreneinersol henAuösungheiÿtSegmentieru ng ( Glü k

2000,S. 616).

(19)

Deuts he Komposita können trotz ihrer komplexen Struktur alsParadebei spiele für

dieerwähntenKontinuaherhalten.ObwohlsieausmehrerenWörternbestehen,sind

die Grenzen zwis hen den Bestandteilen dur h die Zusammens hreib ung übli her-

weise ni ht markiert. Ein mens hli her Spre her führt ebenfalls eine Segmentierung

dur h, soferndie gesamte Strukturni ht bereits lexikalisiert ist.

Eng mit dem Vorgang der Segmentierung ist das linguistis he Tagging verbunden.

Tagging im weiteren Sinne ist eine Bezei hnung für eine in der Regel automati-

s he Annotation von Spra hdaten . Unter Tagging im engeren Sinne wird speziell

die Annotation von Wortformen in einem laufenden Text mit Wortartenkategorien

verstanden. (vgl.Glü k 2000, S. 720)

Taggingin Verbindung mitderSegmentierungvonKompostiabedeutetdieAnnota-

tionderidentiziert enSegmentemitgrammatis henDaten,dieimLexikonenthalten

sind.

Im Folgenden werden vor allemdielinguistis henGrundannahme n bes hrieben,die

mit der Segmentierung und dem ans hlieÿenden Tagging verbunden sind. Wie die

Vorgänge im Modell implementiert werden, wird in Kapitel 3 bespro hen. Wei-

terhin wird an dieser Stelle die zentrale Rolle des Lexikons für die erfolgrei hen

Segmentierungs-und Taggingproz esse dargelegt.

1.5.1 Denition des Segmentbegries

WillmannuneineSegmentieru ngeinesKompositumsdur hführen,musszuerstfest-

gelegt werden, wel hen Charakter die gesu hten Segmente haben sollen. Bei mor-

phologis hen Konstituentenanalysen werden Wortbildungsprodukte auf Morpheme

zurü kgeführt, wobeiGrundmorpheme alsau h reineWortbildungsmorp heme (Prä-

xe, Inxe, Suxe) bestimmt werden. Für den Zwe k dieser Arbeit ist eine der-

art weitgehende Analyse unnötig, wenn ni ht sogar kontraproduktiv, da es s hon

s hwierig genug ist, aufgrund der Kompositionsglie der die Gesamtbedeutung eines

Kompositums zuers hlieÿen.EinetiefereAnalyse mussni htunbedingt einehöhere

Dur hsi htigkeitzur Folgehaben.

Bei Komposita können die beiden Kompositionsglie der, wie bereits erwähnt wurde,

entwederausSimpliziaoderwiederum komplexenWortbildungsprodukten bestehen,

die sowohl Ableitungen und Konversionsergebnisse (vgl. Ei hinger 2000, S. 116)

alsau hZusammensetzungenseinkönnen.TrotzdieservielfältigenMögli hkeitenist

allen Kompositionsglie dern der Wort harakter gemeinsam.

NimmtmannundasWortalsSegmentan,isteinKompositionsglie d,dasni htselbst

auseinem Kompositum besteht,ni htweiteranalysierbar.Die Segmentierungendet

hier. Handelt essi h beidemKompositionsglie dum einweiteres Kompositum, kön-

nenwiederzweiWörteridentiziertwerden.DieserProzesswirdsolangewiederholt,

biskeine weiterenSegmentieru ngss hritte mehrdur hgeführt werden können.

(20)

Es stellt si h allerdingsdie Frage, ob eine sol he Analyse ni ht immerno h zu weit

geht.Bei motivierten und dur hsi htigen Konstruktionen ist eine genauere Analyse

si her sinnvoll, mit zunehmender Idiomatisierung nimmt der Nutzen jedo h ab, da

dieBedeutung gar ni ht oder kaumausden Bedeutungender Gliedergefolgert wer-

den kann.Dur h Idiomatisierung entsteht dieNotwendigkeit, komplexe Ausdrü ke

ins Lexikon einer Spra he aufzunehmen ( Glü k 2000, S. 285). Ist eine Zusam-

mensetzung erst einmal lexikalisiert, kann man si h die Konstituentenanalyse, die

ja letztendli h der Bedeutungsers hlie ÿung dienen soll,sparen, denn dieBedeutung

kannin diesem Falleinfa h na hges hlagen werden(vgl. Ei hinger2000,S. 10).

IndieserArbeit wird alsoeineKomposita-Segment ierung vorges hlagen, diesi han

der OppositiondesBegrispaareslexikalisiert/ni ht-lexikalisie r torientiert. Einähn-

li hesVorgehenwird au hbeiRa kow et al.(1992, S. 2) bes hrieben.Die weite-

re Segmentieru ng eines bereits identiziert en Segmentes kann abgebro hen werden,

wenn dasSegment trotz seinerweiterhin komplexen Strukturlexikalisiertist.Alter-

nativdazukanndieSegmentieru ngau hfortgesetztwerden.Dasowohlderkomplexe

Ausdru kalsau hdessenSegmenteimLexikonenthaltensind,werdenindiesemFall

einfa hbeideInterpretationenwiedergegeben.MankanndieseInterpretatione ndann

alsstrukturelle Mehrdeutigkeiten betra hten (siehe1.5.3).

Nun muss no h geklärt werden, wie die Lexikalisierung eines komplexen Ausdru ks

festgestelltwerdenkann.ImFalleeinesmens hli henSpre hersistdieseinfa h:kennt

erdieBedeutungeineskomplexenAusdru ks,ohnedasserdessenKomponentenana-

lysierenmuss, ist dieserAusdru klexikalisiert. Für dasin dieserArbeit entwi kelte

Finite-State-Modell kann ähnli h verfahren werden. Ist einkomplexer Ausdru kals

Ganzesim Lexikon desModells gespei hert, gilt dieserAusdru kals lexikalisiert.

Dieskann manaufalle Wörter erweitern. Ein Wortist lexikalisiert bzw. einLexem,

wennesimLexikonenthaltenist.AlsReferenz-LexikondientdasimModellintegrier-

te Lexikon.Umgekehrt wird ein Wort, dasni ht im Lexikonenthalten ist,markiert

mit derEigens haft ni ht-lexikalisiert.In diesemFall wird eineweitereSegmentie-

rung versu ht, wie sie oben bes hrieben wurde. Hinzu kommt no h der Fall, dass

einkomplexer Ausdru kni htlexikalisiertistundau hdieSegmentieru ngkeinewei-

teren Segmente im Lexikon nden kann.

3

In diesem Fall ist die Segmentieru ng des

komplexen Ausdru kesges heitert. Ein Segment wird nur als sol heserkannt,wenn

eslexikalisiert ist.

Daraus ergibt si h nebenbei au h eineeinfa he Denition vonOkkasionalismen. Ist

ein Wort ni ht lexikalisiert, kann aber gemäÿ des verwendeten Lexikonsin Lexeme

zerlegtwerden,handeltessi humeineerfolgrei hidentiziert eokkasionaleBildung.

Im Falle der Komposita ist eine sol he Segmentde nition jedo h no h ni ht völlig

zufriedenstellend . Sie lässt nämli h die Fugenelement e auÿer a ht. Zwar werden sie

demErstglied der Komposition zugere hnet , können aber kaumals Bestandteile ei-

nesLexemsbetra htetwerden,dasieoftgenugni hteinmaldemFlexionsparadigma

3

(21)

dermitihnenverbundenenLexemeentspre hen(vgl.Erben2000,S.64).Erstre ht

ni ht können sie selbst als eigenständige Lexeme gewertet werden. Im Allgemeinen

werdensieni hteinmalalsMorphemebetra htet, dasieauÿerbeieinigenFällenvon

vermeintli her Pluralmar kierung semantis h leer sind (vgl. Fleis her und Barz

1995, S. 137). Einfa h ignorieren kann man sie jedo h ni ht, da eine omputerge-

stützteSegmentierung an diein einerZei henkette vorhandenen Symbolegebunden

ist.Auÿerdem können sie,wie später no h dargelegt wird, trotz ihrer semantis hen

Leereaufgrund ihrerdistributivenEigens haften vonNutzen sein.

Es ist in diesem Fall am einfa hsten, diese Fugenelement e ebenfalls als mögli he

Segmente zu betra hten. Au h die Fugenelement e sind lexikalisiert in dem Sinne,

dass sieim Lexikon desModellsenthalten sind. EineAufnahme der Fugenelement e

ins Lexikon ist dagegen aus Implementationsgründen sinnvoll, da der Segmentie-

rungsprozessZei henkettenanalysiert unddiese aufgrunddesLexikonsidentiziert .

SowohlLexemealsau hFugenelemente stellen mögli he Segemente darund sindzu

allererst Zei henketten. Erst dur h den Verglei h mit dem Lexikon, der Zei hen für

Zei henvorgenommenwird,kanneineUnters heidungvonLexemundFugenelement

stattnden.

1.5.2 Das Lexikon und linguistis hes Tagging

Mit der Segmentierung allein ist es no h ni ht getan. Die Segmente müssen lin-

guistis h annotiert werden, damit eine weitere Verarbeitung mögli h ist. Während

die Segmentieru ng das Lexikon als Bestandsaufnahme von potentiellen Segmenten

auasst, werden dur h dasTagging die im Lexikon einzelnen Einträgen zugeordne-

ten Informationen den identiziert en Segmenten angefügt. Das Lexikon ist also für

beide Vorgänge, Segmentierung und Tagging, grundlegend. Diesbedeutet, dassdas

Modelllexikon mindestenszweiArten vonDaten enthalten muss:

•

Repräsentationen der einzelnen Lexemeals Zei henketten. Diesesind notwen- dig,umdiegesu hten Segmente überhauptidentizierenzukönnen.DieBu h-

stabenfolgen eines unsegmentierten komplexen Wortes müssen mit den Bu h-

stabenfolgen der Lexikoneinträge vergli hen werden können. Die Art wie die

Gesamtheit der Lexikoneinträge organisiert ist, wird au h als Makrostruktur

desLexikons bezei hnet (vgl. Carstensen et al. 2001, S. 397). Wie genau

das mögli hst ezient mit Hilfe von Finite-State-Mitteln umgesetzt werden

kann, wird später bei der Modellierung des Lexikons ausführli h bespro hen

(siehe3.1.1).

•

Informationen, diedie einzelnen Lexeme linguistis h kategorisieren. Dies sind dieDaten,diedur h dasTagging den Lexemenihre grammatis he Bedeutung

verleihen. So werden in diesem Modell hauptsä hli h Informationen bezügli h

Wortart undFlexionsklasseverwendet. Eswerdenau h wortartspezis he Da-

ten annotiert, wie z. B. Genus beim Substantiv. Man spri ht hier au h von

(22)

der Mikrostruktur eines Lexikons bzw. eines Lexikoneintrags (vgl. Carsten-

sen et al.2001, S. 398). EineMenge von grammatis hen Informationen,die

zu einer Interpretation eines Eintrages gehören, werden au h als Tagsets be-

zei hnet. Einem Eintrag, der lexikalis h mehrdeutig ist, sind mehrere Tagsets

zugeordnet.

DabeideVorgängeabhängigsindvonbestimmten Su hprozessenimLexikon,bietet

si heineparalleleAnwendungvonSegmentieru ngundTaggingan.WirdeinSegment

identiziert ,wird esdirektmit denentspre henden Lexikoninformationenannotiert,

undni hterstna hdemalleSegmentegefundenwordensind.AufdieseWeisewerden

Mehrfa haufrufe derselben Einträge verhindert. Das Ergebnis einer Segmentierung

eines komplexen Wortes mit parallelem Tagging ist eine Menge identiziert er Seg-

mente mit entspre henden grammatis hen Annotationen.

1.5.3 Lexikale und strukturelle Ambiguität

BeiGlü k (2000,S. 37) wird Ambiguität(au h Ambivalenz, Mehrdeutigkeit, Viel-

deutigkeit)unterzweiGesi htspunktendeniert.Laut dererstenAuassungistAm-

biguitäteinegrundlegend eEigens haft der meistenLexeme, Derivations-undFlexi-

onsmorphemeineinerektierendenSpra hewiedemDeuts hen.DieMehrdeutigkeit

derLexemewird inderWortbildungteilsdisambiguiert,teilsvermehrt.Dieselexika-

lis he Ambiguität wird in der europäis hen strukturellenSemantik als Homonymie,

Polysemie und Multisemieuntersu ht.

Die zweite Auassung bezei hnet Ambiguität auf der Ebene der Syntax als Eigen-

s hafteineskomplexenZei hens,aufgrundunters hiedli h erStrukturbes hreibungen

mehrals eineInterpretationzubesitzen. IndiesemSinne unters heiden si hambige

Ausdrü ke von polysemen, wel he als mehrdeutig aufgrund von ni ht-strukturellen

Faktoren verstanden werden. Die in dieser Arbeit als strukturelle Ambiguität be-

zei hnete Art der Ambiguität hat ihren Grund dementspre hend in der Mehrdeu-

tigkeit der grammatis hen Strukturzusammen hänge und Formkennzei hnungen. Da

komplexeZei hen ni ht nur aufsyntaktis her Ebene auftau henundKomposita ein-

deutig komplex sind, kann diese Auassung au h auf die Strukturbes hreibungen

von Komposita angewendetwerden.

WährenddesSegmentieru ngsvorga ngeseinesKompositiumskönnenprinzipiellbeide

Arten von Ambiguität auftreten. Lexikalis he Ambiguität ist gegeben, wenn einem

identiziert em Segment mehrere Einträge im Lexikon entspre hen. Da in dem ver-

wendetenLexikonkeinesemantis henInformationenkodiertsind,handeltessi hhier

immerum Artender Homonymieundni ht der Polysemie.Die Einträgeunters hei-

densi haufgrundeinzelner oder au hmehrerer grammatis her Eigens haften wiez.

B.Genus ( dieKiefer der Kiefer) oder vers hiedenenPluralformen ( Bank : Bänke

Banken), wobei in beiden Fällen unters hiedli h e Flexionsklassen annotiert sind.

Lexikalis heMehrdeutigkeittrittalsobeimTaggingderidentiziert enSegmenteauf.

(23)

Strukturelle Ambiguität kann unabhängig vom Tagging allein dur h die reine Seg-

mentierunggegebensein.KönnenzumBeispielmehrerealternativeZerlegungeneines

Kompositums aufgrund vers hiedener Morphem- oder Segmentgrenzen ausgema ht

werden,müssenbeideSegmentierungenakzeptiertwerden,sofernni htandereKrite-

rienzur Disambiguierungangewendetwerden. Ein Beispielfür eineni ht-eindeutige

SegmentierungistdasKompositumDru kerwartung. Eskannsegmentiertwerdenin

zweivorerstni ht annotierteStrukturen:

(1) dru ker + wartung

(2) dru k + erwartung

Vermutli h istLesart (1)diewahrs heinli here von beiden, denno h kann Lesart(2)

ni hteinfa hignoriert werden,da sie prinzipiellmögli hist. Hinzukommt,dassder

Segmentierungsme hanismus über keine Informationen über die Wahrs heinli hkeit

bestimmter Lesartenverfügt.

No huneindeutig erwirddasErgebnisdesAnalyseprozesses,wennsowohllexikalis he

als au h strukturelle Ambiguität vorliegt. Werden die beiden Segmentieru ngsvor-

s hläge von Dru kerwartung entspre hend annotiert, ergeben si h weitere Lesarten.

So kann dru k sowohl als Substantiv (z. B. im Sinne von psy his hem Dru k) als

au h als Verbstamm (der Vorgang des Dru kens) interpretiert werden. Es ergeben

si h also dreiLesarten:

(1) dru ker (N) + wartung (N)

(2) dru k (N) + erwartung (N)

(3) dru k (V) + erwartung (N)

Jede dieser Lesarten könnte man wiederum als lexikalis he Mehrdeutigkeit des ge-

samten Zei hensDru kerwartung betra hten, dienur dur h dieEinbettung in einen

Kontext disambiguiert werden könnte. Zum Beispiel wird in einer te hnis hen Ge-

räteanleitung wohlnur dieLesart (1) akzeptiert. Tatsä hli hsind diesLesarten, die

alle alsgrammatis he korrektakzeptiert werdenmüssen.

AndieserStellewurdenjedo hno hkeineDisambguierungsme hanismenvorgestellt,

die fals he Lesarten, die ebenfalls auftau hen können und werden, eliminieren . Ein

naiverAlgorithmus,der Segmentieru ngundTaggingnur aufgrundder Lexikoninfor-

mationendur hführt, wird mehr (fals he) Lesartennden.

(1) dru ker (N) + wartung (N)

(2) dru k (N) + erwartung (N)

(3) dru k (V) + erwartung (N)

(4)* dru k (N) + er (I) + wartung (N)

(5)* dru k (V) + er (I) + wartung (N)

Da Fugenelement e (hier mit (I) für Interx bezei hnet) ebenfalls im Lexikon ent-

halten sind, werden die Lesarten (4) und (5)erkannt. Erst distributive Regeln von

MorphemenundFugenelement enkönnensol hefals henSegmentierungen auss hlie-

ÿen.

(24)

So würde Lesart (4) ausges hlossen werden, sobald berü ksi htigt wird, dass si h

wenn überhaupt nur Substantive, dieimPlural dieEndung -er aufweisen,mit dem

Fugenelement-er-verbinden.Lesart (5)entfällt,wennmandieRegelanwendet,dass

Verbstämmeübli herweise ohneFugenelement stehenodermit -e-in einigenFällen.

Mehrzur Verwendung vonRegularitätenander Kompositionsfugezur Disambiguie-

rung vonSegmentationsergebnissen unter1.6.4.

Au h als ein Fall von struktureller Ambiguität kann der bereits erwähnte Sa hver-

haltbetra htet werden, wenn Komposita als Ganzesim Lexikon enthalten sind, die

eigentli h no hweitersegmentiertwerdenkönnten undparallel au hweiter segmen-

tiertwerden.

(1) reise (N) + s hreibmas hine (N)

(2) reise (V) + s hreibmas hine (N)

(3) reise (N) + s hreib (V) + mas hine (N)

(4) reise (V) + s hreib (V) + mas hine (N)

Solange no h keine Disambiguierung stattgefunden hat, kann die Anzahl aller (in-

klusive dergrammatis h fals hen) Lesarten mithilfederfolgenden Formelbere hnet

werden:

Anzahlder Lesarten

=

|S g |

X

i=1

^|S Y ⁱ ^|

j=1

|s i,j |

Hier steht

s _i,j

^(wo

j = 1, 2, . . .

⁾ ^für êin êinzelnes ^Segment ûnd

|s i,j |

^für ^die ^Anzahl

der lexikalis hen Ambiguitäten dieses Segments.

S _i

^(wo

i = 1, 2, . . .

⁾ ^ist ^die ^Menge

allerSegmente

s i,j

^, ^die^zu^einerSegmentierungsart 4

gehören.

|S i |

^ist^die^Anzahl^der

Segmente einerSegmentierungsart

S _i

^.^Sei

k = |S _i |

^,^dann^ist

S _i = {s _i,1 , s _i,2 , . . . , s _i,k }

. Die Inde es der Segmente entspre hen der Reihenfolge der Segmente.

S _g

^ist ^die

Menge aller vers hiedenen Segmentieru ngsart en

S i

^und

|S g |

^ist ^die ^Anzahl ^dieser

Segmentierungsarten. Sei

n = |S _g |

^dann ^ist

S _g = {S ₁ , S ₂ , . . . , S _n }

^.

DieAnzahlderLesartenvonDru kerwartung bere hnet si hdemna hbeispielsweise

wie folgt:

S _g =



 

 

S ₁ = {s _1,1 = drucker , s _1,2 = wartung }, S ₂ = {s _2,1 = druck , s _2,2 = erwartung }, S ₃ = {s _3,1 = druck , s _3,2 = er , s _3,3 = wartung }



 

 

|s 1,1 | = 1 |s 1,2 | = 1

|s 2,1 | = 2 |s 2,2 | = 1

|s 3,1 | = 2 |s 3,2 | = 1 |s 3,3 | = 1

4

AlsSegmentierungsartwirddie reineSegmentierungohne Tagging bezei hnet.ZweiSegmen-

tierungsartensindglei h, wennalleSegmentgrenzen übereinstimmen.BeiderSegmentierung von

Dru kerwartung gehörenLesarten(2)und(3)zueinerSegmentierungsartsowieLesarten(4)und

(25)

|S g |

X

i=1

^|S Y ⁱ ^|

j=1

|s i,j | =

3 X

i=1

^|S Y ⁱ ^|

j=1

|s i,j |

=

|S 1 |

Y

j=1

|s 1,j | +

|S 2 |

Y

j=1

|s 2,j | +

|S 3 |

Y

j=1

|s 3,j |

=

2 Y

j=1

|s 1,j | +

2 Y

j=1

|s 2,j | +

3 Y

j=1

|s 3,j |

= |s _1,1 | · |s 1,2 | + |s 2,1 | · |s 2,2 | + |s 3,1 | · |s 3,2 | · |s 3,3 |

= 1 · 1 + 2 · 1 + 2 · 1 · 1

= 1 + 2 + 2

= 5

Die Segmente

s _2,1

^und

s _3,1

^haben ^jeweils^zwei^lexikaleDeutungsmögli hkei t en. Alle übrigen Segmente haben jeweils eine lexikale Deutungsmögli hkei t . Die Anzahl der

Lesarten einer Segmentierungsart ist glei h dem Produkt der lexikalen Deutungs-

mögli hkeiten aller Segmente dieserSegmentierungsart. Für

S ₁

^gibt^also ^genau ^eine

Lesart(

1 · 1

^).^Für

S ₂

^gibt^es^demna
h^genau ^zwei^Lesarten⁽

2 · 1

⁾^und^für

S ₃

^ebenfalls

zweiLesarten(

2 · 1 · 1

^).Ans hlieÿend wird dieAnzahl der LesartenallerSegmentie- rungsarten summiert. Insgesamt gibt es also fünf Lesarten. Wie gesagt, handelt es

si h hier um naive Lesarten, die ni ht linguistis h bereinigt sind. Die letztendli h e

Anzahldergrammatis hkorrektenLesartenlässtsi hni htanhandderKombinatio-

nenvonlexikaler undstrukturaler Ambiguität bere hnen.Es istprinzipiell mögli h,

dassalle,einigeoderkeineLesartenkorrektsind. SinddieInformationenimLexikon

unvollständig,bedeutetdies,dasseinigeunterUmständenkorrekteLesartenerstgar

ni htgefunden werden.

1.6 Die Kompositionsfuge

Die Morphemgrenze zwis hen den Konstituenten einer Wortbildungskonstruktion

wird als Fuge bezei hnet (vgl. Fleis her und Barz 1995, S. 136). Unters hie-

den wird dabeizwis hen Derivations- undKompositionsfuge, wobei an dieserStelle

auss hlieÿli hdieKompositionsfugebehandelt wird. An der Kompositionsfugekann

eszuvers hiedenen Ers heinungen kommen.So können bestimmte Elemente entwe-

der getilgt oder andere Elemente hinzugefügt werden. Die hinzugefügten Elemente

werdeninder entspre henden LiteraturalsFugenelement eoderInterxebezei hnet.

Langer(1998, S.3) verwendeteineandere Terminologie alsdiegemeinhinübli he,

daseiner Meinungna h dieBezei hnung Fugenelement oder Interx daraufhindeu-

(26)

zum Erstglied gezählt werden (siehe unten), bilden sie zusammen mit dem Erst-

glied die Kompositionsform des Erstglieds. Von der Kompostionsform ausgehend

bezei hnet LangerdieFugenelement ealsKompositionssuxedesErstglieds.Diese

Bezei hnung ist wohl ni ht weniger problematis h als die übli he, da eine Katego-

risierung als Sux wiederum auf einen Morphem harakter hindeutet, der bei den

Fugenelement en zumindest diskutiertwerdenkann.

Dafür, dass die Fugenelement e dem Erstglied zugere hnet werden müssen, zählt

Fuhrhop (1998, S. 187) drei Argumente auf: Erstens wird das Fugenelement vom

Erstgliedbestimmt.ZweitensstehtdieFormdesFugenelementsimengenZusammen-

hang mit dem Flexionssystemdes Erstgliedes. Drittens verbleibt das Fugenelement

bei Koordinatio n beim Erstglied, wie z. B. bei Frühlings- und Herbsttage . Analog

zu Langer spri ht Fuhrhop von Kompostionsstammformen des Erstgliedes. Als

Kompositionsstammform wird die Form desErstgliedes bezei hnet, dieletztendli h

in die Komposition eingeht. Tritt ein Fugenelement auf, wird eszur Kompositions-

stammformgere hnet.Dieser Begri wird imFolgendenweiterverwende t.

Die Fugenelemente sind überwiegend auf Substantiv- oder Verbstämme als Erst-

glieder bes hränkt. Obwohl die Fugenelemente wie die Flexionsmorpheme der ent-

spre henden Erstglieder aussehen, können sie ni ht als Ers heinungen der Flexion

gewertet werden,damitunterau hFugenelementeintergiertwerden,dieni htzum

Flexionsparadigma des entspre henden Ersgliedes gehören, z. B. Liebesdienst mit

demFugenelement -s- .Ineinigen Fällenkann einFugenelement (oderInterx)no h

den Plural eines Erstgliedes markieren, wenn dieForm mit der Pluralform desent-

spre henden freien Lexems übereinstimmt, aber au h das ist ni ht in allen Fällen

si her. Ni htseltenwirddieFuge aufgrundvon Kompositionsmustern übernommen,

z.B.Strahlenkranz gegenüberTortenstü k vieleStrahlen,aber nureineTorte(vgl.

Dudenredaktion 1998,S. 495).

Beiman henErstgliedernwerdendur hdieFugengestaltungHomonymendierenzie-

rung,Wortartenunters hiedeund au h semantis he Dierenzengekennzei hnet (vgl.

Fleis her und Barz1995, S. 137), z. B. Landesverteidigung und Landebahn, wo

imersten Kompositum Land imSinne vonStaat verwendetwird,währendimzwei-

ten Fallder Verbstamm vonlanden vorliegt. DieseEigens haften wurdenbereitsim

ZusammenhangmitderSegmentieru ngder KompositaerwähntundsindderHaupt-

grund für dieBes häftigungmit den Fugenelement en in dieserArbeit.

Fleis her und Barz erklären die S hwierigkeiten mit der Herausarbeitung von

Regularitäten in der Distribution von Fugenelementen mit dem Widerstreit zweier

Regularitätskonzeptio nen der Orientierung an grammatis hen Regeln einerseits

und der Orientierung an lexikalis hen Mustern andererseits. So kann si h die an

einbestimmtesErstgliedgebundeneFugengestaltunglexikalisierterKompositagegen

grammatis he Regularitäten dur hsetzen.

ObeinFugenelement gesetztwird oder ni ht, hängt lautDudenredaktion (1998,

(27)

a) insbesondere von der Wortart desBestimmungswortes,

b) vonseiner morphologis hen Grundausstattung (Flexionsklasse),

) vonseiner Lautstruktur(Umfang,Silbenzahl, Auslaut),

d) von seinerWortbildungsstruktur (davon,ob es si h um ein Simplex, eineAb-

leitungoder eineZusammensetzung handelt)

e) zum Teil au h davon, ob das Kompositum nur eine oder mehrere der im Be-

stimmungswort bezei hnete n Sa hen oder Personen voraussetzt,

f) vonregionalen Bedingungen.

Eine systematis he Bes häftigung mit dem Auftreten der Fugenelemente liefert

Fuhrhop (1998, S. 187220), in der die obigen klassis hen Kriterien genauer un-

tersu ht werdenundna h Funktionender Fugenelement e gefragtwird.

Fuhrhop konzentriert si h ans hlieÿend auf die produktiven Fugenelement e und

su ht na h den Grundlagen der Intuition, mit der Spre her Fugenelement e setzen.

Dieunproduktiven Fugenelement e werdenausdrü kli h ausgespart.

Sowohl Dudenredaktion als au h Fleis her und Barz nennen als Fugenele-

mente -(e)s-, -e- , -(e)n- , -er- und -ens- . Bei Fuhrhop werden die Fugenelement e

-s und -es , sowie -en und -n deutli h unters hieden. Der fehlende Bindestri h auf

der re hten SeitedesFugenelement es istdur h dieZugehörigkeit zur Kompositions-

stammformbegründet.

1.6.1 Bildung der Kompositionsstammformen

mit Fugenelementen

Im Folgenden werden die von Fuhrhop (1998) gefundenen Regularitäten zusam-

mengestelltundaufgrundder Einbindungsmögli hkeitenin dasbes hriebeneModell

kommentiert.

Fuhrhops Hauptkriterium zur Erstellung einer Systematik der Fugenelement e ist

deren Produktivität, ein Aspekt, der in deskriptiven Untersu hungen übergangen

wird.Zunä hstwerdendieFugenelement ena hihrerFormeingeteilt,dieErstglieder

werdenaufgrunddieserEinteilungaufdieEntstehungvonBasismengenoderReihen

untersu ht. Die Kriterien, die den Reihen zugrunde liegen, werden gesammelt und

ananderen Fällengeprüft.

Kompositionsstammformenbildung mit -s

Das Fugen- s nimmt eine Sonderstellung unter den Fugenelement en ein, da es als

einziges produktiv neben der paradigmis hen Form unparadigmis h auftritt. Mit

(28)

demMerkmalspaar paradigmis h/unparadigmis h isthier dasAuftretenzu denFu-

genelementen homophoner und homographer Flexionssuxe in den entspre henden

ektierten Wortformen des Erstglieds gemeint. So tritt -s au h in Kompositions-

stammformen auf, zu deren Flexionsparadigma es aber ni ht gehört und somit als

unparadigmis hbezei hnet wird.Entspri htdasFugen- s demGenitiv-s desErstglie-

des,ist esparadigmis h. Eine andereinteressante Eigens haft beruht aufder Tatsa-

he,dass -s niemals in Kompostionsstammformen vorkommt, derenPluralform mit

-s gebildet wird, au h dann ni ht, wenn die Genitiv-Singular-Fo rm formglei h ist

(vgl.Fuhrhop 1998, S. 197).

BeidenKompositionsstammformenmitunparadigmis henFugen- s nenntFuhrhop

vierKlassen femininer Substantive.Die Erstglieder sind:

a) sugierte feminine Substantive (z. B. Tapferkeitsmedallie, Versi herungsver -

treter);

b) alte Ableitungen mit -t aus Partikelverben (z. B. Abfahrtszeit, Aufsi htsver-

pi htung);

) (syn hron)Simplizia (z.B. Anstaltsleiter , Arbeitserlaub nis);

d) formaleinKompositum mit nur einem Beleg: Ho hzeitsfeier.

Ina)bildenalledieseSubstantivebisaufFormenmit-ei ,-erei und-in ihreKompo-

sitionsstammformenregelmäÿigmit Fugen- s.InFälleneiner explizitenPluralbedeu-

tung istaber au hdie entspre hende Pluralform mögli h. Bei b) d) sindauällige

Gemeinsamkeiten zu erkennen. So sind alle Belege mehrsilbig und enden auf -t . Es

ergibt si hzusammenfassend,dass Mehrsilbigkeitund damit verbundene morpholo-

gis heKomplexitätnotwendigeBedingungenfüreineunparadigmis heKompsitions-

stammformmit -s sind.

Dieparadigmis henFormendesFugen- s sinds hwierigerzuerfassen.Dadasparadig-

mis he-s niemalseinerPluralformentspri ht,kannesnurderGenitiv-Singular-Form

formglei hsein (vgl. Fuhrhop 1998,S. 198).

DieGruppederdeverbalenSubstantiveweistkeineeindeutigenKompositionsstamm-

formenauf.Bei dendeverbalen Substantivenauf -en sind esdieeinfa hen oder prä-

giertendeverbalen neutralen Substantive, die ihre Kompositionsstammform auf -s

bilden (Beispiele: Essensmarke, Wissensdurst, Einkommensgrenze). Entspre hende

Bildungenmitmaskulinem Genus weisen keineFugenelement eauf,z.B.Hustensaft.

NeutraleErstglieder vomTypErdbebenvo rso rge sindselbst Komposita,dieentspre-

henden Verben Rü kbildungen ausdiesen Substantiven und weisen ebenfalls keine

Fugenelement eauf.Diegenannten Formenunters heidensi hvondensubstantivier-

ten Innitiven, deren Kompositionsstammform der der zugrundeliegenden Verben

entspri ht, dur h ihrePluralfähigkeit. Daraus zieht Fuhrhop den S hluss,dassder

Gebrau h desFugen- s in dieserGruppe mit zunehmender Lexikalisierungeintritt.

(29)

ImpliziteAbleitungen ausVerben weisen teilweise Fugen- s auf,teilweise ers heinen

sie ohne Fugenelement . Die impliziten Ableitungen komplexer prägierter Verben

treten mit Fugenelement auf (z. B. Anfangsgehalt, Bestandsaufnahme, Vors hlags-

re ht). Fuhrhop (1998, S. 201) nennt dabei einige Ausnahmen, vor allem die auf

einen koronalen Frikativauslautenden Ableitungen wie z.B. Aufs hluss. Auÿerdem

werdenvonFuhrhop Ausritt undAusklang alsAusnahmenbezei hnet,diefugenlo-

seKompositionsstammformenbilden.Dagegenstehen aber vomAutordieserArbeit

gefundene Formen wie Ausklangsgur und Ausklangsfeier 5

. Als Komposition mit

Ausklang als Kompositionsstammform ohne Fugen- s wurde nur Ausklangambiente

gelistet. Fuhrhop liefert selbst keineentspre henden Beispiele.Implizite Ableitun-

gen einfa her Verben wie z.B. Brau htum und S hlagball treten ohne Fugen- s auf.

Ausnahmensindz.B.Handelsmann.FuhrhophebthierdieMehrsilbigkeitderAus-

nahmen hervor. Die Ableitungen ohne Fugenelement sind einsilbig. Damit wird die

Verbindungzumunparadigmis henFugen- s hergestellt,dasniemalsna heinsilbigen

Erstglied folgt.

Dasunparadigmis he -s trittregelmäÿig na h bestimmten femininen Ableitungssuf-

xen auf (siehe oben). Bei maskulinen Substantiven ist das paradigmis he -s nur

na h demSux -ling regelmäÿig, z. B. Lehrlingsgehalt oder Lieblingsgetränk. Na h

-er trittesnurna h Ortsnamen auf,diemanalslexikalisiertbetra hten kann,z.B.

Eberswalde . Ist dasZweitglied ein relationales Substantiv, tritt in bestimmten Fäl-

lenein -s hinter -er , z. B. Bauersfrau, Ri hterssohn. Bei diesen Erstgliedern ist die

Kompositionsstammform mit -s ni ht dieeinzige, estritt immerau h dieKomposi-

tionsstammform ohne Fugenelement auf.

Bei denneutralen Substantiven tritt -s regelmäÿig na h den Suxen -sal und -tum

auf( Fleis her und Barz 1995,S. 139).

EinsilbigemaskulineoderneutraleSubstantive,diemitFugen- s auftreten,gibtesnur

wenige,z.B.Amtsgeri ht oder Wolfsgrube .EskönnekeinebesonderenEigens haften

ausgema htwerden,diedieseSubstantivezuBasismengenzusammenfassen.Füreine

Auistungsiehe Fuhrhop (1998, S. 202).

DiegenanntenKriterienfürdasunparadigmis he-s könnenmitFinite-State-Mit teln

relativ einfa h dem Modell hinzugefügt werden. Sowohl die Feststellung von ent-

spre henden Suxen als au h die Erkennung der Komplexität der Erstglieder wird

realisiert (siehe dazu 3.2). Die Wortart sowie Genus im Falle der Substantive sind

im Lexikon kodiert. Da die sugierten Feminia überwiegend Abstrakta sind, kann

an den enthaltenen Flexionsinformationen erkannt werden, ob es si h um Singula-

riatantum handelt, bei denen eine pluralis he Verwendung ausges hlossen werden

kann.

S hwierigergestaltetsi hdieEinbindungderbes hriebenenRegularitätenfürdaspa-

radigmis he-s.NebenderSuxgestaltungundderKomplexitätderErstgliederspielt

au hderenWortbildungs harakte ristik eineRolle.Es müsste festgestelltwerden, ob

5

AkadeiaBydgkai.aziiezaWie

M 1

ε

M 2

ε

M 3

M 4

T

(T

) +

A 1

A 2

A 9

A 16

B 18

B 20

KS 1

KS 2

(KS) + · N G

N K 2

N K 9

AK

V K

•

•

•

•

•

•

•

•

•

•

•

•

=

|S g |

X

i=1

 |S Y i |

j=1

|s i,j | 

s i,j

j = 1, 2, . . .

|s i,j |

S i

i = 1, 2, . . .

s i,j

|S i |

S i

k = |S i |

S i = {s i,1 , s i,2 , . . . , s i,k }

S g

S i

|S g |

n = |S g |

S g = {S 1 , S 2 , . . . , S n }

S g =



 

 

S 1 = {s 1,1 = drucker , s 1,2 = wartung }, S 2 = {s 2,1 = druck , s 2,2 = erwartung }, S 3 = {s 3,1 = druck , s 3,2 = er , s 3,3 = wartung }



 

 

|s 1,1 | = 1 |s 1,2 | = 1

|s 2,1 | = 2 |s 2,2 | = 1

|s 3,1 | = 2 |s 3,2 | = 1 |s 3,3 | = 1

|S g |

X

i=1

 |S Y i |

j=1

|s i,j |  =

3

X

i=1

 |S Y i |

j=1

|s i,j | 

AkadeiaBydgkai.aziiezaWie

M ₁

M ₂

M ₃

M ₄

) ⁺

A ₁

A ₂

A ₉

A ₁₆

B ₁₈

B ₂₀

KS ₁

KS ₂

(KS) ⁺ · N G

N K ₂

N K ₉

^|S Y ⁱ ^|

|s i,j |

s _i,j

S _i

S _i

k = |S _i |

S _i = {s _i,1 , s _i,2 , . . . , s _i,k }

S _g

n = |S _g |

S _g = {S ₁ , S ₂ , . . . , S _n }

S _g =

S ₁ = {s _1,1 = drucker , s _1,2 = wartung }, S ₂ = {s _2,1 = druck , s _2,2 = erwartung }, S ₃ = {s _3,1 = druck , s _3,2 = er , s _3,3 = wartung }

^|S Y ⁱ ^|

|s i,j | =

^|S Y ⁱ ^|

|s i,j |

= |s _1,1 | · |s 1,2 | + |s 2,1 | · |s 2,2 | + |s 3,1 | · |s 3,2 | · |s 3,3 |

s _2,1

s _3,1

S ₁

S ₂

S ₃