Katedra Filologii Germa«skiej
Mar in Jun zys-Dowmunt
Ein Finite-State-Modell für einfa h und
mehrfa h zusammengesetzte Komposita
Pra a magisterska
napisanapodkierunkiem
prof. MarkaCieszkowskiego
Katedra Filologii Germa«skiej
Mar in Jun zys-Dowmunt
Model sko« zenie stanowy wyrazów
pojedyn zo i wiel okrotnie zªo»ony h
Pra a magisterska
napisana podkierunkiem
prof. MarkaCieszkowskiego
Einführung 1
1 Vorbemerkungen zur Komposita-Analyse 3
1.1 DasFinite-State-Modell und Wortbildungsmodel le . . . 3
1.2 Zum Wesender Komposita . . . 7
1.3 Komposita na hWortart desGrundwortes . . . 9
1.3.1 NominaleKomposita . . . 9
1.3.2 Adjektivis heKomposita . . . 10
1.3.3 VerbaleKomposita . . . 11
1.4 Sonderfälle . . . 12
1.4.1 Possessivkomposita . . . 12
1.4.2 Zusammenbildungen . . . 12
1.4.3 Zusammenrü kungen . . . 13
1.5 Komposita-Segment ierung undSegment-Tagging . . . 13
1.5.1 Denitiondes Segmentbeg ries . . . 14
1.5.2 DasLexikonund linguistis hesTagging . . . 16
1.5.3 Lexikaleund strukturelleAmbiguität . . . 17
1.6 DieKompositionsfuge . . . 20
1.6.1 Bildungder Kompositionsstammformen mitFugenelementen. 22 1.6.2 Systematisierungder Regularitäten . . . 27
1.6.3 Einige Wortezum Bindestri h . . . 29
1.6.4 DieFugeim Verhältnis zur Segmentierung . . . 30
2 Verwendete Finite-State-Mittel 32 2.1 Endli he Automaten . . . 32
2.1.1 Denitionen . . . 32
2.1.2 Ni ht-Deterministis he Automatenund Determinieru ng . . . 35
2.1.3 Abs hlusseigens haftenendli her Automaten . . . 39
2.2 Finite-State-Transdu er . . . 43
2.2.1 Denitionen . . . 43
2.2.2 Abs hlusseigens haftenvon Transdu ern . . . 46
2.2.3 Transdu ermit Endausgabefunktio n . . . 48
2.3 Reguläre Spra hen undmens hli hesParsing . . . 49
2.4 Vor- undNa hteilevon Finite-State-Modellen . . . 51
3.1.1 Lexikoneinträgeund Tagsets. . . 54
3.1.2 Ein Transdu erals Basis-Lexikon . . . 55
3.1.3 Lexikonstruktur und Segmentieru ng . . . 57
3.2 Erstgliedanalyse. . . 61
3.2.1 FST zur Silbenanalyse . . . 61
3.2.2 FSTs zur Sux-undAuslautbestimmung . . . 66
3.3 Distributionsregeln . . . 68
3.3.1 NaiveKompositastruktur . . . 68
3.3.2 Tag-basierteRegeln . . . 73
3.3.3 Lexikalisierte Regeln . . . 77
3.3.4 DieDistributionsregeln als Ganzes . . . 79
3.4 Zusammenspiel der Komponenten . . . 81
Zusammenfassung 86
Literaturverzei hnis 89
1.1 Bildungder erfasstenKompositionsstammformen . . . 28
2.1 DasTransitionsdiagramm für einenendli hen Automaten . . . 33
2.2 Endli her Automat
M 1
(NEA) mitε
-Transitionen . . . 372.3 Endli her Automat
M 2
(NEA) ohneε
-Transitionen . . . 382.4 Determinieru ngsergebnis
M 3
(DEA) . . . . . . . . . . . . . . . . . . 382.5 Minimierungsergebnis
M 4
(DEA) . . . . . . . . . . . . . . . . . . . . 392.6 DieVereinigung zweier endli her Automaten . . . 40
2.7 DieKonkatenation zweier endli her Automaten . . . 41
2.8 DerKleene-Abs hluss eines endli hen Automaten . . . 42
2.9 Ein einfa her FST . . . 43
2.10 Komposition zweier FST . . . 47
2.11 Ein einfa her FST mit Endausgabefunktio n . . . 49
3.1 Bedeutung undmögli he Reihenfolgeder Tags . . . 55
3.2 Ein vereinfa hterLexikon-FST
T
di . . . 563.3 DerLexikon-FSTna h demKleeneabs hlus
(T
di) +
. . . . . . . . . . 593.4 Graphematis he Repräsentationen mögli her Silbenkerne . . . 62
3.5 Regel
A 1
für Erstsilbenmit Silbenkern a . . . . . . . . . . . . . . . . 633.6 Regel
A 2
für Erstsilbenmit Silbenkern e . . . . . . . . . . . . . . . . 643.7 Regel
A 9
für Erstsilbenmit Silbenkern aa . . . . . . . . . . . . . . . 643.8 Regel
A 16
für Erstsilben mit Silbenkern eu . . . . . . . . . . . . . . . 653.9 Zusätzli he Tagsna hder Sux-und Auslautanalyse. . . 66
3.10 Regel
B 18
für dieSuxerkennung von -ung . . . 673.11 Regel
B 20
für dieAuslauterkennung von -t . . . 673.12 NominaleKompositionsstammform ohne Fuge (
KS 1
) . . . . . . . . . 693.13 NominnaleKompositionsstammform mit Fuge (
KS 2
) . . . . . . . . . 703.14 AllgemeineKompositastruktur
(KS) + · N G
. . . . . . . . . . . . . . 723.15 Kompositionsstammformen na h bedeutsamen Tags. . . 74
3.16 Kompositionsstammformen s hwa her Substantive Regel
N K 2
. . . 743.17 Kompositionsstammformen mit spezis hemSux Regel
N K 9
. . 763.18 Adj.und verb. Kompositionsstammformen Regeln
AK
undV K
. . 773.19 LexikalisierteKompositionsstammform . . . 78
Ein Grundsatz der Computerlinguistik beruht auf der Annahme, dass mens hli he
Spra hproze sse mithilfe des Computers bes hrieben und simuliert werden können.
Zwar ordnet man die Computerlinguistik eher der Spra hwissens haft zu, denno h
beziehtsiealsinterdisziplinä reWissens haftvielfa hMethoden undModelleausder
Informatik,derMathematik,derkognitivenPsy hologieundanderenverwandtenBe-
rei hen.Besonders dasKonzeptder formalen Spra hen undGrammatiken sowie die
damit verbundene Automatentheorie, deren Ursprüngein der Mathematikund der
theoretis hen Informatik anzusetzensind, haben einen bedeutenden Einuss sowohl
auf die Grundlagenfors hung als auf konkrete Anwendungen innerhalb der Compu-
terlinguistik.Spra hli he Vorgänge aufmathematis he Modelle zurü kzuführen und
diese ans hlieÿend auf einem Re hnersystem zu realisieren, ist ein erklärtes Ziel.
Unlösbarverbundenmit den formalenSpra hen undden endli hen Automatensind
Parser-Anwendun gen.GrammatikendienenimAllgemeinenzurGenerierungvonfor-
malenSpra hen,Automatensindin derLage zuerkennen,obeinAusdru kzu einer
bestimmten Spra he oder Spra hklasse gehört und Parser s hlieÿli h liefern Struk-
turbes hreibun gen, auf deren Grundlage zum Beispielsemantis he Interpretationen
mögli h sind.
Ein für diedeuts he Spra he typis hes und au h sehr interessantes Phänomen sind
dieKomposita.Ihnenistzuverdanken,dassDeuts halsdieSpra hemitdenlangen
Wörtern bekannt ist.Gerade dieKomposita stellen ni ht nur bei der mas hinellen
Übersetzungeinebesondere Hürdedar,aber au hfürausländis heDeuts hlernerer-
gebensi hS hwierigkeiten. Diesesinddarinbegründet,dasseine Vielzahlder Kom-
posita,vorallemdieDeterminativkomposita, okkasionale Bildungensindunddaher
au h in keinem Wörterbu h enthalten sein können. Ein deuts her Mutterspra hler
hatindenmeistenFällenkeineProbleme,dieBedeutungeinesKompositumsanhand
derBedeutungenseinerKomponentenunddesVerhältnissesdieserKomponente nzu
einander zuerkennen. Istdiesni ht ohne weiteres mögli h, ist eine Betra htung des
unmittelbar en Kontextes übli herweise ausrei hend für dieBedeutungsers hlie ÿung.
EineÜbersetzungsanwendungwirdmiteinemneuen Kompositumnunganzähnli he
Problemehaben:soferndasangetroeneWortni htin seineminternenLexikonent-
halten ist,weiÿ dasProgramm ni htsmit ihm anzufangen. Eine Bestandsaufnahme
aller potentiellen Komposita ist unmögli h, da estheoretis h unendli h viele Kom-
posita gibt und jedes dieser Komposita erneut als Glied einer anderen Zusammen-
setzungauftau hen kann.DieseEigens haftderKompositama hteineStrukturana-
lysenotwendig, diedie Zusammensetzungen auf seine unmittelbar en Konstituenten
zurü kführt, und zwar soweit, dass diese Konstituenten in einem mehr oder weni-
ger kompletten Lexikon aufgenommen werden können. Aufgrund ihrer besonderen
Eigens haften sind Komposita im Spra hsystem zwis hen Lexik, Morphologie und
Syntax anzusiedeln. Eine zuverlässige Strukturanalyse müsste allen Systemebenen
Re hnung tragenund dabeiau hsemantis he wie au h pragmatis he Informationen
berü ksi htigen.
Diesem Anspru h kann man nur s hwer gere ht werden, weshalb das Modell auf
eineOberä hen analyse(ShallowParse)bes hränktbleibt.Demna histdasParsing
vonKomposita keintrivialesProblem, kann aber aufeineProblemstellung reduziert
werden, die einges hränkt genug ist, um für eine Formalisierung mit Finite-State-
Modellen geeignet zusein.
ZieldieserArbeitistes,einformales,mathematis hbegründetesFinite-State-Modell
für deuts he einfa h undmehrfa h zusammengesetzt e Komposita vorzustellen. Mit-
hilfe diesesModellswird glei hzeitig eine auf mehrerenEbenen arbeitende Parsing-
Anwendungbes hrieben,diedur heineImplementation derbes hriebenenAutoma-
ten direkt funktionsfähigwird. Die Arbeitsebenen desParsersbetreendie graphe-
matis he Form des Kompositums und mehrere voranalysierte Zwis henstufen, die
während des letzten Analysevorgangs disambiguiert werden. Der Parser wird eine
Zusammensetzung segmentieren und die gefundenen Segmente mit entspre henden
linguistis hen Informationen annotieren. Bei morphologis h mehrdeutigen Kompo-
sita werden mehrereInterpretationsmögli hkei t en angegeben, soferndie letzteAna-
lysestufe keine Disambiguierung errei hen konnte, wobei eine semantis he Analyse
der erhaltenenStrukturen und diedamit in Verbindungstehende Untersu hungder
Idiomatisierung ni ht zum Umfang der Arbeit gehören. Grundlage aller Formalis-
men bleiben dabei immer die linguistis hen Eigens haften und Besonderheiten der
Komposita vor allemauf morphologis her Ebene.
Vorbemerkungen zur
Komposita-Analyse
Komposita sind der linguistis he Gegenstand dieser Arbeit. Im Folgenden werden
Wesen, Eigens haften und Struktur der deuts hen Komposita in Kürze dargestellt.
VorgehensweisenbeiderSegmentierungderKompositawerdenbespro hen.Ans hlie-
ÿend ri htet si h das Augenmerk auf die Kompositionsfuge, da das Finite-State-
Modell au h das Vorkommen der Fugenelement e und deren Varianten bes hreiben
wird. Die herausgearbeit eten Regelmäÿigkeiten werdenspäter zur Disambiguierung
von gefundenen Komposita-Seg ment ier ungen verwendet. Au h werden andere Phä-
nomeneanderKompositionsfugewieTilgungundorthogras heBesonderheitenwie
der Dur hkopplungsbindestri h berü ksi htigt.
1.1 Das Finite-State-Modell und Wortbildungsmodelle
In diesemAbs hnitt wird versu ht, eine Brü ke zwis hen den formalen Mittelnaus
Kapitel2unddemlinguistis henUntersu hungsgegenstand dieserArbeit, denKom-
posita, zus hlagen. Es werdenParallelen undUnters hiede desentwi kelten Finite-
State-Modellszu klassis hen Wortbildungsmodellen aufgezeigt. Weiterhin wird dar-
gelegt,warumbewusstaufdieEinbeziehung bestimmterAspekteindasModellver-
zi htetwurde und teilweise verzi htetwerdenmusste.
Komposita sind Wortbildungsprodukte. Dem Aufbau von Wortbildungsprodukten
liegen bestimmte Wortbildungsmodelle zugrunde. Ein Wortbildungsmodell ist ein
morphologis h-syntaktis h und lexikalis h-semantis h bestimmtes Strukturs hema,
na hdemReihenglei h strukturierterWortbildungsproduktemit unters hiedli h em
lexikalis hemMaterialerzeugtwerdenkönnen ( Fleis herund Barz1995,S.53).
DieHerausarbeitung der Gemeinsamkeiten alleruntersu hten Elemente ist dasWe-
seneinerModellierung,wobeider AbstraktionsgradeinesModellsvondergewählten
Bes hreibungsgenauigkeitabhängt (vgl.Fleis her und Barz1995, S. 53).
IndervorliegendenArbeitwirdeinModellmitmehrerenAbstraktionsgradenerstellt.
Während bei der morphologis hen Analyse einerseits direkt von der lexikalis hen
Oberä he ausgegangen wird, also kaum abstrahiert wird, werden bei der Model-
lierung der Distributionsregeln der Kompositakonstituent en überwiegend abstrakte
Kategorien verwendet.
Ein Modell, dasauf Transdu ern beruht, kann sowohlzu Analysezwe ken, als au h
zur Generierung von Strukturengenutzt werden.
1
Ähnli h wie beiFleis her und
Barz,diefeststellen,dassihreModellbes hreibu ngni ht ausrei ht,umalsvollstän-
diger generativer Me hanismus zu fungieren, der nur die Bildung ri htiger Wort-
bildungsprodukte zulässt, erhebt au h das in dieser Arbeit vorgestellte Modell der
Kompositani htdenAnspru haufVollständigkeit.WährendFleis herundBarz
dieAusdrü kegenerativ undMe hanismus no hinAnführungszei hensetzen,ist
das in der Arbeit bes hriebene Finite-State-Modell im wörtli hen Sinne generativ,
daseineImplementierung amRe hnerwüns henswertist,wasausdemModellletzt-
endli heinen Parser oder Generator ma ht.
Ein Wortbildungsmodell sollte Angaben über folgende Strukturmerkmale enthalten
(vgl.Fleis her und Barz1995, S. 54):
a) EineMorphem harakteristikderKonstituenten,dasheiÿtInformationen,obes
si hzumBeispielumGrundmorpheme oderGrundmorphemkomplexehandelt.
Im Falle von Grundmorphemen sollten au h Informationen über Wortart und
semantis heKlasse enthalten sein.
b) DieReihenfolge der Konstituenten
) DieWortart undsemantis he Klasse desnalenWortbildungsprodukte s
d) Formativstrukturelle Spezika des Wortbildungsproduktes, wie zum Beispiel
morphophonologis he undgraphis he Charakteristika
e) Satzsyntaktis hesVerhaltendesWortbildungsprodukte s
f) Wortbildungsbede utung
Zu a) Das vorgestellte Finite-State-Modell verfügt über die geforderte Morphem-
harakteristik aufgrund der morphologis hen Informationen, die im Lexikon einem
Lexikoneintragzugeordnetwerden.DerLexikoneintragansi hbeantwortetdieFrage
na hder Morphemklasse,danebendenFugenelement enüberwiegendGrundmorph-
eme und Grundmorphemkomplexe erfasstsind. In der Einführung zu dieser Arbeit
1
Dieskanndur hdieUmkehrungvonTransdu ernoderganzenTransdu erkaskadenerrei htwer-
den(siehe2.2.2).FormalwerdenumgekehrteTransduktionenangenommen,dieeinAnalyseergebnis
aufdieUrsprungsformabbildenkönnen.
wurde festgestellt, dass semantis he Aspekte ni ht zum Untersu hungsgegenstand
gema ht werden. Insofern bleiben dieAnforderungen in Bezug auf diesemantis hen
Klassen der Konstituenten unberü ksi htigt. Die Wortart hingegen wird na h der
Segmentierung dur hTagging(siehe1.5.1) annotiert.
Zub) EssindgeradeReihenfolgen, dievonFinite-State-Modellenbesondersezient
erfasst werden können. Reguläre Spra hen, die dur h endli he Automaten deniert
werden können, sind entweder links- oder re htsrekursiv, wasdargestellt als Baum-
struktur in einem linearenAbleitungsbaum resultiert.Es sind vor allemdieRegeln,
diedieReihenfolgeder Konstituenten betreen, diein dieserArbeit modelliert wer-
den.
Zu ) Die Wortart von Komposita wird eindeutig dur h die Wortart der letzten
Konstituente bestimmt. Da die Wortarten der Konstituenten erfasst werden, wird
au h die Wortart des nalen Wortbildungsprodukte s berü ksi htigt. Vermeintli he
Sonderfälle der Zusammensetzung, bei denen die Wortart der letzten Konstituente
ni ht der Wortart der Zusammensetzung entspri ht,sind keine Komposita, sondern
na hAuassungdesAutorsDerivate,KonversionenoderInkorporationen(siehe1.4).
Zud) DasModell ist konzipiert für eine omputerlinguistis he Anwendung und be-
s hränktsi haufdieAnalysevons hriftli hvorliegendenDaten.Tatsä hli hmüssen
dieDaten in einer für einen Computer verständli hen Form vorliegen, weshalb hier
von Zei henketten ausgegangen wird. Morphophonologis he Charakteristika bleiben
insofern zwangsläug unberü ksi htigt, wobei die Vors haltung eines Systems, das
akustis he Datenin Zei henketten umwandelt,dur hausrealisierbar ist.
Zue)BisaufdieWortart desWortbildungsprodukteswerdenkeineweiterensyntak-
tis hbedeutungsvollen Merkmale berü ksi htigt. Daswürde ähnli h wie dieseman-
tis heAnalyse dieVerbindungmit weiterenModellenauf vers hiedenenEbenender
Spra he voraussetzen.
Zuf) Die Wortbildungsbede utung wird alssemantis he Gröÿe ni ht behandelt.
Ei hinger(2000, S.9)beruftsi hbeiderBetra htung vonkomplexenWörternauf
dassystematis heWissen einesSpre hersübersyntagmatis he undparadigmati s he
Zusammenhänge, in diedaskomplexeWorteingeordnet werdenkann.
Bei der syntagmatis hen Einbindung unters heidet Ei hinger zwei Ebenen eine
syntagmainterneundeinesyntagmaexterneEbene.AufdersyntagmainternenEbene
wird dieStrukturder komplexenWörter bes hrieben. Dabei kann essi hum Regu-
laritäten derVerkettungvon Bestandteilenhandelnsowieum eineModellierungder
Beziehungen innerhalb der Wörter. Diese Beziehungen können bereits ausrei hen,
umeinigeHypothesenzuderBedeutungdergesamtenKonstruktionanzustellen.Die
zweite,syntagmaexterneEbene umfasstdieEinbettungdeskomplexenWortesin ei-
ne syntagmatis h gröÿere Einheit, wie einen Satz oder allgemeiner einen Text. Die
syntaktis he Umgebung sowie ein weiterer Kontext geben Hinweise zur Bedeutung.
Ein Beispiel ist die Paraphrasieru ng komplexer Wörter, in der die syntagmatis hen
Beziehungen ausformuliert werden.
Dur h dieLexikalisierungvonTeilkonstituenten ergeben si h mögli he paradigmati -
s heBeziehungen,dieebenfallsaufeinersyntagmainternenundeinersyntagmaexter-
nen Ebene betra htet werdenkönnen. Im ersten Fall sindim Lexikondes Spre hers
bereitsähnli heBildungenbekannt,diebeiderInterpretationdeskomplexenWortes
herangezogenwerdenkönnen.No habstrakteristEi hingersVerständnisvoneiner
syntagmaexternen Paradigmat ik, bei der er von einer Einbettung in Wirkli hkeits-
bezüge, indasWissendesSpre hers über dieZusammenhängezwis henden Dingen
ausgeht.
Die syntagmaexternen Aspekte der bes hriebenen Syntagmatik und Paradigma tik
bleiben in dieser Arbeit zwangsweise ausgespart. Syntagmainterne Aspekte werden
jedo h passend zu beiden Si htweisen erfasst. Beziehungen zwis hen Konstituenten
werden sowohl mithilfe von allgemeingültigen Regeln (Syntagmatik) als au h im
Zusammenhangmit bestimmten konkretenGliedern (Paradigm at ik) modelliert.
Im Fall der Komposita verweisen Fleis her und Barz auf einige Fixpunkte, de-
ren Modellierung aufgrund der genannten Eins hränkungen s hwierig ist. Genannt
werdendabeidiefolgenden Aspekte ( Fleis her und Barz1995, S. 93):
a) Binaritätder UK-Struktur
b) Theoretis h unbegrenzte Komplexität der UK
) Determinatives oder kopulativesVerhältnis der UK
d) Wortart harakteristik der ersten UK
e) Appellativis her, onymis her oder phraseologis her Charakterder ersten UK
Zu a) Die Binarität der Komposita-Struktur ist ohne die semantis he Komponente
ni hteindeutigerfassbar. DasvorgestellteModellverfügt, wie bereitserwähnt,über
keinesemantis hen Datender Konstituenten undkanndementspre hend au h keine
semantis henRegeln beinhalten. Bei einem mehrfa hzusammengesetzten Komposi-
tumkönnen mehrere Strukturtypen zugrundeliegen (vgl. Dudenredaktion 1998,
S. 482) und ohne semantis he Kriterien kann in vielen Fällen nur s hwerli h zwi-
s hen Links- und Re htsverzweigung oder Mis hformen unters hieden werden. Das
Kompositum Armbanduhr ist ein Beispiel für eine linksverzweigende Struktur, die
Konstituenteng renzeverläuftzwis henArmband und Uhr,wobeidieerste Konstitu-
enteweiterhinunterglieder twerdenkann.FüreinenRe hnerohnesemantis heInfor-
mationen gibt esallerdings keinerlei Anhaltspunkte, warum esz. B. keine Banduhr
gebensollte.Es wird alsokeinehierar his heStrukturanalyseunternomme n, dadie-
se ohnehin alle mögli hen Verzweigungsstrukturen zurü kgeben müsste und damit
genausowenigaussagekräftig wäre wie der Mangelan sol hen Strukturen.Bei z.B.
viergliedrigen Komposita gäbe esfünf mögli he Baumstrukturen, beifünfgliedrigen
Zub)DiesemAspektwirdRe hnunggetragen.Zwar bleibtdieModellierungaufdie
Oberä hederKompositabes hränkt,dafüristbeiderAnalysekeinemaximaleZahl
anKonstituentengegeben.Esisteineder Haupteigens haftenformalerSpra hen im
Allgemeinenund endli her AutomatenimSpeziellen,dasssie mitendli hen Mitteln
unendli he Mengen undStrukturen bes hreiben können.
Zu )Au hhieristeineKlassizierungohnesemantis heEinheitkaumzurealisieren,
da si hDeterminativ- und Kopulativkomposita aufgrund ihrer rein morphemis hen
Strukturni htunters heiden.BeidesindZusammensetzungenvonGrundmorphemen
oderGrundmorphemkon struktionenundbeibeidenkönnenFugenelementeauftreten.
Au hkönnen dieKonstituenten vonKopulativkomposita ander StellevonDetermi-
nante oder Basis einesDeterminativkompositu ms auftau hen und umgekehrt.
Zud)DieWortartendergefundenenKomponente nwerdenerfasst,dieswurdebereits
erwähnt. Bei mehrfa hen Zusammensetzung en kann es jedo h s hwierig werden zu
bestimmen, wann genau dieerste Konstituente endetund diezweitebeginnt.
Zu e) Dieser Aspekt ist abhängig von den Daten, die im Lexikon gespei hert sind.
Esist ansi hkeinProblem, eineeigeneKategorie fürEigennamenanzunehmen und
dieseimModellzuberü ksi htigen.EineVerbindungmitdemDur hkopplungsbind e-
stri hkönnte ebenfallsganzeinfa himplementiert werden.Au hPhrasen könnenso
indasLexikonaufgenommenwerden.EswirdindieserArbeitjedo hauspraktis hen
Gründen daraufverzi htet.
Die Anforderungen an ein Wortbildungsmodell, die von Fleis her und Barz
(1995) gestellt werden, umfassen Aspekte mehrerer Ebenen des Spra hsystems. Es
sollenmorphologis he,syntaktis he,semantis heundau hpragmatis heAspektebe-
rü ksi htigt werden. Diesen Kriterien wird dasvorgestellte Finite-State-Modell nur
bedingt gere ht (siehe oben die Ausführungen zu Syntagmatik und Paradigma tik).
DieVerbindungmitModellen,dieRegelmäÿigkeitenaufvers hiedenenSpra hebenen
bes hreiben, wäre nötig, um alle Bedürfnissezu erfüllen. Stattdessen wird vielmehr
einZwis henergeb nis geliefert, das alsGrundlage zu weiteren Analysen in gröÿeren
Kontextenverwendetwerden kann.
1.2 Zum Wesen der Komposita
Unter Zusammensetzungen (Komposita) verstehen wir Wörter, die ohne zusätzli-
heAbleitungsmittel auszweioder mehrerenselbstständig vorkommenden Wörtern
gebildetsind. Dabei stellt der (isolierbare)erste Bestandteil vonden wenigenKo-
pulativkomposita und Verglei hskomposita des Typus Himmelskuppel abgesehen
das Bestimmungsglied dar, der zweite dasGrundwort (die Basis), das die Wortart
der ganzenZusammensetzung festlegt ( Dudenredaktion 1998, S. 432).
Anderegebräu hli heBezei hnunge nfürBestimmungsgliedundGrundwortsindent-
IndergenerativenGrammatikwirdeineandereTerminologieverwendet.Sowirddas
GrundwortalsKopfbezei hnetunddasBestimmungsworteinfa halsNi ht-Kopf.Als
Kopfbezei hnet manimAllgemeinen deneinfa herenTeil eineskomplexenGebildes
X, der die grammatis hen Eigens haften von X bestimmt (vgl. Sternefeld 2004,
S. 5).
DerWortbildungsprozess,derzuderEntstehungvonKompositaführt,heiÿtKompo-
sition.Ei hinger(2000, S.71) bezei hnet dieKomposition alsviellei ht zentralste
Artder Wortbildung.
Beide Bestandteile sind in der Regel ebenfalls wortfähig und innerhalb des Kom-
positums ni ht umstellbar (auÿer bei den wenigen Kopulativkomposita) , da auÿer
der Wortart au h diesemantis heKlasse dur h dasGrundwort bestimmt wird (vgl.
Dudenredaktion 1998, S. 432). Deuts he Komposita werden anders als z. B. in
der englis hen Spra he traditionell zusammenges hrieben, was eine Konstituenten-
analysezusätzli h ers hwert.
Die beiden UK 2
können entweder in einer Beziehung der Unter- bzw. Überord-
nung stehen (Subordination), oder sie können glei hgeordnet sein (Koordination).
Im ersten Fall handelt es si h um Determinativkomposita, im zweiten Fall um Ko-
pulativkomposita ( Fleis her und Barz1995, S. 45).
Laut Dudenredaktion(1998, S. 481)spri ht manvonKopulativkomposita,wenn
beideGliederdesKompositumsderglei henBezei hnungsklasseangehören,einander
glei hgeord net sind und wenn die Reihenfolge der Glieder theoretis h vertaus hbar
ist.
DieMögli hkeit, Kopulativkomposita zu bilden, die von der Syntax mit ihren vie-
len Kopulativkonstruktionen her eigentli h sehr nahe liegt, wird im Deuts hen we-
niggenutzt (0,4%; ohne dieNamensverbindungen). Die Bildungensind gröÿtenteils
dasErgebnis einer sehr bewussten Spra hprägung Einzelner. Inder Gemeinspra he
herrs ht eindeutig die Zusammensetzung vom Typ des Determinativkompositu ms
vor ( Dudenredaktion 1998,S. 481).
Determinativkomposita werden von der Dudenredaktion (1998, S. 482)au h als
Haupt-undGrundtypderSubstantivzusammensetzungenbezei hnet.Im Gegensatz
zumKopulativkompositum führteine Verstellungder Glieder zu einer Bedeutungs-
veränderung. Im Unters hiedzu den Kopulativkomposita, diefast immer aus zwei
Lexemenbestehen,tretenbeiDeterminativkompositahäugau hZusammensetzun-
gen alsGrund- oder Bestimmungswörter auf ( Dudenredaktion 1998,S. 482).
VorallembeimSubstantivist dasDeterminativkompositum amhäugsten.Eswird
sogar angezweifelt, ob die im Verglei h so seltenen Kopulativkomposita überhaupt
in stabiler Formexistieren ( Ei hinger 2000,S. 117).
2
UK = Unmittelbare Konstituenten: die beiden Konstituenten, aus denen eine Konstruktion
unmittelbargebildet istund in diesie si h aufder nä hstniedrigeren Ebene zerlegen lässt. (vgl.
Andersalsbeisyntaktis hen Fügungenund ihren Konstituenten werdenBeziehun-
genzwis hendenKompositionsglie dernni htdur hFlexiveangezeigt ( Glü k2000,
S. 361). Es ndet also übli herweise keine innere Flexion statt, zu einigen wenigen
Ausnahmenexistieren äquivalente Formen ohne innere Flexion.
1.3 Komposita na h Wortart des Grundwortes
AndieserStelle werdendieKomposita na h der Wortart desGrundwortesbzw. des
Zweitgliedes eingeteilt. Fast alle Wortartenbilden Komposita, an dieser Stelle wer-
den jedo h nur die Substantive, Adjektive und Verben bespro hen. Bei den übrigen
Wortarten sind die Komposita überwiegend lexikalisiert und oftmals nur s hwierig
von Zusammenrü kungen zu unters heiden.
EineandereBetra htungsweisederKomposita,diedasErstglied indenVordergrund
stellt, wird in Kapitel 1.6 angewendet. Den Stammparad igmen werden Kompositi-
onsparadigmen zur Seite gestellt. So wird neben der Flexionsstammform und der
Derivationsstammform au heine Kompositionsstammform angenomme n.
1.3.1 Nominale Komposita
Substantivis he Komposita sind unter Verwendung von Einheiten aller Wortarten
als Erstglied bildbar; au h Adverbien, Präpositionen, Konjunktionen und sonstige
Partikeln können dabeiVerwendung nden.Stark ausgeprägt ist dieDeterminativ-
kompositionauszweisubstantivis henUK,währenddiekompositionelleVerbindung
vonUKbeimAdjektivundno hmehrbeimVerbwenigerentwi keltist.Beträ htli h
stärker alsbei den anderen Wortarten ist au hdie polymorphemis he Komposition
(mitvier undmehr Grundmorphemen) vertreten ( Fleis her und Barz 1995,S.
84).
Na h der Klassizierung aufgrund der Wortart des Zweitgliede s können die Kom-
posita na h der Wortart des Erstgliedes subklassiziert werden. Hier werden einige
besonders häuge Typen kurzvorgestellt.
•
DerTypSubstantiv+Substanti v:Laut Dudenredaktion(1998, S.483)stel- len Bildungen desTyps Substantiv+Substanti v vier Fünftel aller Substantiv-komposita dar.Beispiele: Gartentor,Kinderges hrei,Armbanduhr
Hierbei können beide unmittelbaren Konstituenten sowohlSimplizia als au h
komplexe Substantive sein.
•
Der Typ Adjektiv(Partizip)+Su bstant iv: Der Anteil dieser Substantivzusam- mensetzungen liegtbei6%. Das Bestimmungswortwird im Allgemeinen ohneFugenelement mitdemSubstantivverbunden.Eskommenau hZusammenset-
zungen mit Superlativformen als Erstglied vor. Beispiele: Kleinkind, Hö hst-
preis,Gebrau htwagen
•
Der Typ Verb+Substantiv: Der Anteil dieses Strukturtyps beträgt je na h Textart510%.Esistuntersyn hronerBetra htungsweiseni htimmermögli heinverbalesErstglied von einem substantivis henVerbalabstraktum zuunter-
s heiden. In sol hen Fällen sind beide Interpretatione n zutreend. Beispiele:
S hreibmas hine,Mis hgetränk, Lebewesen
•
Der Typ Adverb/Partikel/Präpositi on+Substant iv: Bei diesem Strukturtyp werden Zusammensetzungen mit exionslosen Wörtern als Erstglied zusam-mengefasst.BesondersZusammensetzungenmitPräpositionensindhäug.Bei-
spiele: Vorstadt, Nebenzimmer ,Unterangebot,Sofortprogramm
AuÿerdenvorgestelltenStrukturtypentretenau hweitereStrukturenalsErstglieder
auf,die ni ht einfa h als Wortartenklassiziert werdenkönnen.Unter Verwendung
desDur hkopplungsbindestri hs könnenEigennamen, Wortgruppen undau hganze
Sätzeals Erstglied verwendetwerden (vgl.Fleis her und Barz1995, S. 122).
1.3.2 Adjektivis he Komposita
Ähnli hwiebeiSubstantivensindbeiadjektivis henKompositaprinzipiellalleWort-
artenalsErstglied mögli h, do hnebenSubstantiven,AdjektivenundVerben treten
andere Wortarten kaum auf. Kopulativkomposita sind bei Adjektivzusammenset-
zungen häuger als bei Substantiven (vgl. Fleis her und Barz 1995, S. 225).
Komposita mit partizipiale m Zweitglied werdenlaut Fleis her und Barz (1995,
S.241)ebenfallszuderGruppeder Adjektivzusammensetzungengezählt.Au hhier
können vers hiedeneStrukturtypen bes hrieben werden:
•
DerTypSubstantiv+Adjektv: Adjektivkomposita mit substantivis hemErst- glied sinddur hweg Determinativkomposita. Beispiele: knietief, ofenwarm,al-terss hwa h
•
Der Typ Adjektiv+Adjektiv: Hier kommen sowohl Determinativkomposita (Beispiele: s hwerkrank, dünnüssig) als au h Kopulativkomposita (Beispiele:taubblind, süÿsauer) vor.
•
DerTypVerb+Adjektiv:LautFleis herund Barz(1995,S.247)istdiead- jektivis heKompositionmit verbalemErstglied im stetigen Ausbaubegrien.Besonders in te hnis hen Texten treten sol he Konstruktionen auf. Beispiele:
tragfähig, röstfris h, triefnass
1.3.3 Verbale Komposita
DieKompositionistbeiderBildungderVerbenwenigerrelevantalsbeiSubstantiven
undAdjektiven.Verbzusammensetzungensindstetszweigliedrigundtrennbar,wobei
sie im Innitiv, in der Partizipialform und bei der Endstellung im Nebensatz ni ht
getrennt ers heinen (vgl. Dudenredaktion 1998, S. 448). Man unters heidet au-
ÿerdemdiesogenannten Pseudokompositavondene htenVerbzusammensetzungen.
Optis h handelt essi h um Komposita, beieiner dia hronis hen Betra htungsweise
ergibt si hjedo h, dassdiese Pseudokomposita eigentli h Ableitungen ausSubstan-
tiven darstellen, z. B. wehklagen aus Wehklage. Diese Pseudokomposita sind ni ht
trennbar (vgl. Dudenredaktion 1998,S. 449).
•
DerTyp Substantiv+Verb: Nebenden oben genannten Pseudokomposita gibt esau hvereinzelteVerbindungenausSubstantivundVerbna hArtderZusam-menrü kungen (vgl. Dudenredaktion 1998, S. 449). Beispiele: standhalten,
teilnehmen
Verben,die dur h ein substantivis hes Erstglied näher bestimmt werden, tre-
ten in te hnis hen Texten auf.Sol he Konstruktionen sind jedo h selten (vgl.
Dudenredaktion 1998,S. 450). Beispiele:punkts hweiÿen, feuerverzinken
•
DerTypAdjektiv+Verb:VerbindungenmitAdjektivenalsErstgliedsindhäu- geralsverbale ZusammensetzungenmitSubstantivenoder Verben.Siewerdentraditionellzusammenges hrieben(vgl.Dudenredaktion1998, S.450).Bei-
spiele: freis haufeln,heiÿlaufen, ho hstapeln
•
Der Typ Verb+Verb: Bei den Verben sind die sonst so häugen Zusammen-setzungen von Wörtern der glei hen Wortart kaum übli h. Allenfalls in der
expressionistis hen Di htung und in te hnis hen Texten nden si h Beispiele.
Die Einteilung in Kopulativ- und Determinativkomposita ist hier ni ht ein-
fa h.ImAllgemeinensinddielyris henFormeneherkopulativ,diete hnis hen
Ausdrü keeherdeterminativ(vgl.Dudenredaktion1998,S.450).Beispiele:
grinsheu heln , spritzlöten
Auÿerdem treten no h Zusammensetzungen von Innitiven auf, die übli her-
weiseaufdieZweitgliede rbleiben ,lassen undlernenbes hränktsind(vgl.Flei-
s herundBarz1995,S.296).DieseFormenwerdenna hderRe hts hreibre-
formgetrennt ges hrieben,ehemals war dieZusammens hreib ung übli h.
Bei den verbalen Komposita ma ht die Getrennts hreibung der niten Formen es
nötig, si hallein aufdie inniten zusammen ges hriebenen Formen zu bes hränken.
Finite Formen kommen im Textuss vor, wo deren Konstituenten mehrere Wörter
weitvoneinanderentferntpositioniertseinkönnen.DieErkennungsol herElemente
istau h vomStandpunkt der Syntax auskeintrivialesProblem.
1.4 Sonderfälle
WieesoftbeiderUntersu hungspra hli herPhänomen ederFallist,gibtesau him
Berei hderWortbildungundspeziellbeiderKompositionAusnahmen,diesi hni ht
denherausgearbeit etenallgemeinenRegelnunterwerfenwollen.Teilweiseistesni ht
einfa h eindeutige Bes hreibungen anzugeben, da vers hiedene Quellen ni ht selten
vers hiedener Ansi ht sind, wie bestimmte Ers heinunge n zu interpretieren sind.
EinigedieserAusnahmenwerdenandieserStelleinKürzebespro hen.DiePossessiv-
komposita heben si h strukturell ni ht von den normalen Determinativkomposta
ab,entspre henaberni htderensemantis henEigens haften.BeiZusammenrü kun-
genundZusammenbildunghingegen handeltessi hum Grenzfälleder Komposition
mit anderenWortbildungsarten.
1.4.1 Possessivkomposita
Possessivkomposita sind na h Glü k (2000, S. 539) exozentris he Komposita, die
zwar wortsyntaktis h dem Determinativkompositum entspre hen, semantis h aber
keine Untergruppe der im Grundwort bezei hneten Einheit bilden, so ist z. B. ein
LangbeinkeinlangesBein,sonderneinePersonmitlangenBeinen.Possessivkomposi-
tatretenhauptsä hli halsPersonen-,Tier-undPanzenbezei hnungenaufundsind
nur no hingeringemMaÿe motiviert.Mankannbeiden Possessivkompositaanneh-
men, dass ihr Bestand lexikalisiert ist und okkasionale Bildung eher selten, obwohl
prinzipiell mögli h sind. Mehr zur Handhabung lexikalisierter Zusammensetzungen
unter 1.5.1.
1.4.2 Zusammenbildungen
Laut Glü k (2000, S. 812)handeltessi hbeiden Zusammenbildungen um Grenz-
fällezwis henAbleitungundKomposition,beidenendieWortbildungstruktur ni ht
eindeutigist. Sokann z.B. Autofahrer als Zusammensetzunggesehen werden( auto
+ fahrer)oder als Ableitung( autofahren+ -er).
Erben (2000, S. 35) bezei hnet Zusammenbildungen als besondere Art der Ablei-
tung,woeineWortgruppealsBasiseinersuxalenAbleitungdient.Ein Komposita-
Charakterwird ausges hlossen.
VonInkorporation dagegenspri ht Ei hinger(2000,S. 136)und meint damit eine
allmähli he Univerbierungvon Elementen, diein der syntagmatis henAbfolge eines
Satzesnebeneinander stehen.DamitgrenztEi hingerdieZusammenbildungenvon
den Komposita ab, da das vermeintli he Grundwort einer Zusammenbildung ni ht
als eigenständiges Lexem auftritt. Vielmehr wird eine Art substantivis hes Sux
angenomme n. Bei Adjektiven ist die Argumentation ähnli h, au h wenn in diesem
Fall dieInterpretation alse htesKompositum häugermögli h ist.
FürdieZwe kedieserArbeitistdieSi htweisevonEi hingerdienützli hste.Sofern
dieseuneigenständig enSubstantiv-SuxekeinenLexem harakterhaben,werdensie
imLexikonunddamitbeiderSegmentierungni htberü ksi htigt(siehe1.5.1).Somit
werdeneventuelle Zusammenbildungen au hni ht fäls hli h alsKomposita erkannt.
Ist ein Sux im oben genannten Sinne denno h im Lexikon enthalten, handelt es
si h um ein homonymes Lexem, womit eine Interpretation als Kompositum wieder
legitimist.
1.4.3 Zusammenrü kungen
Als Zusammenrü kungen bezei hnet Erben (2000, S. 34) einen Sonderfall der Zu-
sammensetzung, wo eine syntaktis he Gruppe unter Beibehaltung der Wortfolge
undeventuellerexivis herRelationsmorphemezueinemWortbzw.einemKompo-
sitionsgliedeinesneuenWorteszusammengerü kt wird,z.B.Brave-Mäd h en-Image
alsKompositum ausZusammenrü kungund Substantiv.
Ei hinger (2000, S. 31) würde Formen wie z. B. Vergiÿmeinni ht am liebsten in
den Berei h der Konversion verbannen, sieht sie aber au h ähnli h wie die Zusam-
menbildungen im Umfeld der Inkorporation.Au h Fleis her und Barz (1995,S.
213)argumentier en ähnli h beiSatz- undWortgruppen-Konversionen.
Das obige Beispiel Brave-Mäd h en-Image und au h Graue-Maus-Dasein sind bei
Fleis her und Barz Komposita mit einem Erstglied, das aus einer Wortgruppe
odereinemganzenSatzbesteht,dieBezei hnungZusammenrü kun g wirdhierni ht
gebrau ht.
ImModellmüssensol heBildungenunberü ksi htigtbleiben,dadieErkennungdie-
serFormen alsKompositionsglie d eine satzsyntaktis he Analysenötig ma hen wür-
de. S hlieÿli h können ganze, sogar komplexe Sätze als Zusammenrü kung en vor-
kommen. Die Fälle von Zusammenrü kungen, die als Konversionen erklärt werden
können,entfallenohnehin ausdemKompositionss hema .
1.5 Komposita-Segmentierung und Segment-Tagging
Spra hli he Ausdrü ke,glei hgültig unter wel hem Gesi htspunktman siebetra h-
ten will, sind ni ht als Mengen diskreter Einheiten gegeben, sondern als Kontinua.
Fürvielespra hpraktis he undspra hwissens haftli heManipulationen istesjedo h
sinnvoll,dieKontinuainMengendiskreterEinheiten,nämli hinFolgenvonSegmen-
tenaufzulösen.DasVerfahreneinersol henAuösungheiÿtSegmentieru ng ( Glü k
2000,S. 616).
Deuts he Komposita können trotz ihrer komplexen Struktur alsParadebei spiele für
dieerwähntenKontinuaherhalten.ObwohlsieausmehrerenWörternbestehen,sind
die Grenzen zwis hen den Bestandteilen dur h die Zusammens hreib ung übli her-
weise ni ht markiert. Ein mens hli her Spre her führt ebenfalls eine Segmentierung
dur h, soferndie gesamte Strukturni ht bereits lexikalisiert ist.
Eng mit dem Vorgang der Segmentierung ist das linguistis he Tagging verbunden.
Tagging im weiteren Sinne ist eine Bezei hnung für eine in der Regel automati-
s he Annotation von Spra hdaten . Unter Tagging im engeren Sinne wird speziell
die Annotation von Wortformen in einem laufenden Text mit Wortartenkategorien
verstanden. (vgl.Glü k 2000, S. 720)
Taggingin Verbindung mitderSegmentierungvonKompostiabedeutetdieAnnota-
tionderidentiziert enSegmentemitgrammatis henDaten,dieimLexikonenthalten
sind.
Im Folgenden werden vor allemdielinguistis henGrundannahme n bes hrieben,die
mit der Segmentierung und dem ans hlieÿenden Tagging verbunden sind. Wie die
Vorgänge im Modell implementiert werden, wird in Kapitel 3 bespro hen. Wei-
terhin wird an dieser Stelle die zentrale Rolle des Lexikons für die erfolgrei hen
Segmentierungs-und Taggingproz esse dargelegt.
1.5.1 Denition des Segmentbegries
WillmannuneineSegmentieru ngeinesKompositumsdur hführen,musszuerstfest-
gelegt werden, wel hen Charakter die gesu hten Segmente haben sollen. Bei mor-
phologis hen Konstituentenanalysen werden Wortbildungsprodukte auf Morpheme
zurü kgeführt, wobeiGrundmorpheme alsau h reineWortbildungsmorp heme (Prä-
xe, Inxe, Suxe) bestimmt werden. Für den Zwe k dieser Arbeit ist eine der-
art weitgehende Analyse unnötig, wenn ni ht sogar kontraproduktiv, da es s hon
s hwierig genug ist, aufgrund der Kompositionsglie der die Gesamtbedeutung eines
Kompositums zuers hlieÿen.EinetiefereAnalyse mussni htunbedingt einehöhere
Dur hsi htigkeitzur Folgehaben.
Bei Komposita können die beiden Kompositionsglie der, wie bereits erwähnt wurde,
entwederausSimpliziaoderwiederum komplexenWortbildungsprodukten bestehen,
die sowohl Ableitungen und Konversionsergebnisse (vgl. Ei hinger 2000, S. 116)
alsau hZusammensetzungenseinkönnen.TrotzdieservielfältigenMögli hkeitenist
allen Kompositionsglie dern der Wort harakter gemeinsam.
NimmtmannundasWortalsSegmentan,isteinKompositionsglie d,dasni htselbst
auseinem Kompositum besteht,ni htweiteranalysierbar.Die Segmentierungendet
hier. Handelt essi h beidemKompositionsglie dum einweiteres Kompositum, kön-
nenwiederzweiWörteridentiziertwerden.DieserProzesswirdsolangewiederholt,
biskeine weiterenSegmentieru ngss hritte mehrdur hgeführt werden können.
Es stellt si h allerdingsdie Frage, ob eine sol he Analyse ni ht immerno h zu weit
geht.Bei motivierten und dur hsi htigen Konstruktionen ist eine genauere Analyse
si her sinnvoll, mit zunehmender Idiomatisierung nimmt der Nutzen jedo h ab, da
dieBedeutung gar ni ht oder kaumausden Bedeutungender Gliedergefolgert wer-
den kann.Dur h Idiomatisierung entsteht dieNotwendigkeit, komplexe Ausdrü ke
ins Lexikon einer Spra he aufzunehmen ( Glü k 2000, S. 285). Ist eine Zusam-
mensetzung erst einmal lexikalisiert, kann man si h die Konstituentenanalyse, die
ja letztendli h der Bedeutungsers hlie ÿung dienen soll,sparen, denn dieBedeutung
kannin diesem Falleinfa h na hges hlagen werden(vgl. Ei hinger2000,S. 10).
IndieserArbeit wird alsoeineKomposita-Segment ierung vorges hlagen, diesi han
der OppositiondesBegrispaareslexikalisiert/ni ht-lexikalisie r torientiert. Einähn-
li hesVorgehenwird au hbeiRa kow et al.(1992, S. 2) bes hrieben.Die weite-
re Segmentieru ng eines bereits identiziert en Segmentes kann abgebro hen werden,
wenn dasSegment trotz seinerweiterhin komplexen Strukturlexikalisiertist.Alter-
nativdazukanndieSegmentieru ngau hfortgesetztwerden.Dasowohlderkomplexe
Ausdru kalsau hdessenSegmenteimLexikonenthaltensind,werdenindiesemFall
einfa hbeideInterpretationenwiedergegeben.MankanndieseInterpretatione ndann
alsstrukturelle Mehrdeutigkeiten betra hten (siehe1.5.3).
Nun muss no h geklärt werden, wie die Lexikalisierung eines komplexen Ausdru ks
festgestelltwerdenkann.ImFalleeinesmens hli henSpre hersistdieseinfa h:kennt
erdieBedeutungeineskomplexenAusdru ks,ohnedasserdessenKomponentenana-
lysierenmuss, ist dieserAusdru klexikalisiert. Für dasin dieserArbeit entwi kelte
Finite-State-Modell kann ähnli h verfahren werden. Ist einkomplexer Ausdru kals
Ganzesim Lexikon desModells gespei hert, gilt dieserAusdru kals lexikalisiert.
Dieskann manaufalle Wörter erweitern. Ein Wortist lexikalisiert bzw. einLexem,
wennesimLexikonenthaltenist.AlsReferenz-LexikondientdasimModellintegrier-
te Lexikon.Umgekehrt wird ein Wort, dasni ht im Lexikonenthalten ist,markiert
mit derEigens haft ni ht-lexikalisiert.In diesemFall wird eineweitereSegmentie-
rung versu ht, wie sie oben bes hrieben wurde. Hinzu kommt no h der Fall, dass
einkomplexer Ausdru kni htlexikalisiertistundau hdieSegmentieru ngkeinewei-
teren Segmente im Lexikon nden kann.
3
In diesem Fall ist die Segmentieru ng des
komplexen Ausdru kesges heitert. Ein Segment wird nur als sol heserkannt,wenn
eslexikalisiert ist.
Daraus ergibt si h nebenbei au h eineeinfa he Denition vonOkkasionalismen. Ist
ein Wort ni ht lexikalisiert, kann aber gemäÿ des verwendeten Lexikonsin Lexeme
zerlegtwerden,handeltessi humeineerfolgrei hidentiziert eokkasionaleBildung.
Im Falle der Komposita ist eine sol he Segmentde nition jedo h no h ni ht völlig
zufriedenstellend . Sie lässt nämli h die Fugenelement e auÿer a ht. Zwar werden sie
demErstglied der Komposition zugere hnet , können aber kaumals Bestandteile ei-
nesLexemsbetra htetwerden,dasieoftgenugni hteinmaldemFlexionsparadigma
3
dermitihnenverbundenenLexemeentspre hen(vgl.Erben2000,S.64).Erstre ht
ni ht können sie selbst als eigenständige Lexeme gewertet werden. Im Allgemeinen
werdensieni hteinmalalsMorphemebetra htet, dasieauÿerbeieinigenFällenvon
vermeintli her Pluralmar kierung semantis h leer sind (vgl. Fleis her und Barz
1995, S. 137). Einfa h ignorieren kann man sie jedo h ni ht, da eine omputerge-
stützteSegmentierung an diein einerZei henkette vorhandenen Symbolegebunden
ist.Auÿerdem können sie,wie später no h dargelegt wird, trotz ihrer semantis hen
Leereaufgrund ihrerdistributivenEigens haften vonNutzen sein.
Es ist in diesem Fall am einfa hsten, diese Fugenelement e ebenfalls als mögli he
Segmente zu betra hten. Au h die Fugenelement e sind lexikalisiert in dem Sinne,
dass sieim Lexikon desModellsenthalten sind. EineAufnahme der Fugenelement e
ins Lexikon ist dagegen aus Implementationsgründen sinnvoll, da der Segmentie-
rungsprozessZei henkettenanalysiert unddiese aufgrunddesLexikonsidentiziert .
SowohlLexemealsau hFugenelemente stellen mögli he Segemente darund sindzu
allererst Zei henketten. Erst dur h den Verglei h mit dem Lexikon, der Zei hen für
Zei henvorgenommenwird,kanneineUnters heidungvonLexemundFugenelement
stattnden.
1.5.2 Das Lexikon und linguistis hes Tagging
Mit der Segmentierung allein ist es no h ni ht getan. Die Segmente müssen lin-
guistis h annotiert werden, damit eine weitere Verarbeitung mögli h ist. Während
die Segmentieru ng das Lexikon als Bestandsaufnahme von potentiellen Segmenten
auasst, werden dur h dasTagging die im Lexikon einzelnen Einträgen zugeordne-
ten Informationen den identiziert en Segmenten angefügt. Das Lexikon ist also für
beide Vorgänge, Segmentierung und Tagging, grundlegend. Diesbedeutet, dassdas
Modelllexikon mindestenszweiArten vonDaten enthalten muss:
•
Repräsentationen der einzelnen Lexemeals Zei henketten. Diesesind notwen- dig,umdiegesu hten Segmente überhauptidentizierenzukönnen.DieBu h-stabenfolgen eines unsegmentierten komplexen Wortes müssen mit den Bu h-
stabenfolgen der Lexikoneinträge vergli hen werden können. Die Art wie die
Gesamtheit der Lexikoneinträge organisiert ist, wird au h als Makrostruktur
desLexikons bezei hnet (vgl. Carstensen et al. 2001, S. 397). Wie genau
das mögli hst ezient mit Hilfe von Finite-State-Mitteln umgesetzt werden
kann, wird später bei der Modellierung des Lexikons ausführli h bespro hen
(siehe3.1.1).
•
Informationen, diedie einzelnen Lexeme linguistis h kategorisieren. Dies sind dieDaten,diedur h dasTagging den Lexemenihre grammatis he Bedeutungverleihen. So werden in diesem Modell hauptsä hli h Informationen bezügli h
Wortart undFlexionsklasseverwendet. Eswerdenau h wortartspezis he Da-
ten annotiert, wie z. B. Genus beim Substantiv. Man spri ht hier au h von
der Mikrostruktur eines Lexikons bzw. eines Lexikoneintrags (vgl. Carsten-
sen et al.2001, S. 398). EineMenge von grammatis hen Informationen,die
zu einer Interpretation eines Eintrages gehören, werden au h als Tagsets be-
zei hnet. Einem Eintrag, der lexikalis h mehrdeutig ist, sind mehrere Tagsets
zugeordnet.
DabeideVorgängeabhängigsindvonbestimmten Su hprozessenimLexikon,bietet
si heineparalleleAnwendungvonSegmentieru ngundTaggingan.WirdeinSegment
identiziert ,wird esdirektmit denentspre henden Lexikoninformationenannotiert,
undni hterstna hdemalleSegmentegefundenwordensind.AufdieseWeisewerden
Mehrfa haufrufe derselben Einträge verhindert. Das Ergebnis einer Segmentierung
eines komplexen Wortes mit parallelem Tagging ist eine Menge identiziert er Seg-
mente mit entspre henden grammatis hen Annotationen.
1.5.3 Lexikale und strukturelle Ambiguität
BeiGlü k (2000,S. 37) wird Ambiguität(au h Ambivalenz, Mehrdeutigkeit, Viel-
deutigkeit)unterzweiGesi htspunktendeniert.Laut dererstenAuassungistAm-
biguitäteinegrundlegend eEigens haft der meistenLexeme, Derivations-undFlexi-
onsmorphemeineinerektierendenSpra hewiedemDeuts hen.DieMehrdeutigkeit
derLexemewird inderWortbildungteilsdisambiguiert,teilsvermehrt.Dieselexika-
lis he Ambiguität wird in der europäis hen strukturellenSemantik als Homonymie,
Polysemie und Multisemieuntersu ht.
Die zweite Auassung bezei hnet Ambiguität auf der Ebene der Syntax als Eigen-
s hafteineskomplexenZei hens,aufgrundunters hiedli h erStrukturbes hreibungen
mehrals eineInterpretationzubesitzen. IndiesemSinne unters heiden si hambige
Ausdrü ke von polysemen, wel he als mehrdeutig aufgrund von ni ht-strukturellen
Faktoren verstanden werden. Die in dieser Arbeit als strukturelle Ambiguität be-
zei hnete Art der Ambiguität hat ihren Grund dementspre hend in der Mehrdeu-
tigkeit der grammatis hen Strukturzusammen hänge und Formkennzei hnungen. Da
komplexeZei hen ni ht nur aufsyntaktis her Ebene auftau henundKomposita ein-
deutig komplex sind, kann diese Auassung au h auf die Strukturbes hreibungen
von Komposita angewendetwerden.
WährenddesSegmentieru ngsvorga ngeseinesKompositiumskönnenprinzipiellbeide
Arten von Ambiguität auftreten. Lexikalis he Ambiguität ist gegeben, wenn einem
identiziert em Segment mehrere Einträge im Lexikon entspre hen. Da in dem ver-
wendetenLexikonkeinesemantis henInformationenkodiertsind,handeltessi hhier
immerum Artender Homonymieundni ht der Polysemie.Die Einträgeunters hei-
densi haufgrundeinzelner oder au hmehrerer grammatis her Eigens haften wiez.
B.Genus ( dieKiefer der Kiefer) oder vers hiedenenPluralformen ( Bank : Bänke
Banken), wobei in beiden Fällen unters hiedli h e Flexionsklassen annotiert sind.
Lexikalis heMehrdeutigkeittrittalsobeimTaggingderidentiziert enSegmenteauf.
Strukturelle Ambiguität kann unabhängig vom Tagging allein dur h die reine Seg-
mentierunggegebensein.KönnenzumBeispielmehrerealternativeZerlegungeneines
Kompositums aufgrund vers hiedener Morphem- oder Segmentgrenzen ausgema ht
werden,müssenbeideSegmentierungenakzeptiertwerden,sofernni htandereKrite-
rienzur Disambiguierungangewendetwerden. Ein Beispielfür eineni ht-eindeutige
SegmentierungistdasKompositumDru kerwartung. Eskannsegmentiertwerdenin
zweivorerstni ht annotierteStrukturen:
(1) dru ker + wartung
(2) dru k + erwartung
Vermutli h istLesart (1)diewahrs heinli here von beiden, denno h kann Lesart(2)
ni hteinfa hignoriert werden,da sie prinzipiellmögli hist. Hinzukommt,dassder
Segmentierungsme hanismus über keine Informationen über die Wahrs heinli hkeit
bestimmter Lesartenverfügt.
No huneindeutig erwirddasErgebnisdesAnalyseprozesses,wennsowohllexikalis he
als au h strukturelle Ambiguität vorliegt. Werden die beiden Segmentieru ngsvor-
s hläge von Dru kerwartung entspre hend annotiert, ergeben si h weitere Lesarten.
So kann dru k sowohl als Substantiv (z. B. im Sinne von psy his hem Dru k) als
au h als Verbstamm (der Vorgang des Dru kens) interpretiert werden. Es ergeben
si h also dreiLesarten:
(1) dru ker (N) + wartung (N)
(2) dru k (N) + erwartung (N)
(3) dru k (V) + erwartung (N)
Jede dieser Lesarten könnte man wiederum als lexikalis he Mehrdeutigkeit des ge-
samten Zei hensDru kerwartung betra hten, dienur dur h dieEinbettung in einen
Kontext disambiguiert werden könnte. Zum Beispiel wird in einer te hnis hen Ge-
räteanleitung wohlnur dieLesart (1) akzeptiert. Tatsä hli hsind diesLesarten, die
alle alsgrammatis he korrektakzeptiert werdenmüssen.
AndieserStellewurdenjedo hno hkeineDisambguierungsme hanismenvorgestellt,
die fals he Lesarten, die ebenfalls auftau hen können und werden, eliminieren . Ein
naiverAlgorithmus,der Segmentieru ngundTaggingnur aufgrundder Lexikoninfor-
mationendur hführt, wird mehr (fals he) Lesartennden.
(1) dru ker (N) + wartung (N)
(2) dru k (N) + erwartung (N)
(3) dru k (V) + erwartung (N)
(4)* dru k (N) + er (I) + wartung (N)
(5)* dru k (V) + er (I) + wartung (N)
Da Fugenelement e (hier mit (I) für Interx bezei hnet) ebenfalls im Lexikon ent-
halten sind, werden die Lesarten (4) und (5)erkannt. Erst distributive Regeln von
MorphemenundFugenelement enkönnensol hefals henSegmentierungen auss hlie-
ÿen.
So würde Lesart (4) ausges hlossen werden, sobald berü ksi htigt wird, dass si h
wenn überhaupt nur Substantive, dieimPlural dieEndung -er aufweisen,mit dem
Fugenelement-er-verbinden.Lesart (5)entfällt,wennmandieRegelanwendet,dass
Verbstämmeübli herweise ohneFugenelement stehenodermit -e-in einigenFällen.
Mehrzur Verwendung vonRegularitätenander Kompositionsfugezur Disambiguie-
rung vonSegmentationsergebnissen unter1.6.4.
Au h als ein Fall von struktureller Ambiguität kann der bereits erwähnte Sa hver-
haltbetra htet werden, wenn Komposita als Ganzesim Lexikon enthalten sind, die
eigentli h no hweitersegmentiertwerdenkönnten undparallel au hweiter segmen-
tiertwerden.
(1) reise (N) + s hreibmas hine (N)
(2) reise (V) + s hreibmas hine (N)
(3) reise (N) + s hreib (V) + mas hine (N)
(4) reise (V) + s hreib (V) + mas hine (N)
Solange no h keine Disambiguierung stattgefunden hat, kann die Anzahl aller (in-
klusive dergrammatis h fals hen) Lesarten mithilfederfolgenden Formelbere hnet
werden:
Anzahlder Lesarten
=
|S g |
X
i=1
|S Y i |
j=1
|s i,j |
Hier steht
s i,j
(woj = 1, 2, . . .
) für ein einzelnes Segment und|s i,j |
für die Anzahlder lexikalis hen Ambiguitäten dieses Segments.
S i
(woi = 1, 2, . . .
) ist die MengeallerSegmente
s i,j
, diezueinerSegmentierungsart 4gehören.
|S i |
istdieAnzahlderSegmente einerSegmentierungsart
S i
.Seik = |S i |
,dannistS i = {s i,1 , s i,2 , . . . , s i,k }
. Die Inde es der Segmente entspre hen der Reihenfolge der Segmente.
S g
ist dieMenge aller vers hiedenen Segmentieru ngsart en
S i
und|S g |
ist die Anzahl dieserSegmentierungsarten. Sei
n = |S g |
dann istS g = {S 1 , S 2 , . . . , S n }
.DieAnzahlderLesartenvonDru kerwartung bere hnet si hdemna hbeispielsweise
wie folgt:
S g =
S 1 = {s 1,1 = drucker , s 1,2 = wartung }, S 2 = {s 2,1 = druck , s 2,2 = erwartung }, S 3 = {s 3,1 = druck , s 3,2 = er , s 3,3 = wartung }
|s 1,1 | = 1 |s 1,2 | = 1
|s 2,1 | = 2 |s 2,2 | = 1
|s 3,1 | = 2 |s 3,2 | = 1 |s 3,3 | = 1
4
AlsSegmentierungsartwirddie reineSegmentierungohne Tagging bezei hnet.ZweiSegmen-
tierungsartensindglei h, wennalleSegmentgrenzen übereinstimmen.BeiderSegmentierung von
Dru kerwartung gehörenLesarten(2)und(3)zueinerSegmentierungsartsowieLesarten(4)und
|S g |
X
i=1
|S Y i |
j=1
|s i,j | =
3
X
i=1
|S Y i |
j=1
|s i,j |
=
|S 1 |
Y
j=1
|s 1,j | +
|S 2 |
Y
j=1
|s 2,j | +
|S 3 |
Y
j=1
|s 3,j |
=
2
Y
j=1
|s 1,j | +
2
Y
j=1
|s 2,j | +
3
Y
j=1
|s 3,j |
= |s 1,1 | · |s 1,2 | + |s 2,1 | · |s 2,2 | + |s 3,1 | · |s 3,2 | · |s 3,3 |
= 1 · 1 + 2 · 1 + 2 · 1 · 1
= 1 + 2 + 2
= 5
Die Segmente
s 2,1
unds 3,1
haben jeweilszweilexikaleDeutungsmögli hkei t en. Alle übrigen Segmente haben jeweils eine lexikale Deutungsmögli hkei t . Die Anzahl derLesarten einer Segmentierungsart ist glei h dem Produkt der lexikalen Deutungs-
mögli hkeiten aller Segmente dieserSegmentierungsart. Für
S 1
gibtalso genau eineLesart(
1 · 1
).FürS 2
gibtesdemna hgenau zweiLesarten(2 · 1
)undfürS 3
ebenfallszweiLesarten(
2 · 1 · 1
).Ans hlieÿend wird dieAnzahl der LesartenallerSegmentie- rungsarten summiert. Insgesamt gibt es also fünf Lesarten. Wie gesagt, handelt essi h hier um naive Lesarten, die ni ht linguistis h bereinigt sind. Die letztendli h e
Anzahldergrammatis hkorrektenLesartenlässtsi hni htanhandderKombinatio-
nenvonlexikaler undstrukturaler Ambiguität bere hnen.Es istprinzipiell mögli h,
dassalle,einigeoderkeineLesartenkorrektsind. SinddieInformationenimLexikon
unvollständig,bedeutetdies,dasseinigeunterUmständenkorrekteLesartenerstgar
ni htgefunden werden.
1.6 Die Kompositionsfuge
Die Morphemgrenze zwis hen den Konstituenten einer Wortbildungskonstruktion
wird als Fuge bezei hnet (vgl. Fleis her und Barz 1995, S. 136). Unters hie-
den wird dabeizwis hen Derivations- undKompositionsfuge, wobei an dieserStelle
auss hlieÿli hdieKompositionsfugebehandelt wird. An der Kompositionsfugekann
eszuvers hiedenen Ers heinungen kommen.So können bestimmte Elemente entwe-
der getilgt oder andere Elemente hinzugefügt werden. Die hinzugefügten Elemente
werdeninder entspre henden LiteraturalsFugenelement eoderInterxebezei hnet.
Langer(1998, S.3) verwendeteineandere Terminologie alsdiegemeinhinübli he,
daseiner Meinungna h dieBezei hnung Fugenelement oder Interx daraufhindeu-
zum Erstglied gezählt werden (siehe unten), bilden sie zusammen mit dem Erst-
glied die Kompositionsform des Erstglieds. Von der Kompostionsform ausgehend
bezei hnet LangerdieFugenelement ealsKompositionssuxedesErstglieds.Diese
Bezei hnung ist wohl ni ht weniger problematis h als die übli he, da eine Katego-
risierung als Sux wiederum auf einen Morphem harakter hindeutet, der bei den
Fugenelement en zumindest diskutiertwerdenkann.
Dafür, dass die Fugenelement e dem Erstglied zugere hnet werden müssen, zählt
Fuhrhop (1998, S. 187) drei Argumente auf: Erstens wird das Fugenelement vom
Erstgliedbestimmt.ZweitensstehtdieFormdesFugenelementsimengenZusammen-
hang mit dem Flexionssystemdes Erstgliedes. Drittens verbleibt das Fugenelement
bei Koordinatio n beim Erstglied, wie z. B. bei Frühlings- und Herbsttage . Analog
zu Langer spri ht Fuhrhop von Kompostionsstammformen des Erstgliedes. Als
Kompositionsstammform wird die Form desErstgliedes bezei hnet, dieletztendli h
in die Komposition eingeht. Tritt ein Fugenelement auf, wird eszur Kompositions-
stammformgere hnet.Dieser Begri wird imFolgendenweiterverwende t.
Die Fugenelemente sind überwiegend auf Substantiv- oder Verbstämme als Erst-
glieder bes hränkt. Obwohl die Fugenelemente wie die Flexionsmorpheme der ent-
spre henden Erstglieder aussehen, können sie ni ht als Ers heinungen der Flexion
gewertet werden,damitunterau hFugenelementeintergiertwerden,dieni htzum
Flexionsparadigma des entspre henden Ersgliedes gehören, z. B. Liebesdienst mit
demFugenelement -s- .Ineinigen Fällenkann einFugenelement (oderInterx)no h
den Plural eines Erstgliedes markieren, wenn dieForm mit der Pluralform desent-
spre henden freien Lexems übereinstimmt, aber au h das ist ni ht in allen Fällen
si her. Ni htseltenwirddieFuge aufgrundvon Kompositionsmustern übernommen,
z.B.Strahlenkranz gegenüberTortenstü k vieleStrahlen,aber nureineTorte(vgl.
Dudenredaktion 1998,S. 495).
Beiman henErstgliedernwerdendur hdieFugengestaltungHomonymendierenzie-
rung,Wortartenunters hiedeund au h semantis he Dierenzengekennzei hnet (vgl.
Fleis her und Barz1995, S. 137), z. B. Landesverteidigung und Landebahn, wo
imersten Kompositum Land imSinne vonStaat verwendetwird,währendimzwei-
ten Fallder Verbstamm vonlanden vorliegt. DieseEigens haften wurdenbereitsim
ZusammenhangmitderSegmentieru ngder KompositaerwähntundsindderHaupt-
grund für dieBes häftigungmit den Fugenelement en in dieserArbeit.
Fleis her und Barz erklären die S hwierigkeiten mit der Herausarbeitung von
Regularitäten in der Distribution von Fugenelementen mit dem Widerstreit zweier
Regularitätskonzeptio nen der Orientierung an grammatis hen Regeln einerseits
und der Orientierung an lexikalis hen Mustern andererseits. So kann si h die an
einbestimmtesErstgliedgebundeneFugengestaltunglexikalisierterKompositagegen
grammatis he Regularitäten dur hsetzen.
ObeinFugenelement gesetztwird oder ni ht, hängt lautDudenredaktion (1998,
a) insbesondere von der Wortart desBestimmungswortes,
b) vonseiner morphologis hen Grundausstattung (Flexionsklasse),
) vonseiner Lautstruktur(Umfang,Silbenzahl, Auslaut),
d) von seinerWortbildungsstruktur (davon,ob es si h um ein Simplex, eineAb-
leitungoder eineZusammensetzung handelt)
e) zum Teil au h davon, ob das Kompositum nur eine oder mehrere der im Be-
stimmungswort bezei hnete n Sa hen oder Personen voraussetzt,
f) vonregionalen Bedingungen.
Eine systematis he Bes häftigung mit dem Auftreten der Fugenelemente liefert
Fuhrhop (1998, S. 187220), in der die obigen klassis hen Kriterien genauer un-
tersu ht werdenundna h Funktionender Fugenelement e gefragtwird.
Fuhrhop konzentriert si h ans hlieÿend auf die produktiven Fugenelement e und
su ht na h den Grundlagen der Intuition, mit der Spre her Fugenelement e setzen.
Dieunproduktiven Fugenelement e werdenausdrü kli h ausgespart.
Sowohl Dudenredaktion als au h Fleis her und Barz nennen als Fugenele-
mente -(e)s-, -e- , -(e)n- , -er- und -ens- . Bei Fuhrhop werden die Fugenelement e
-s und -es , sowie -en und -n deutli h unters hieden. Der fehlende Bindestri h auf
der re hten SeitedesFugenelement es istdur h dieZugehörigkeit zur Kompositions-
stammformbegründet.
1.6.1 Bildung der Kompositionsstammformen
mit Fugenelementen
Im Folgenden werden die von Fuhrhop (1998) gefundenen Regularitäten zusam-
mengestelltundaufgrundder Einbindungsmögli hkeitenin dasbes hriebeneModell
kommentiert.
Fuhrhops Hauptkriterium zur Erstellung einer Systematik der Fugenelement e ist
deren Produktivität, ein Aspekt, der in deskriptiven Untersu hungen übergangen
wird.Zunä hstwerdendieFugenelement ena hihrerFormeingeteilt,dieErstglieder
werdenaufgrunddieserEinteilungaufdieEntstehungvonBasismengenoderReihen
untersu ht. Die Kriterien, die den Reihen zugrunde liegen, werden gesammelt und
ananderen Fällengeprüft.
Kompositionsstammformenbildung mit -s
Das Fugen- s nimmt eine Sonderstellung unter den Fugenelement en ein, da es als
einziges produktiv neben der paradigmis hen Form unparadigmis h auftritt. Mit
demMerkmalspaar paradigmis h/unparadigmis h isthier dasAuftretenzu denFu-
genelementen homophoner und homographer Flexionssuxe in den entspre henden
ektierten Wortformen des Erstglieds gemeint. So tritt -s au h in Kompositions-
stammformen auf, zu deren Flexionsparadigma es aber ni ht gehört und somit als
unparadigmis hbezei hnet wird.Entspri htdasFugen- s demGenitiv-s desErstglie-
des,ist esparadigmis h. Eine andereinteressante Eigens haft beruht aufder Tatsa-
he,dass -s niemals in Kompostionsstammformen vorkommt, derenPluralform mit
-s gebildet wird, au h dann ni ht, wenn die Genitiv-Singular-Fo rm formglei h ist
(vgl.Fuhrhop 1998, S. 197).
BeidenKompositionsstammformenmitunparadigmis henFugen- s nenntFuhrhop
vierKlassen femininer Substantive.Die Erstglieder sind:
a) sugierte feminine Substantive (z. B. Tapferkeitsmedallie, Versi herungsver -
treter);
b) alte Ableitungen mit -t aus Partikelverben (z. B. Abfahrtszeit, Aufsi htsver-
pi htung);
) (syn hron)Simplizia (z.B. Anstaltsleiter , Arbeitserlaub nis);
d) formaleinKompositum mit nur einem Beleg: Ho hzeitsfeier.
Ina)bildenalledieseSubstantivebisaufFormenmit-ei ,-erei und-in ihreKompo-
sitionsstammformenregelmäÿigmit Fugen- s.InFälleneiner explizitenPluralbedeu-
tung istaber au hdie entspre hende Pluralform mögli h. Bei b) d) sindauällige
Gemeinsamkeiten zu erkennen. So sind alle Belege mehrsilbig und enden auf -t . Es
ergibt si hzusammenfassend,dass Mehrsilbigkeitund damit verbundene morpholo-
gis heKomplexitätnotwendigeBedingungenfüreineunparadigmis heKompsitions-
stammformmit -s sind.
Dieparadigmis henFormendesFugen- s sinds hwierigerzuerfassen.Dadasparadig-
mis he-s niemalseinerPluralformentspri ht,kannesnurderGenitiv-Singular-Form
formglei hsein (vgl. Fuhrhop 1998,S. 198).
DieGruppederdeverbalenSubstantiveweistkeineeindeutigenKompositionsstamm-
formenauf.Bei dendeverbalen Substantivenauf -en sind esdieeinfa hen oder prä-
giertendeverbalen neutralen Substantive, die ihre Kompositionsstammform auf -s
bilden (Beispiele: Essensmarke, Wissensdurst, Einkommensgrenze). Entspre hende
Bildungenmitmaskulinem Genus weisen keineFugenelement eauf,z.B.Hustensaft.
NeutraleErstglieder vomTypErdbebenvo rso rge sindselbst Komposita,dieentspre-
henden Verben Rü kbildungen ausdiesen Substantiven und weisen ebenfalls keine
Fugenelement eauf.Diegenannten Formenunters heidensi hvondensubstantivier-
ten Innitiven, deren Kompositionsstammform der der zugrundeliegenden Verben
entspri ht, dur h ihrePluralfähigkeit. Daraus zieht Fuhrhop den S hluss,dassder
Gebrau h desFugen- s in dieserGruppe mit zunehmender Lexikalisierungeintritt.
ImpliziteAbleitungen ausVerben weisen teilweise Fugen- s auf,teilweise ers heinen
sie ohne Fugenelement . Die impliziten Ableitungen komplexer prägierter Verben
treten mit Fugenelement auf (z. B. Anfangsgehalt, Bestandsaufnahme, Vors hlags-
re ht). Fuhrhop (1998, S. 201) nennt dabei einige Ausnahmen, vor allem die auf
einen koronalen Frikativauslautenden Ableitungen wie z.B. Aufs hluss. Auÿerdem
werdenvonFuhrhop Ausritt undAusklang alsAusnahmenbezei hnet,diefugenlo-
seKompositionsstammformenbilden.Dagegenstehen aber vomAutordieserArbeit
gefundene Formen wie Ausklangsgur und Ausklangsfeier 5
. Als Komposition mit
Ausklang als Kompositionsstammform ohne Fugen- s wurde nur Ausklangambiente
gelistet. Fuhrhop liefert selbst keineentspre henden Beispiele.Implizite Ableitun-
gen einfa her Verben wie z.B. Brau htum und S hlagball treten ohne Fugen- s auf.
Ausnahmensindz.B.Handelsmann.FuhrhophebthierdieMehrsilbigkeitderAus-
nahmen hervor. Die Ableitungen ohne Fugenelement sind einsilbig. Damit wird die
Verbindungzumunparadigmis henFugen- s hergestellt,dasniemalsna heinsilbigen
Erstglied folgt.
Dasunparadigmis he -s trittregelmäÿig na h bestimmten femininen Ableitungssuf-
xen auf (siehe oben). Bei maskulinen Substantiven ist das paradigmis he -s nur
na h demSux -ling regelmäÿig, z. B. Lehrlingsgehalt oder Lieblingsgetränk. Na h
-er trittesnurna h Ortsnamen auf,diemanalslexikalisiertbetra hten kann,z.B.
Eberswalde . Ist dasZweitglied ein relationales Substantiv, tritt in bestimmten Fäl-
lenein -s hinter -er , z. B. Bauersfrau, Ri hterssohn. Bei diesen Erstgliedern ist die
Kompositionsstammform mit -s ni ht dieeinzige, estritt immerau h dieKomposi-
tionsstammform ohne Fugenelement auf.
Bei denneutralen Substantiven tritt -s regelmäÿig na h den Suxen -sal und -tum
auf( Fleis her und Barz 1995,S. 139).
EinsilbigemaskulineoderneutraleSubstantive,diemitFugen- s auftreten,gibtesnur
wenige,z.B.Amtsgeri ht oder Wolfsgrube .EskönnekeinebesonderenEigens haften
ausgema htwerden,diedieseSubstantivezuBasismengenzusammenfassen.Füreine
Auistungsiehe Fuhrhop (1998, S. 202).
DiegenanntenKriterienfürdasunparadigmis he-s könnenmitFinite-State-Mit teln
relativ einfa h dem Modell hinzugefügt werden. Sowohl die Feststellung von ent-
spre henden Suxen als au h die Erkennung der Komplexität der Erstglieder wird
realisiert (siehe dazu 3.2). Die Wortart sowie Genus im Falle der Substantive sind
im Lexikon kodiert. Da die sugierten Feminia überwiegend Abstrakta sind, kann
an den enthaltenen Flexionsinformationen erkannt werden, ob es si h um Singula-
riatantum handelt, bei denen eine pluralis he Verwendung ausges hlossen werden
kann.
S hwierigergestaltetsi hdieEinbindungderbes hriebenenRegularitätenfürdaspa-
radigmis he-s.NebenderSuxgestaltungundderKomplexitätderErstgliederspielt
au hderenWortbildungs harakte ristik eineRolle.Es müsste festgestelltwerden, ob
5