Textkorpus

Substantiv (Nomen), Neutrum (sächlich)

Aussprache

Lautschrift (IPA):[ ˈtɛkstˌkɔʁpʊs ]

Silbentrennung

Einzahl:Textkorpus
Mehrzahl:Textkorpora

Definition bzw. Bedeutung

Linguistik: Sammlung von Texten als Gegenstand sprachwissenschaftlicher Analyse.

Begriffsursprung

Determinativkompositum aus Text und (das) Korpus.

Deklination (Fälle)

SingularPlural
Nominativdas Textkorpusdie Textkorpora
Genitivdes Textkorpusder Textkorpora
Dativdem Textkorpusden Textkorpora
Akkusativdas Textkorpusdie Textkorpora

Beispielsätze

  • Um repräsentative Sprachuntersuchungen durchführen zu können, benötigt man ein Textkorpus.

  • Ohne das Wort „Zwiebelkuppel“ ist unser Textkorpus nicht vollständig.

Praktische Beispiele aus der Medienlandschaft

Sie haben sich bei dem jetzt veröffentlichten Textkorpus noch verschärft.

Übergeordnete Begriffe

Übersetzungen

Wortaufbau

Das dreisilbige Substantiv Text­kor­pus be­steht aus zehn Buch­sta­ben und setzt sich wie folgt zu­sammen: 2 × T, 1 × E, 1 × K, 1 × O, 1 × P, 1 × R, 1 × S, 1 × U & 1 × X

  • Vokale: 1 × E, 1 × O, 1 × U
  • Konsonanten: 2 × T, 1 × K, 1 × P, 1 × R, 1 × S, 1 × X

Eine Worttrennung ist nach dem zwei­ten T und R mög­lich. Im Plu­ral Text­kor­po­ra nach dem ers­ten T, ers­ten R und zwei­ten O.

Das Alphagramm von Text­kor­pus lautet: EKOPRSTTUX

Buchstabiertafel

Entsprechend der deut­schen Buch­sta­bier­ta­fel für Wirt­schaft und Ver­wal­tung (DIN 5009:​2022-06) wird das Wort fol­gen­der­maßen buch­sta­biert:

  1. Tü­bin­gen
  2. Essen
  3. Xan­ten
  4. Tü­bin­gen
  5. Köln
  6. Offen­bach
  7. Ros­tock
  8. Pots­dam
  9. Unna
  10. Salz­wedel

In Deutschland ebenfalls ge­läufig ist die Buch­sta­bie­rung nach dem pos­ta­li­schen Buch­sta­bier­al­pha­bet von 1950:

  1. Theo­dor
  2. Emil
  3. Xant­hippe
  4. Theo­dor
  5. Kauf­mann
  6. Otto
  7. Richard
  8. Paula
  9. Ulrich
  10. Samuel

International ist das eng­lischs­spra­chige ICAO-Alpha­bet (kein „ẞ“ und keine Umlaute) an­er­kannt:

  1. Tango
  2. Echo
  3. X-Ray
  4. Tango
  5. Kilo
  6. Oscar
  7. Romeo
  8. Papa
  9. Uni­form
  10. Sierra

Heute vorwiegend nur noch als Funk­feuer in der Luft- und Schiff­fahrt ge­bräuch­lich ist der Mor­se­code (auch Mor­se­al­pha­bet oder Mor­se­zei­chen genannt):

  1. ▄▄▄▄
  2. ▄▄▄▄ ▄ ▄ ▄▄▄▄
  3. ▄▄▄▄
  4. ▄▄▄▄ ▄ ▄▄▄▄
  5. ▄▄▄▄ ▄▄▄▄ ▄▄▄▄
  6. ▄ ▄▄▄▄ ▄
  7. ▄ ▄▄▄▄ ▄▄▄▄ ▄
  8. ▄ ▄ ▄▄▄▄
  9. ▄ ▄ ▄

Scrabble

Beim Scrabble gibt es 24 Punkte für das Wort Text­kor­pus (Sin­gu­lar) bzw. 26 Punkte für Text­kor­po­ra (Plural).

Textkorpus

Bitte je­doch stets das offi­zielle Scrabble-Regel­werk (z. B. zu Vor- und Nach­silben) beachten!

Worthäufigkeit

Das Nomen Text­kor­pus kam im letz­ten Jahr äußerst sel­ten in deutsch­spra­chi­gen Tex­ten vor. Dies hat eine Aus­wer­tung meh­re­rer Mil­lio­nen Bei­spiel­sätze ergeben.

Vorkommnisse im Sprachwörterbuch

Häu­fig­keits­wör­ter­buch:
Linguistik, Quantitative Linguistik: Wörterbuch, in dem die Frequenz, die Häufigkeit, mit der Wörter in einem Textkorpus vorkommen, angegeben wird
Quellen:
  1. [Allgemeine Datenbasis] Wiktionary-Autoren: Textkorpus. In: Wiktionary – Das freie Wörterbuch, 2023, [online] de.wiktionary.org, CC BY-SA 3.0
  2. [erweiterte Beispielsätze] User-generated content: Satz-Nr. 3630943. In: tatoeba.org, CC BY 2.0 FR
  3. [Newskorpus] D. Goldhahn, T. Eckart & U. Quasthoff: Building Large Monolingual Dictionaries at the Leipzig Corpora Collection: From 100 to 200 Languages. In: Proceedings of the 8th International Language Resources and Evaluation (LREC'12), 2012, CC BY 4.0
  1. Die Zeit (04/2001)