Computerlinguistik

Substantiv (Nomen), feminin (weiblich)

Aussprache

Lautschrift (IPA): [kɔmˈpjuːtɐlɪŋˌɡu̯ɪstɪk]

Silbentrennung

Computerlinguistik

Definition bzw. Bedeutung

Disziplin der Linguistik, die die Möglichkeiten zur Verarbeitung natürlicher Sprachen mit dem Computer untersucht.

Begriffsursprung

Determinativkompositum aus Computer und Linguistik.

Deklination (Fälle)

SingularPlural
Nominativdie Computerlinguistik
Genitivdie Computerlinguistik
Dativder Computerlinguistik
Akkusativdie Computerlinguistik

Anderes Wort für Com­pu­ter­lin­gu­is­tik (Synonyme)

linguistische Datenverarbeitung
Maschinelle Sprachverarbeitung
Natural Language Processing (fachspr.)
NLP (fachspr.)

Sinnverwandte Wörter

Linguistische Datenverarbeitung
Linguistische Informatik

Beispielsätze

  • Zu den Anwendungsgebieten der Computerlinguistik zählt die maschinelle Übersetzung.

  • Für das Studium der Computerlinguistik sind Kenntnisse in mehreren Fremdsprachen erforderlich, wobei man auch mit Computern umzugehen wissen muss.

  • Er studiert Computerlinguistik.

Praktische Beispiele aus der Medienlandschaft

Es geht um Spracherkennung, um Lösungen für intuitives Arbeiten mit dem PC, um Computerlinguistik.

Übergeordnete Begriffe

Übersetzungen

  • Bosnisch: računarska lingvistika (weiblich)
  • Bulgarisch: компютърна лингвистика
  • Dänisch: sprogteknologi
  • Englisch: computational linguistics
  • Finnisch: kieliteknologia
  • Französisch: linguistique informatique (weiblich)
  • Galicisch: linguaxe de computadora
  • Italienisch: linguistica computazionale
  • Kroatisch: računalna lingvistika
  • Lettisch: datorlingvistika (weiblich)
  • Litauisch: kompiuterinė lingvistika (weiblich)
  • Mazedonisch: компјутерска лингвистика (kompjuterska lingvistika) (weiblich)
  • Niederländisch: computationele taalkunde
  • Niedersorbisch: computerowa linguistika (weiblich)
  • Obersorbisch: computerowa linguistika (weiblich)
  • Persisch: زبان‌شناسی محاسباتی
  • Polnisch: lingwistyka komputerowa (weiblich)
  • Russisch: компьютерная лингвистика (weiblich)
  • Schwedisch: datorlingvistik
  • Serbisch: рачунарска лингвистика (računarska lingvistika) (weiblich)
  • Serbokroatisch: рачунарска лингвистика (računarska lingvistika) (weiblich)
  • Slowakisch: počítačová lingvistika (weiblich)
  • Slowenisch: računalniško jezikoslovje (sächlich)
  • Spanisch: lingüística computacional
  • Tschechisch: počítačová lingvistika (weiblich)
  • Türkisch: doğal dil işleme
  • Weißrussisch: камп’ютарная лінгвістыка (weiblich)

Wortaufbau

Das siebensilbige Substantiv Com­pu­ter­lin­gu­is­tik be­steht aus 18 Buch­sta­ben und setzt sich wie folgt zu­sammen: 3 × I, 2 × T, 2 × U, 1 × C, 1 × E, 1 × G, 1 × K, 1 × L, 1 × M, 1 × N, 1 × O, 1 × P, 1 × R & 1 × S

  • Vokale: 3 × I, 2 × U, 1 × E, 1 × O
  • Konsonanten: 2 × T, 1 × C, 1 × G, 1 × K, 1 × L, 1 × M, 1 × N, 1 × P, 1 × R, 1 × S

Eine Worttrennung ist nach dem M, ers­ten U, R, N, zwei­ten U und S mög­lich.

Das Alphagramm von Com­pu­ter­lin­gu­is­tik lautet: CEGIIIKLMNOPRSTTUU

Buchstabiertafel

Entsprechend der deut­schen Buch­sta­bier­ta­fel für Wirt­schaft und Ver­wal­tung (DIN 5009:​2022-06) wird das Wort fol­gen­der­maßen buch­sta­biert:

  1. Chem­nitz
  2. Offen­bach
  3. Mün­chen
  4. Pots­dam
  5. Unna
  6. Tü­bin­gen
  7. Essen
  8. Ros­tock
  9. Leip­zig
  10. Ingel­heim
  11. Nürn­berg
  12. Gos­lar
  13. Unna
  14. Ingel­heim
  15. Salz­wedel
  16. Tü­bin­gen
  17. Ingel­heim
  18. Köln

In Deutschland ebenfalls ge­läufig ist die Buch­sta­bie­rung nach dem pos­ta­li­schen Buch­sta­bier­al­pha­bet von 1950:

  1. Cäsar
  2. Otto
  3. Martha
  4. Paula
  5. Ulrich
  6. Theo­dor
  7. Emil
  8. Richard
  9. Lud­wig
  10. Ida
  11. Nord­pol
  12. Gus­tav
  13. Ulrich
  14. Ida
  15. Samuel
  16. Theo­dor
  17. Ida
  18. Kauf­mann

International ist das eng­lischs­spra­chige ICAO-Alpha­bet (kein „ẞ“ und keine Umlaute) an­er­kannt:

  1. Char­lie
  2. Oscar
  3. Mike
  4. Papa
  5. Uni­form
  6. Tango
  7. Echo
  8. Romeo
  9. Lima
  10. India
  11. Novem­ber
  12. Golf
  13. Uni­form
  14. India
  15. Sierra
  16. Tango
  17. India
  18. Kilo

Heute vorwiegend nur noch als Funk­feuer in der Luft- und Schiff­fahrt ge­bräuch­lich ist der Mor­se­code (auch Mor­se­al­pha­bet oder Mor­se­zei­chen genannt):

  1. ▄▄▄▄ ▄ ▄▄▄▄ ▄
  2. ▄▄▄▄ ▄▄▄▄ ▄▄▄▄
  3. ▄▄▄▄ ▄▄▄▄
  4. ▄ ▄▄▄▄ ▄▄▄▄ ▄
  5. ▄ ▄ ▄▄▄▄
  6. ▄▄▄▄
  7. ▄ ▄▄▄▄ ▄
  8. ▄ ▄▄▄▄ ▄ ▄
  9. ▄ ▄
  10. ▄▄▄▄ ▄
  11. ▄▄▄▄ ▄▄▄▄ ▄
  12. ▄ ▄ ▄▄▄▄
  13. ▄ ▄
  14. ▄ ▄ ▄
  15. ▄▄▄▄
  16. ▄ ▄
  17. ▄▄▄▄ ▄ ▄▄▄▄

Scrabble

Beim Scrabble gibt es 32 Punkte für das Wort.

Computerlinguistik

Bitte je­doch stets das offi­zielle Scrabble-Regel­werk (z. B. zu Vor- und Nach­silben) beachten!

Worthäufigkeit

Das Nomen Com­pu­ter­lin­gu­is­tik kam im letz­ten Jahr äußerst sel­ten in deutsch­spra­chi­gen Tex­ten vor. Dies hat eine Aus­wer­tung meh­re­rer Mil­lio­nen Bei­spiel­sätze ergeben.

Vorkommnisse im Sprachwörterbuch

Com­pu­ter­lin­gu­ist:
Linguist (Sprachwissenschaftler), der sich intensiv mit der Erforschung der Sprache mit Hilfe von Computern befasst; Vertreter der Computerlinguistik
Com­pu­ter­lin­gu­is­tin:
Linguistin (Sprachwissenschaftlerin), die sich intensiv mit der Erforschung der Sprache mit Hilfe von Computern befasst; Vertreterin der Computerlinguistik
com­pu­ter­lin­gu­is­tisch:
auf die Computerlinguistik bezogen, nach Art/mit den Mitteln der Computerlinguistik
Satz­ana­ly­se:
Computerlinguistik: maschinelle Analyse von Sätzen und Zuordnung einer Strukturbeschreibung
Sprach­ver­ar­bei­tung:
Linguistik, speziell Computerlinguistik: Analyse und Synthese sprachlicher Äußerungen durch Computer
Quellen:
  1. [Allgemeine Datenbasis] Wiktionary-Autoren: Computerlinguistik. In: Wiktionary – Das freie Wörterbuch, 2022, [online] de.wiktionary.org, CC BY-SA 3.0
  2. [Thesaurus] OpenThesaurus-User: Computerlinguistik. In: OpenThesaurus – Das freie Wörterbuch für Synonyme, 2023, [online] openthesaurus.de, CC BY-SA 4.0
  3. [erweiterte Beispielsätze] User-generated content: Satz-Nr. 971017 & 383227. In: tatoeba.org, CC BY 2.0 FR
  4. [Newskorpus] D. Goldhahn, T. Eckart & U. Quasthoff: Building Large Monolingual Dictionaries at the Leipzig Corpora Collection: From 100 to 200 Languages. In: Proceedings of the 8th International Language Resources and Evaluation (LREC'12), 2012, CC BY 4.0
  1. Rheinischer Merkur 1997