Korpus je skup tekstova prikupljenih na jednom mestu na osnovu nekog kriterijuma.
Korpuse obično prave univerziteti i istraživački centri, a danas se mogu naći i komercijalni korpusi za koje se plaća pristup.
Mogu da budu jednojezični i višejezični, odnosno komparativni i paralelni.
Komparativni korpusi dolaze u jednojezičnim, dvojezičnim i višejezičnim varijantama. Sastoje se od tekstova između kojih ne postoji odnos izvornik-prevod i prevod–izvornik.
Paralelan korpus (jednojezičan ili višejezičan) je skup ciljnih i izvornih tekstova. Može da bude jednosmeran (smer prevod-izvornik) ili dvosmeran (smer od izvornika ka prevodu i obrnuto).
Kako prevodioci mogu da koriste korpuse?
Prevodioci mogu da pretražuju korpuse da bi proverili ili pronašli:
– ustaljene kolokate, idiome, fraze, termine,
– kontekst reči,
– morfološke i sintaksičke konstrukcije.
Korpusi
- Englesko-srpski paralelni korpus EVROTEKA
- Korpus savremenog srpskog jezika
- Lematizirani korpus savremenog srpskog jezika
- Paralelni englesko-srpski korpus
- Paralelni francusko-srpski korpus
- Biblisha
- Translational English Corpus
- Learner Translation Corpus
- British National Corpus
- Open American National Corpus
- The Corpus of Contemporary American English
- ENPC English Norwegian Corpus
- COMPARA English Portuguese Corpus
- TransSearch
- Acquis Coomunautaire
- Open Source Parallel Corpus
- European Parliament Interpretatation Corpus
- Leeds Collection of Internet Corpora
- WebCorp
- Sketch Engine (komercijalni korpusi)