Tu je kára, ten to ryje, český jazyk, špetka poezie, editorka, zlobivá holka a Básnička psaná na sklíčka

Matematická lingvistika, jazyk z hlediska kvantitativního

13. ledna 2007 v 20:10 | Básnička |  Jazykověda
  • v druhé polovině 20. stol. převážil zájem o disciplíny, v nichž se kombinují otázky lingvistické s tématy a metodami tradičních vědních odvětví, jako je matematika, lingvistika, logika atd.
  • vznikla tak řada pomezních disciplín, které v současné lingvistice získaly dominantní postavení
  • v rámci matematické lingvistiky se rozlišují tři dílčí disciplíny - lingvistika kvantitativní, algebraická a počítačová - první dvě jsou převážně teoretické, třetí aplikuje jejich poznatky v praxi - jako symbolické datum vzniku se udává rok 1957, kdy se konal 8. mezinárodní lingvistický kongres v Oslu
  • termínem matematická lingvistika se dnes označují takové disciplíny, v nichž se při výzkumu jazyka užívají matematické metody
1) Kvantitativní lingvistika
- kvantitativní lingvistika používá kvantitativní - statistické metody
- má delší tradice než lingvistika algebraická a počítačová (statistické metody se objevovali v lingvistice již od konce 19. stol.)
Frekvence (četnost) - Jejím zkoumáním se zjistilo, že výskyt jazykových jednotek ve všech rovinách je nerovnoměrný. Některé mají frekvenci velmi vysokou, jiné střední či frekvenci blížící se nule. Všechny takové jevy se ale dají seřadit podle frekvence výskytu do řady, v níž se od nejčastěji používaných postupně přechází až k takovým jevům, které se vyskytují vzácně.

Teorie pravděpodobnosti
- Popisuje mluvu jako proces, kdy k vysloveným jazykovým jednotkám vyslovujeme jednotky další, a to podle jejich relativní frekvence, která je pro každý jazyk závazná. Proto vznikají různé frekvenční slovníky pro různé jazyky a obory (matematika, medicína, pedagogie apod.)

- Frekvenční slovník češtiny
(1. místo spojka a
, 2. je sloveso být)

J. Jelínek - J. V. Bečka - M. Těšitelová: Frekvence, slov, slovních druhů a tvarů, SPN Praha 1961
M. Těšitelová a kol.: Frekvenční slovník současné české publicistiky, ÚJČ ČSAV Praha 1980
M. Těšitelová a kol.: Frekvenční slovník češtiny věcného stylu, ÚJČ ČSAV Praha 1983

Kvantitativní vztahy v gramatice
- zde také platí zásada nerovnoměrného rozložení jednotlivých jevů. Rozdíly jsou ve využívání jednotlivých jevů v mluveném a psaném jazyce, v různých stylistických rovinách.
- kvantitativní lingvistika se ovšem neomezuje pouze na sestavování frekvenčních seznamů, ale i např. na vypracování vzorců pro zjišťování bohatosti a koncentrace slovníku, glottochronologickou metodu ke zjišťování doby rozpadu prajazyka na nástupní jazyky či napodobování textu přirozených jazyků apod.
Teorie informace a teorie komunikace
Vznik 40./50.léta v souvislosti s kybernetikou se zformovaly dva nové vědní obory: teorie informace a teorie komunikace, oba se zabývají přenosem informací a mají k sobě blízko.
Základní myšlenky zformuloval angl. matematik Claudie Elwood Shannon a am. matematik Warren Weawer - spol. práce "Matematická teorie komunikace"- je ale určená matematikům a odborníkům jiných oborů těžko srozumitelná.
Teorie komunikace: zkoumá hlavně formální stránku přenosu informace a nezabývá se samotnými informacemi, tj. významem či obsahem přenášených slov. Zabývá se hlavně fyzikální, technickou stránkou komunikace a patří spíš do matematiky. Komunikační signály jsou např. světelné dopravní značky, akustické či pachové signály u zvířat, elektrické impulsy u počítače… Nejrozvinutějším signálem komunikace jsou přirozené jazyky.
Teorie informace: zabývá se samotnou informací, její strukturou, způsobem jejího kódování, jejím měřením apod., pro lingvistiku důležitější!
Z hlediska teorie informace rozlišujeme pojmy:
Kódování - složitý proces přechodu od myšlenkového obsahu ke zvukové podobě.
Kód - systém signálů, jejichž prostřednictvím se přenášejí konkrétní informace. Jedním z takových systémů je jazyk. Proces informace se realizuje vždy mezi zdrojem a příjemcem.
Základním výsledkem teorie inf. je tvrzení, že informace se dá měřit. K jejímu měření byl z fyziky přejat pojem entropie = množství informace v jednom komunikačním signálu či znaku (např. v jednom písmenu, fonému, slově). Podle jiné definice je to míra neurčitosti pokusu nebo průměrné množství inf. připadající na jeden znak - souvisí s pojmem předvídatelnost (predictability) - množství inf. je největší tehdy, když naprosto nejsme schopni předvídat další část výpovědi, nulové tehdy, když další prvek odhadneme se stoprocentní jistotou.
Zkráceně teorie informace předpokládá, že čím je určitá jednotka méně frekventovaná a tedy méně pravděpodobná, tím větší je informace, kterou přenáší. Jedna a tatáž výpověď může pro někoho představovat značné množství inf. a pro někoho, kdo je např. seznámen se situací, nepřenáší inf. žádnou.
Bit - jednotka pro množství informace, je dána abecedou o jednom prvku a dvou stavech
2) Algebraická lingvistika = teorie matematických modelů jazyka
  • používá také jako kvantitativní lingvistika matematické metody, ale které nejsou statistické, ale algebraické a logické
  • matematické modely připomínají soustavu rovnic, které mají charakterizovat příslušný objekt či jeho část
  • tato metoda umožňuje odhlédnout od nepřehledného a často neomezeného množství jevů a dovoluje tak soustředit se na jevy podstatné - tedy pracovat s jediným obecným vzorcem
  • v lingvistice se objevily pokusy modelovat celé jazyky, jejich jednotlivé složky, ale
    i lidskou schopnost řeči, vývoj jazyka apod.
  • příkladem může posloužit generativní a transformační gramatika Naoma Chomského, která představuje nejpropracovanější model jazyka. S úspěchem se aplikuje zvláště na jazyky s pevným slovosledem a chudou morfologií (jako je angličtina a další jazyky analytického typu).
  • v Rusku vypracovala O.S. Kulaginová tzv. analytický model jazyka, kterým se snažila postihnout tvaroslovné bohatství a volný slovosled syntetických jazyků (jako je ruština a slovanské jazyky)
  • u těchto modelů, které nemusí mít s algebrou nic společného, jde o aplikaci jiných než kvantitativních metod v rámci matematické lingvistiky.
3) Počítačová lingvistika
  • neobyčejný rozvoj počítačů v 2.pol.20.stol. způsobil změny v metodách vědeckého výzkumu v různých disciplínách
  • pro řadu operací lingvistického charakteru se užívá název počítačová - strojová lingvistika
  • využívá poznatky kvantitativní i algebraické lingvistiky a ovlivňuje rozvoj obou těchto disciplín
  • nejznámější činností strojové lingvistiky je strojový překlad - jeho cílem je převést text výchozího jazyka na jazyk cílový
  • přesto se nepodařilo dosáhnout takové úrovně překladu překládaného tzv. "ručně". Problém je hlavně v sémantické složce, která se prozatím vzpírá matematicky korektnímu popisu. Avšak výhodou je rychlost překladu (narozdíl od ručního překladu).
  • dnes se už daří na počítačích překládat některé odborné texty s omezenou slovní zásobou
  • vedle strojového překladu se počítače v lingvistice uplatňují i při jiných činností např. spektrální analýza mluvené řeči, zpracování frekvenčních seznamů
  • v této disciplíně se využívá hlavně operační rychlosti počítačů
Zdroje:
Černý, J.: Úvod od studia jazyka. Rubico, Olomouc 1998.
Čermák , F. Jazyk a jazykověda, Praha 1997.
Černý, J.: Dějiny lingvistiky. Votobia, Olomouc 1996.
 

1 člověk ohodnotil tento článek.

Nový komentář

Přihlásit se
  Ještě nemáte vlastní web? Můžete si jej zdarma založit na Blog.cz.
 

Aktuální články

Reklama