2026.04.14
Forrás: Oszakai Egyetem
Összefoglaló:
Az emberi nyelv talán rendezetlennek és kevésbé hatékonynak tűnik a számítógépek által használt ultratömör nullák és egyesek sorozatához képest – agyunk azonban valójában jobban kedveli ezt a formát. Új kutatások rávilágítanak, hogy bár a digitális kódolás elméletileg tömörítheti az információt, a dekódolás mindkét fél – a beszélő és a hallgató – részéről is sokkal nagyobb szellemi erőfeszítést igényelne. Ehelyett a nyelv a valós tapasztalatainkat tükröző, ismerős szavakra és kiszámítható mintákra épül, aminek köszönhetően az agyunk folyamatosan előre tudja jelezni azt, ami következik, és lépésről lépésre szűkítheti a jelentést.
Az emberi nyelv nem annyira tömörített, mint a számítógépes kód – ez azonban nem hiba, hanem előny. Ismerős szerkezete segít az agynak valós időben előre jelezni a jelentést, így a kommunikáció kognitív szempontból sokkal kevésbé megterhelő, mint a digitális bitek áramlása. (kép: shutterstock)
Az emberi nyelv rendkívül gazdag és bonyolult. Az információelmélet szempontjából azonban ugyanazokat az ötleteket elvileg sokkal tömörebb formában is át lehetne adni. Ez felvet egy érdekes kérdést: miért nem kommunikálnak az emberek a számítógépekhez hasonlóan egy nullákból és egyesekből álló digitális rendszerben?
A Saarbrückben élő nyelvész, Michael Hahn és Richard Futrell, a Kaliforniai Egyetem (Irvine) kutatója közösen vállalkozott arra, hogy választ adjon erre a kérdésre. Létrehoztak egy modellt, amely magyarázatot ad arra, miért olyan az emberi nyelv, amilyen. Kutatásuk eredményeit a közelmúltban publikálták a Nature Human Behaviour című folyóiratban.
Az emberi nyelv és az információhatékonyság
Világszerte mintegy 7 000 nyelvet beszélünk. Vannak, amelyeket már csak néhányan használnak, míg mások – például a kínai, az angol, a spanyol és a hindi – több milliárd ember anyanyelve. A különbségeik ellenére minden nyelv ugyanazt az alapvető célt szolgálja: jelentést közvetít azáltal, hogy a szavakat mondatokká, a mondatokat pedig szöveggé rendezi. A nyelv minden része saját jelentést hordoz, amelyek együttesen világos üzenetet alkotnak.
„A nyelv valójában egy nagyon összetett szerkezet. Mivel a természet a hatékonyság maximalizálására és az erőforrások megőrzésére törekszik, teljesen indokolt a kérdés, hogy az agy miért kódolja a nyelvi információkat ilyen látszólag bonyolult módon, ahelyett, hogy digitálisan tenné, mint egy számítógép” – magyarázza Michael Hahn. Elméletileg a beszéd bináris egyesek és nullák sorozataként való kódolása hatékonyabb lenne, mert így az információ tömörebb, mint a beszélt nyelvben. Akkor miért nem kommunikálnak az emberek úgy, mint R2-D2 a Csillagok háborújában? Hahn és Futrell úgy vélik, megtalálták a választ.
A nyelv a valós élettapasztalatra épül
„Az emberi nyelvet a tapasztalataink alakítják” – mondja Michael Hahn. „Ha például egy félig macska, félig kutya lényről akarnék beszélni, és ezt az elvont »gol« kifejezéssel jelölném, senki sem értené, mire gondolok, mivel szinte biztos, hogy senki sem látott még golt – ez egyszerűen nem tükrözi senki élettapasztalatát. Ugyanígy nincs értelme a »macska« és a »kutya« szavakat olyan karakterlánccá keverni, amely ugyanazokat a betűket használja, de értelmezhetetlen” – folytatja.
Egy kevert forma, mint például a „gadcot”, technikailag mindkét szó betűit tartalmazza, de a hallgató számára értelmetlen. Ezzel szemben a „macska és kutya” kifejezés azonnal érthető, mert mindkét állat ismerős fogalom. Az emberi nyelv azért működik, mert közvetlenül kapcsolódik a közös tudáshoz és az élettapasztalathoz.
Agyunk az ismerős mintákat kedveli
Hahn így foglalja össze az eredményeket: „Egyszerűen fogalmazva: az agyunk könnyebben követi a látszólag bonyolultabb utat.” Bár a természetes nyelv nem teljesen tömör, sokkal kisebb terhet ró az agyra. Ennek az az oka, hogy az agyunk a szavak feldolgozása közben folyamatosan összeveti azzal, amit a világról tudunk.
Egy tisztán digitális kód gyorsabban közvetíthetné az információt, nem ugyanakkor elszakadna a mindennapi tapasztalattól. Hahn ezt az ingázáshoz hasonlítja: „A megszokott útvonalunk annyira ismerős, hogy szinte robotpilóta üzemmódban vezetünk munkába menet. Agyunk pontosan tudja, mire számíthat, így sokkal kisebb erőfeszítésre van szüksége. Egy rövidebb, de nem megszokott utat jóval fárasztóbbnak érzünk, mivel az új útvonal sokkal nagyobb figyelmet követel vezetés közben.”
Matematikai szempontból nézve, hozzáteszi: „Az agynak sokkal kevesebb bitet kell feldolgoznia, ha természetes, ismerős módon beszélünk.”
Más szóval, a bináris kód közlése és megértése sokkal nagyobb szellemi erőfeszítést kívánna a beszélőtől és a hallgatótól egyaránt. Ehelyett az agy folyamatosan megbecsüli, hogy milyen valószínűséggel következnek bizonyos szavak és kifejezések. Mivel anyanyelvünket évtizedeken át nap mint nap használjuk, a minták mélyen bevésődnek, így a kommunikáció gördülékenyebbé és kevésbé megterhelővé válik.
Hogyan formálja a beszédet a prediktív feldolgozás?
Hahn egy szemléletes példával illusztrálja ezt: „Amikor azt mondom németül: ‘Die fünf grünen Autos’ (magyarul: ‘az öt zöld autó’), a mondat szinte biztosan érthető lesz egy másik német anyanyelvűnek, míg a ‘Grünen fünf die Autos’ (‘zöld öt az autó’) nem” – mondja.
Amikor valaki meghallja a „Die fünf grünen Autos” kifejezést, az agya azonnal elkezdi értelmezni a jelentést. A „Die” szó bizonyos nyelvtani lehetőségeket jelez. Egy német hallgató azonnal leszűkíti a lehetőségeket, és kizárja a hímnemű vagy semleges nemű egyes számú főneveket. A következő szó, a „fünf”, megszámlálhatót sugall, kizárva az elvont fogalmakat, mint például a szerelem vagy a szomjúság. Majd a „grünen” szó azt jelzi, hogy az azt követő főnév többes számú lesz, ráadásul valami és zöld. Ezen a ponton a tárgy lehet autó, banán vagy béka. Csak az utolsó szó, az „Autos” kimondásakor rögzül véglegesen a jelentés. Az agy minden szónál csökkenti a bizonytalanságot, amíg csak egyetlen értelmezés marad.
Ezzel szemben a „Grünen fünf die Autos” megzavarja ezt a kiszámítható mintát. A várt nyelvtani jelzések helytelen sorrendben jelennek meg, így az agy nem képes könnyen felépíteni a sorozatból a jelentést.
A mesterséges intelligencia és a nyelvi modellek
Hahn és Futrell matematikailag is igazolni tudta ezeket a mintákat. A Nature Human Behaviour című folyóiratban bemutatott eredményeik megmutatják, hogy az emberi nyelv a kognitív terhelés csökkentését részesíti előnyben a tömörítés mértékével szemben.
Ezek a felismerések a nagy nyelvi modellek (LLM-ek) fejlesztéséhez is hozzájárulhatnak; ezek azok a rendszerek, amelyek olyan generatív MI-eszközök mögött állnak, mint a ChatGPT vagy a Microsoft Copilot. Azáltal, hogy jobban megértjük, miképpen dolgozza fel az emberi agy a nyelvet, a kutatók olyan MI-rendszereket tervezhetnek, amelyek jobban igazodnak a természetes kommunikációs mintákhoz.



