Wersja z 2014-09-27

Grzegorz Jagodziński

Wstęp do językoznawstwa historycznego

Aby na poważnie zajmować się etymologią, nie wystarczy porównywać różne języki, kierując się tylko wyczuciem. Trzeba przyswoić sobie ogromną wiedzę, bo dopiero ona sprawi, że rozważania staną się rzetelne i wartościowe. W tym artykule zostaną zebrane najbardziej podstawowe informacje, które z każdego laika o otwartym umyśle uczynią specjalistę, już zdolnego do własnych analiz. Zatem zaczynamy!

Otóż większość języków europejskich, niektóre języki Kaukazu, a także wiele języków Indii i Iranu, łączy podobieństwo. Jest ono dość oczywiste dla badaczy, choć nie zawsze widoczne dla laika. Aby się o nim przekonać, warto zacząć od porównania liczebników. Ta metoda nie zawsze okazuje się idealna, mimo to każdy przyzna chyba, że polskie sześć, angielskie six, niemieckie sechs, łacińskie sex, greckie héks, czy sanskryckie ṣaṣ są jednak do siebie podobne. Uwaga: wszystkie te kropki i kreski w cytowanych wyrazach są niezwykle istotne, i pominięcie ich dowodzi kompletnego braku profesjonalizmu. Teksty elektroniczne nie są tutaj żadną barierą, zatem uproszczenia polegające na pominięciu diakrytyków kwalifikują dany tekst od razu jako nadający się tylko do kosza. Nie ma od tego żadnych wyjątków. Znaczenie tych kresek będziemy tłumaczyć na bieżąco.

Już teraz od razu możemy wyjaśnić, że w języku greckim używamy dwuznaków ph, th, kh, ks, ps, które oznaczają w transliteracji pojedyncze litery greckie φ, θ, χ. ξ, ψ. Literę rho ze znajdującym się nad nią przydechem mocnym (ῥ) oddajemy jako rh. Litera h niepoprzedzona spółgłoską p, t, k, r oznacza przydech mocny na początku wyrazu. Wymowa ph, th, kh jak f, þ, x (symbole te objaśnimy niżej) jest późna i w epoce klasycznej nie była znana: wymawiano przydechowe zwarte tak, jak sugeruje transliteracja. Podobnie odróżniano przydechowe rh od zwykłego r. Na początku wyrazu mogło być tylko rh. Wewnątrz wyrazu było albo r, albo zdwojone rrh. Na końcu wyrazu mogło być tylko pojedyncze r.

Obowiązkowo zaznaczamy też miejsce akcentu i jego rodzaj: á = akut czyli akcent prosty wysoki lub rosnący z akcentowaną drugą częścią długiej samogłoski, ã = cyrkumfleks czyli akcent przeciągły z akcentowaną pierwszą częścią długiej samogłoski, à = gravis czyli akcent prosty niski lub opadający z akcentowaną drugą częścią samogłoski długiej. Znak zwany makron (pozioma kreska nad literą) oznacza długość samogłoski: ē, jeśli trzeba, nad nim pisze się akut (ḗ) lub gravis (ḕ). Samogłoska długa jest dwukrotnie dłuższa od krótkiej, trwa dwie mory (jednostki czasu odpowiadające wymówieniu jednej samogłoski krótkiej), czyli jest dwumorowa. Polski normalnie nie zna samogłosek długich, ale w szybkiej, naturalnej mowie zamiast chciałam mówimy często chciãm (z akcentem jak grecki cyrkumfleks). Cyrkumfleks oznacza w greckim jednocześnie automatycznie, że samogłoska jest długa, dodatkowy makron nie jest wówczas konieczny: ẽ. Znak wężyka nad literą to tylda, cyrkumfleks jest nazwą rodzaju akcentu. Znak zwany cyrkumfleksem wygląda inaczej, jak daszek (â). Czasami używa się go zamiast tyldy.

W klasycznej grece długie ē, ō (pisane osobnymi literami η, ω) miały wymowę szeroką, zaś krótkie e, o – wąską, odwrotnie niż wydaje się to naturalne. Tak przynajmniej było w standardowym dialekcie attyckim.

Grecka litera Υ (ypsilon, przez Rzymian zwany „i” greckim, skąd igrek) oddawana jest w transliteracji jako u, jeśli tworzy dwugłoskę z poprzedzającym a, ā, e, ē, o. W każdym innym wypadku oddaje się ją umownie jako y, a jeśli oznacza samogłoskę długą, jako ȳ (lub jako ỹ, jeśli niesie taki akcent). W epoce klasycznej y wymawiano podobnie jak dziś niemieckie ü czy francuskie u, a więc inaczej niż i, a także inaczej niż polskie y.

Zwykłe dwugłoski greckie są dwumorowe. Np. ai nie oznacza tego, co polskie aj (w polskim nie ma dwugłosek!), ale płynne przejście od samogłoski a do samogłoski i (nie do spółgłoski j). W praktyce oznacza to, że trzeba wymówić wyraźniejsze i, dłuższe niż polskie j. Podobnie, tj. jako płynne przejścia od jednej samogłoski do drugiej, wymawiano greckie dwugłoski oi, au, eu. Przy zwykłych dwugłoskach akcent zawsze piszemy nad drugim elementem, np. aĩ, choć akurat cyrkumfleks oznacza, że to pierwszy element był akcentowany.

Dwuznak yi (tj. υι) wymawiano tak, jak się go pisze (pamiętając, że y = niem. ü). Powtórzmy też, że greckie i nigdy nie oznaczało j, dawne j zanikło bowiem w rozwoju języka. Stąd hyiós ‘syn’ najlepiej wymawiać hüi-os z krótką przerwą lub zwarciem krtaniowym między dwugłoską yi a samogłoską o. Podobnie gr. u nigdy nie oznaczało polskiego ł: paideúō ‘wychowuję’ wymawiano z przerwą lub zwarciem krtaniowym między dwugłoską eu a następującą szeroką samogłoską długą ō.

Dwuznak ou bardzo wcześnie zaczął oznaczać jednolitą samogłoskę długą, z tym że najpierw było to ścieśnione długie ọ̄ (kropka pod symbolem oznacza właśnie wymowę ścieśnioną), całkiem różne od szerokiego ō (zapisywanego literą Ω), a później było to już długie ū, i wymowa taka (pomijając zanikłą długość) utrzymała się do dziś. W transliteracji piszemy jednak umownie ou. Podobnie jak w wyrazach hyiós czy paideúō, oddzielano od siebie dwa dyftongi czy długie samogłoski, np. w akoúousin ‘słuchają’ (inaczej otrzymalibyśmy jedno, czteromorowe superdługie ū).

Dwuznak ei pierwotnie oznaczał dwa dźwięki: dwugłoskę ei oraz długie ścieśnione ẹ̄, różne zdecydowanie od szerokiego ē (zapisywanego literą Η). Należy przypuszczać, że w czasach klasycznego języka greckiego oba te dźwięki (ei i ẹ̄) zmieszały się ze sobą, stąd jednolita pisownia ei. Zwyciężyła przy tym wymowa ei jako jednolitej, długiej samogłoski, ścieśnionego ẹ̄. W transliteracji używamy jednak umownie zapisu ei, pamiętając, że wymawiano ten dwuznak jako jednolitą samogłoskę.

Z elementarnej nauki greki wiemy, że jota subscriptum (znak joty podpisany pod symbolem samogłoski) występuje tylko pod długimi samogłoskami, zatem specjalny znak nie jest potrzebny, oddajemy ją zwykłą literą i (nie zapominając o zaznaczeniu długości samogłoski). Do pewnego okresu dziejów jotę podpisaną wymawiano (jako i stanowiące część dwugłoski), potem np. zamiast trzymorowego ēi wymawiano już dwumorowe ē. W transliteracji nie pomijamy jednak podpisanej joty, możemy ją też wymawiać, naśladując wczesną wymowę klasyczną. Przy dwugłoskach długich akcent stawiamy nad pierwszym elementem, np. ḗi, ẽi; trzecia mora nigdy nie niosła akcentu w wymowie.

Warto wiedzieć, że oryginalna wymowa łacińska epoki klasycznej była inna niż ta, której uczą wciąż w niektórych szkołach. I tak, f miało wymowę dwuwargową, a nie wargowo-zębową (przypominało dmuchnięcie przez niedomknięte usta), początkowe h miało wartość przydechu takiego jak w angielskim, a wewnątrz wyrazu było prawdopodobnie dźwięczne (jak w czeskim czy ukraińskim), dwuznaki ph, th wymawiano jak w greckim (skąd na ogół zostały zapożyczone), dwuznak ch oznaczał greckie przydechowe kh, a nie dźwięk taki jak w polskim. Odróżniano też zwykłe r od rh, również pochodzenia greckiego. Dwugłoski ae, oe wymawiano zgodnie z zapisem; ich wymowę jak e uważano za poważny błąd językowy. W pisowni nie odróżniano u od v (pisano stale v, np. AVGVSTVS) ani i od j (pisano i). W literaturze naukowej powszechnie oznacza się długość samogłosek (przy pomocy makronu), choć w oryginalnych tekstach łacińskich robiono to rzadko. Odróżnia się też na ogół j od i (czego nie robi się nawet we współczesnej pisowni watykańskiej) oraz zawsze v od u; pamiętać należy, że w epoce klasycznej v miało wymowę angielskiego w, oraz że po literach q, g, s dziś zwyczajowo zamiast v pisze się u, choć oznacza tu ono angielską spółgłoskę w (zawsze po q, często po s, g).

W epoce klasycznej litera c oznaczała zawsze k, litery k prawie nie używano, a q pisano tylko przed v, dziś u, oznaczającym angielską spółgłoskę w. Stąd centum ‘100’ wymawiano kentum, a Caesar wymawiano kaesar (z wyraźnym ae), a nawet kaisar (stąd niem. Kaiser). Dzisiejsza wymowa c w pewnych pozycjach jak polskiego c ma rodowód prowansalski i została rozpowszechniona wraz z twórczością bardów migrujących po Europie w średniowieczu. W epoce klasycznej nikt nie wymawiał c jak polskiego c. Tak zresztą czytają łacińskie teksty tylko Polacy i Niemcy; Anglicy i Włosi zamiast c wymawiają miękkie cz, a w pewnych pozycjach literę g wymawiają jako miękkie dż. Taka wymowa też nie ma nic wspólnego z klasyczną.

W sanskrycie obowiązuje transliteracja, wypracowana specjalnie dla tego języka. Literę oznaczaną ś wymawiamy podobnie jak w polskim (niektóre źródła stosują pisownię ç), z kolei c oznacza dźwięk podobny do polskiego ć, a j – dźwięk zbliżony do dź. Kropka pod literą oznacza wymowę cerebralną (z czubkiem języka skierowanym ku podniebieniu), jak w liczebniku ṣaṣ (akustycznie sanskryckie ṣ przypomina polskie sz, choć nie jest z nim tożsame). Kółko pod r (czyli symbol r̥) oznacza wymowę sylabiczną, jak w czeskim krk (dziś wymawia się w takich przypadkach ri, ale to nie jest na pewno wymowa klasyczna). Obok zwykłego r̥ istnieje w sanskrycie także odmianka długa r̥̄ (dziś wymawiana rī). Znak ṁ symbolizuje półsamogłoskę nosową; posługując się sanskrycką konwencją polskie ą w wyrazie wąs zapisalibyśmy jako oṁ, zaś ę w wyrazie męski jako eṁ. Symbol ṅ oznacza natomiast tzw. „n tylnojęzykowe”, np. wyraz męka wyglądałby meṅka. Zapisy takie nie są ścisłe, sanskryckie e, o oznaczają bowiem zawsze samogłoski długie, powstałe z dawnych krótkich dwugłosek *ăi, *ău – w tego rodzaju zapisach krótkość samogłoski podkreślamy, używając łuczku nad literą. Asterysk (gwiazdka) zaś oznacza, że podana forma jest rekonstrukcją odnoszącą się do wcześniejszych stadiów rozwoju języka, niezaświadczoną w znanych tekstach (choć bardzo prawdopodobną, a czasami pewną). W zapisie sanskryckich e, o znak długości (makron) nie jest tu potrzebny, bo brak jest ich odpowiedników krótkich. Nie wolno natomiast pomijać znaku makronu przy innych długich samogłoskach: ā, ī, ū, r̥̄. Często piszemy jednak ai, au, pamiętając, że te jednoznaczne zapisy oznaczają dwugłoski (dyftongi) długie, trzymorowe, tj. połączenia długiego ā odpowiednio z i bądź u. Dźwięki oddawane literami y, v wymawiano w sanskrycie jak polskie j, ł. Jedynie w pewnych pozycjach v miało taką wymowę jak ang. v (= polskie w).

Samodzielnie użyta litera h oznacza w sanskrycie zawsze spółgłoskę dźwięczną (jak w czeskim czy ukraińskim); jej bezdźwięcznym odpowiednikiem (podobnym do polskiego ch) jest ḥ (powstałe z końcowego -s lub -r). W sanskrycie występują, podobnie jak w greckim, bezdźwięczne spółgłoski przydechowe: ph, th, ṭh, ch, kh. W tych dwuznakach litera h oznacza więc bezdźwięczny przydech, inaczej niż normalnie (w sanskryckim piśmie devanāgarī odpowiadają im pojedyncze symbole). W przeciwieństwie do greki, mamy tu jednak także przydechowe dźwięczne: bh, dh, ḍh, jh, gh – znak h ma tu już znaczenie zbliżone do typowego, tzn. oznacza przydech dźwięczny. O tym, jak brzmią takie przydechowe dźwięczne, łatwo przekonać się, oglądając filmy Bollywood w wersji oryginalnej (z napisami). Spółgłoski tego typu występują bowiem także we współczesnych językach indyjskich, m.in. w hindi.

W litewskim, podobnie jak w wielu innych językach, symbole š, ž, č, dž oznaczają polskie sz, ż, cz, dż (z tym że litewski odróżnia ich twarde i miękkie odmianki, o czym dalej), a litera v oznacza to, co w angielskim (czyli polskie w). W zapożyczeniach występuje ch o znaczeniu takim, jak w polskim. Ortografia litewska używa symbolu ū dla długiego u, natomiast długie i oznacza literą y. Litera o oznacza normalnie samogłoskę długą, stąd nie ma potrzeby używania znaku makronu (choć w nowszych zapożyczeniach spotykamy także krótkie o, nieodróżniane w standardowej ortografii; w badaniach językoznawczych stosuje się wówczas, jeśli trzeba, symbol ŏ z łuczkiem zwanym brevis). Krótkie e ma wymowę szerszą niż w polskim (odpowiadającą angielskiemu [æ] jak w wyrazie cat [kæt] – zapis w nawiasach kwadratowych oznacza wymowę). Litera ė oznacza natomiast samogłoskę długą i wąską (przypominającą nieco polskie je). W litewskim występują także różne dwugłoski, m.in. ie (wymawiane prawie jak polskie ija) oraz uo (niemal uła) – tu symbol o ma inne znaczenie niż zazwyczaj. Starolitewski znał samogłoski nosowe; do dziś na ich miejscu pisze się ą, ę, į, ų. Obecnie symbole te oznaczają jednak samogłoski ustne długie, przy czym ę wymawia się szeroko (czyli jak długie ǣ, zatem inaczej niż ė), za to różnica między į a y oraz między ų a ū jest czysto ortograficzna. Samogłoski przednie i, į, y, e, ę, ė zawsze zmiękczają poprzedzającą spółgłoskę. Jeśli po miękkiej spółgłosce ma wystąpić samogłoska tylna, używamy jak w polskim litery i (w funkcji zmiękczającej), np. Vìlnius. Zauważmy, że sekwencja znaków ie oznacza dwugłoskę (tylko ten jeden dyftong składa się z i + inna samogłoska), a sekwencja iu dwugłoski nie oznacza, zob. niżej.

W przeciwieństwie do zwykłych tekstów litewskich, w zapisach naukowych zawsze podajemy miejsce i rodzaj akcentu. Gravis oznacza akcent krótki (na samogłosce krótkiej): è, à, ì, ù. Jeśli w zapożyczeniu występuje krótkie o i jest ono akcentowane, również piszemy ò. W wielu wypadkach jednak litewskie akcentowane e, a (ale nie i, u) ulegają wzdłużeniu w wymowie; piszemy wówczas ẽ, ã. Intonacja takiej wtórnie wzdłużonej samogłoski jest rosnąca, litewski cyrkumfleks (zawsze oznaczany znakiem tyldy) ma więc całkiem inne znaczenie niż grecki. Wzdłużone ẽ zachowuje wymowę szeroką. Zgodnie z tym, co napisano, nad literami i, u nie możemy postawić innego znaku akcentu niż gravis – samogłoski zapisywane tymi literami nie ulegają bowiem wzdłużeniu pod akcentem.

Litewskie akcentowane samogłoski (pierwotnie) długie (zapisywane literami ė, o, y, ū) oraz obecnie długie, a kiedyś nosowe (ę, ą, į, ų), mogą mieć intonację rosnącą lub opadającą (faktycznie nie jest to intonacja, ale ton; nazwy „intonacja” używa się tylko ze względów tradycyjnych). Rosnącą intonację zapisujemy, używając znaku tyldy, np. ė̃ (nad literą e powinna znajdować się kropka, a nad nią tylda: jeśli litera nie jest wyświetlana poprawnie, konieczna jest instalacja fontu Doulos SIL), natomiast intonacja opadająca oznaczana jest znakiem akutu, np. ė́. Różnice intonacyjne dotyczą też dyftongów (dwugłosek) ai, au, ei, ie, uo, ui oraz dyftongoidów o postaci samogłoska krótka e, a, i, u + m, n, l, r (o ile oba elementy należą do tej samej sylaby). W zapożyczeniach trafiają się także inne dyftongi i dyftongoidy: eu, oi, ou, ol, or, om, on. Znak akutu piszemy zawsze nad pierwszym elementem (np. ái, ém), przy czym jeśli jest nim i lub u, używamy zamiast niego znaku gravis: ùi, ìe, ùl, ìn. Tyldę stawiamy zawsze nad elementem drugim, nawet jeśli jest nim litera spółgłoskowa, np. aĩ, iẽ, uõ, añ; przy czym wówczas (pierwsza) samogłoska wymawiana jest krócej i mniej wyraźnie (aĩ brzmi dla Polaka niemal jak „głębokie” ei lub yi z wyraźnym i).

W oficjalnej ortografii łotewskiej (a więc nie tylko w zapisie form dla potrzeb lingwistów) używa się makronu do oznaczenia długości samogłoski: ā, ē, ī, ū. Istnieją dyftongi ai, ei, au, ie. Litera o oznacza zwykle dyftong uo; gdy przytacza się wyrazy łotewskie w tekstach naukowych, pisze się często uo zamiast ortograficznego o. W zapożyczeniach ortograficzne o może także oznaczać ŏ (krótkie) lub ō (długie). Ortograficzna litera e oznacza (bez odróżnienia) dwa różne dźwięki: bardzo szeroki, oznaczany w transkrypcji naukowej symbolem ę, czasem ȩ, oraz wąski, oznaczany zwykłą literą e, czasem z dodatkową kropką pod spodem (ẹ). Identyczne rozróżnienie istnieje wobec samogłoski długiej ē: ę̄ oraz ẹ̄. Istnieją tylko nieliczne spółgłoski miękkie, zapisywane w łotewskiej ortografii literami ģ, ķ, ļ, ņ; dawniej istniało także ŗ, dziś wciąż występujące w dialektach. Litera v oznacza zasadniczo ang. v (= pol. w), ale jeśli zamyka sylabę, tworzy z poprzedzającą samogłoską dyftong z drugim elementem u (np. tevs ‘ojciec’, w zapisie naukowym tęvs, wymawia się tæ͡us – łuk symbolizuje wymowę dwugłoskową, tj. płynne przejście od jednej samogłoski do drugiej). Podobnie ortograficzne j zamykające sylabę buduje dyftong z poprzedzającą samogłoską. Podobnie jak w litewskim, zamykające sylabę m, n, ņ, l, ļ, r, ŗ tworzą z poprzedzającą samogłoską dyftongoidy.

Akcent w łotewskim pada zasadniczo stale na pierwszą sylabę wyrazu. Jeśli akcentowana samogłoska jest krótka, akcentu nie oznacza się w ogóle lub stosuje się znak gravis. Jeśli akcentowana jest samogłoska długa lub dyftong, możliwy jest jeden z trzech tonów. Ton równy długiej samogłoski akcentowanej zaznacza się znakiem tyldy, często z pominięciem makronu, np. ã. W zwykłej pisowni używa się jednak litery ā, dlatego czasem w pracach naukowych pisze się ā̃. Ton opadający zapisuje się znakiem gravis, przy czym wówczas ortograficznego makronu pominąć już nie można: à oznacza krótką samogłoskę akcentowaną, ā̀ oznacza długą samogłoskę akcentowaną (ortograficzne ā), wymawianą tonem opadającym. Istnieje jeszcze jeden, specjalny ton, zwany łamanym (w trakcie wymawiania długiej samogłoski dochodzi do zbliżenia więzadeł głosowych lub nawet zwarcia krtaniowego), oznaczany znakiem cyrkumfleksu, tj. daszkiem: â. Znak makronu nie jest wówczas potrzebny, ale skoro ortograficznie pisze się ā, to niektórzy badacze używają symbolu ā̂. Osobliwością łotewskiego jest to, że długa samogłoska nieakcentowana (w sylabie niepoczątkowej) może mieć albo ton równy, i wtedy używa się samego makronu (ā), albo ton łamany, i wtedy w tekstach naukowych używa się daszka (â). Tony mogą także różnicować łotewskie dyftongi i dyftongoidy – znak gravis pisze się wówczas zawsze nad pierwszym elementem, natomiast tyldę lub daszek nad elementem drugim, np. ìm, im̃, im̂. Zauważmy, że w dyftongach (np. iẽ, aû) zapisy ẽ, ĩ, ũ oraz ê, î, û nie oznaczają długości samogłoski – w zwykłej ortografii nie ma tu makronu.

System tonalny istnieje także w niektórych językach słowiańskich. Oznaczenia tonów są ustalone, jednak nie stosuje się ich w zwykłych tekstach. W języku serbsko-chorwackim każda samogłoska (w tym także sylabiczne r, jak w czeskim krk) może być krótka lub długa. Jeśli nie jest przy tym akcentowana, krótkości nie oznacza się, a do oznaczenia długości stosuje się makron (ā); w standardowym języku długie mogą być tylko nieakcentowane samogłoski poakcentowe, nigdy przedakcentowe. Jeśli jest akcentowana, może być wymawiana tonem rosnącym lub opadającym, co razem z długością daje 4 możliwe kombinacje. Ton krótki opadający oznacza się podwójnym symbolem gravis: ȁ, ȅ, ȉ, ȍ, ȑ, ȕ. Ton krótki rosnący oznacza się pojedynczym znakiem gravis: à, è, ì, ò, ù. Ton długi opadający symbolizuje odwrócony łuczek brevis: ȃ, ȇ, ȋ, ȏ, ȓ, ȗ. Wreszcie ton długi rosnący oznacza się akutem: á, é, í, ó, ŕ, ú. Jeśli akcentowana jest pierwsza samogłoska wyrazu, może mieć każdy z 4 tonów, przy czym ton jest opadający, jeśli miejsce akcentowania jest pierwotne. Wyrazy jednosylabowe mają właśnie dlatego stale taki ton. Ton rosnący sylaby początkowej jest tylko wówczas, gdy pierwotnie akcentowana była sylaba następna. Dowolna wewnętrzna (niepoczątkowa i niekońcowa) sylaba może natomiast mieć tylko ton rosnący. Osobliwością serbsko-chorwacką jest też odróznienie ć od č (wymawianych trochę podobnie jak ć i cz w polskim) oraz istnienie dźwięku przypominającego polskie dź, a zapisywanego dowolnie đ lub dj.

W języku słoweńskim system tonalny jest dziś w stadium zaniku, zastępuje go akcent dynamiczny. Wciąż jednak dość spora część użytkowników odróżnia w wymowie tony. Akcentowane samogłoski krótkie mogą wystąpić tylko w sylabie końcowej, i mają wówczas na ogół ton opadający lub wysoki typu ȁ, i tylko wyjątkowo samogłoska zredukowana może mieć także krótki ton rosnący lub niski: ə̀. Akcentowane samogłoski w sylabie niekońcowej (inne niż samogłoska zredukowana ə) są na ogół długie i mogą mieć ton opadający (wysoki) typu ȃ lub rosnący (niski) typu á. Samogłoski takie mogą także występować w sylabach końcowych. Istnieją także samogłoski długie w sylabach nieakcentowanych.

W słoweńskiej ortografii litera e oznacza trzy różne samogłoski: otwarte e, wąskie (zamknięte) ẹ oraz zredukowane ə, zapisywane także ë; odróżnia się je ściśle w tekstach naukowych. Litera o oznacza dwa różne dźwięki: otwarte o oraz wąskie (zamknięte) ọ. Jeśli e, o są akcentowane i krótkie, to są otwarte. Tak samo otwarte i krótkie są e, o poakcentowe, natomiast przed akcentem występują warianty zamknięte ẹ, ọ. Długie akcentowane mogą być zarówno otwarte, jak i zamknięte. Samogłoska ə jest krótka, ale grupa ər w tej samej sylabie jest traktowana jak samogłoska długa. Tradycyjnie zapisuje się ją pojedynczą literą r.

Litera v oznacza w wymowie półsamogłoskę wargowo-zębową, czyli dźwięk pośredni między polskim ł a w. Zamykające sylabę v zlało się z l – zamiast nich wymawia się [w], czyli polskie ł. Nie oddaje tego faktu ortografia. W słoweńskim, tak samo jak w serbsko-chorwackim, litera h oznacza spółgłoskę bezdźwięczną, dźwięk pośredni między polskim ch a przydechem.

W zapisie takich języków słowiańskich jak rosyjski, białoruski, ukraiński, bułgarski, znak akutu określa miejsce akcentu, który jest ruchomy i może padać na dowolną sylabę wyrazu. W bułgarskim występuje specjalny dźwięk, rodzaj zredukowanego a, oznaczany w naukowej transkrypcji znakiem ъ lub ă; popularnie pisze się także y. W transliteracji języków słowiańskich używających cyrylicy dźwięk odpowiadający polskiemu ch oddaje się często literą x. Litera h oznacza natomiast spółgłoskę krtaniową dźwięczną (bezpośrednie zestawienie ze słoweńskim i serbsko-chorwackim może być więc mylące).

W językach czeskim i słowackim występuje długość samogłosek, nie występują natomiast tony, a akcent pada stale na pierwszą samogłoskę wyrazu. Litera y oznacza dźwięk i, ale niepowodujący zmiękczenia poprzedzającej spółgłoski. Akut (np. á) oznacza tutaj długość samogłoski, a nie miejsce akcentu. W czeskim występuje specjalny dźwięk ř, różny od ž, pośredni między polskimi r a ż. Częste są też zgłoskotwórcze r, l. Miękkie odmiany t, d oznacza się literami ť, ď. Znak ů oznacza długie u powstałe z o, identyczne w wymowie jak ú. W słowackim występuje także miękkie ľ. Poza tym w języku tym zgłoskotwórcze r, l mogą być długie, i wówczas oznacza się je ŕ, ĺ. Znak ä oznacza dźwięk pośredni między a a e, dziś zwykle wymawiany jak zwykłe e. Znak ô oznacza dwukłoskę uo.

Zestawienia zbieżności takie jak powyższe porównanie liczebników, upoważniły badaczy już dawno temu do postawienia tezy o wspólnym pochodzeniu niektórych języków Europy i Azji od jednego języka, nazwanego praindoeuropejskim (PIE) lub krócej po prostu indoeuropejskim. Wedle hipotezy mającej najwięcej zwolenników, był on używany na stepach Ukrainy i południowej Rosji około 6 tysięcy lat temu (czyli około roku 4000 p.n.e.). Jego potomkowie to języki indoeuropejskie. Innego pochodzenia są w Europie jedynie takie języki jak turecki, węgierski, fiński, estoński oraz przede wszystkim baskijski (najbardziej odrębny z nich wszystkich). Nie są to wszystkie wyjątki: nieindoeuropejskie są też różne mniej znane języki używane w Rosji, zwłaszcza nad Wołgą i na przedpolach Kaukazu, oraz w Kazachstanie, którego zachodnia część również leży w Europie.

Języki indoeuropejskie podzielono na kilkanaście grup. Języki w obrębie każdej z nich łączy między sobą znacznie bliższe pokrewieństwo niż to istniejące pomiędzy grupami. Język polski należy do grupy słowiańskiej, podobnie jak rosyjski, ukraiński, czeski, serbsko-chorwacki czy bułgarski, by wymienić tylko niektóre. Z kolei portugalski, hiszpański, francuski, włoski, rumuński to przedstawiciele języków romańskich (wywodzących się z historycznej łaciny), a niemiecki, angielski, szwedzki, islandzki, a także wymarły gocki, to członkowie grupy języków germańskich. Oprócz tego mamy jeszcze grupę bałtyjską (często błędnie określaną jako bałtycka); tworzą ją języki litewski i łotewski, a także wymarły pruski, czasami nazywany też staropruskim. Do grupy celtyckiej należą m.in. iryjski (błędnie zwany irlandzkim) i walijski. Grupę irańską tworzą na przykład wymarły język awestyjski, czyli język świętych tekstów Awesty, współczesny język perski, ale też kurdyjski i osetyński (z Kaukazu). Do grupy indyjskiej należą hindi i urdu (stanowiące odmiany jednego języka), ale także bengalski, nepalski czy marathi, wszystkie wywodzące się z używanego wieki temu języka wedyjskiego, znanego też w sztucznie unormowanej wersji jako sanskryt, o którym była mowa wyżej. Osobną grupę stanowi język grecki, przy czym nazwa ta jest nieścisła, bo greka klasyczna ma tak naprawdę niewiele wspólnego z greką współczesną (tzn. osoba znająca nowogrecki nie ma szans na zrozumienie tekstów Homera bez specjalnych studiów, choć oczywiście dzisiejszy grecki wywodzi się od tamtego starożytnego). Odrębne, izolowane grupy stanowią także język albański i ormiański, a z wymarłych m.in. tracki i mało znany iliryjski. Łacina była członkiem grupy italskiej, obok takich (o wiele słabiej znanych) języków jak oskijski, umbryjski czy wenetyjski. W chińskim Turkiestanie mówiono kiedyś językami z grupy tocharskiej. Wreszcie w starożytnej Anatolii (czyli w dzisiejszej Turcji) mówiono różnymi językami anatolijskimi; najbardziej słynny z nich jest hetycki.

Bardzo dawno temu zauważono też, że wśród języków indoeuropejskich można wyróżnić dwie odrębne grupy nadrzędne, określane mianem centum (kentum) i satem (a właściwie satəm) – nazwane tak od brzmienia liczebnika „100” w należących do tych grup odpowiednio łacinie i awestyjskim. Symbol ə, podobnie jak w angielskiej pisowni fonetycznej, oznacza tu krótką samogłoskę centralną o niejasnej barwie, choć zwykle uważaną za pośrednią między polskimi a a y. Choć podobieństwo formy polskiej sto do awestyjskiej satəm nie jest wcale oczywiste, można się słusznie domyślać, że polski, podobnie jak inne języki słowiańskie, należy do grupy satəm.

Okazuje się, że w prajęzyku musiały istnieć trzy odmiany dźwięków typu *k, *g, nazywanych przez lingwistów welarnymi. Zwykłe welarne początkowo nie uległy zmianom w żadnym języku, a często nie zmieniły swojej artykulacji do dziś i nadal pozostają welarne. Mogły jednak później podlegać zmianom wtórnym, o których powiemy niżej. Drugi rodzaj, welarne spalatalizowane, oznaczane symbolami w rodzaju *ḱ, *ǵ, występują pierwotnie jako zwykłe k, g w językach kentum, natomiast w językach satəm znajdujemy na ich miejscu całkiem inne dźwięki. W językach słowiańskich i irańskich są to s, z, w litewskim š, ž (wymawiane jak polskie sz, ż), w sanskrycie ś, j (znaczenie symbolu ś jest niemal identyczne jak w polskim). Wreszcie trzeci rodzaj, to welarne labializowane, wymawiane z zaokrągleniem warg, i oznaczane *kʷ, *gʷ. W językach satəm ich dodatkowa cecha artykulacyjna, czyli labializacja, po prostu zanikła, choć czasem pozostały po niej ślady. Natomiast w językach kentum zachowała się do dziś gorzej lub lepiej: łacińskie qu to na ogół właśnie dawne labializowane *kʷ.

W języku polskim, podobnie jak w wielu innych znanych językach, spółgłoski właściwe dadzą się podzielić na dwie grupy: bezdźwięczne i dźwięczne. W indoeuropejskim prajęzyku rekonstruuje się jednak nie dwa, ale trzy takie szeregi spółgłosek zwartych. Oprócz bezdźwięcznych *p, *t, *ḱ, *k, *kʷ istniały więc zwykłe dźwięczne *b, *d, *ǵ, *g, *gʷ, ale także dźwięczne przydechowe *bh, *dh, *ǵh, *gh, *gʷh, o wymowie takiej właśnie, jaką do dziś słyszymy w językach indyjskich. W językach słowiańskich, tak samo jak w bałtyjskich, irańskich i zasadniczo celtyckich, oba szeregi dźwięcznych zmieszały się ze sobą, czasami bez żadnych śladów. Także w anatolijskich zachowało się zapewne tylko odróżnienie bezdźwięcznych od dźwięcznych, choć w innej postaci, ale nie zawsze notuje to niedoskonała ortografia. W tocharskich zlały się z kolei wszystkie trzy szeregi spółgłosek tak, że pozostały tylko spółgłoski bezdźwięczne. W innych językach jednak zachowały się, gorzej lub lepiej, pierwotne trzy szeregi, co możemy prześledzić często nawet dziś.

I tak, w językach indyjskich nie tylko zachowały się dawne opozycje, ale nawet powstał kolejny, nowy szereg spółgłosek bezdźwięcznych przydechowych, o którym powiemy później. Jeśli w jednym wyrazie występowały dwie kolejno następujące po sobie dźwięczne przydechowe, to wówczas pierwsza utraciła przydech (np. Buddha pochodzi od rdzenia *bhudh-), co czasem przeszkadza w analizach etymologicznych.

W greckim dźwięczne przydechowe stały się bezdźwięcznymi przydechowymi. Polskiemu d odpowiada więc czasem greckie i sanskryckie d, a czasem sanskryckie dh i greckie th. Już po ubezdźwięcznieniu zaszła w greckim zmiana analogiczna jak w językach indyjskich: z dwóch kolejnych przydechowych, pierwsze traciła przydech. W efekcie np. dawnemu *dh może niekiedy odpowiadać greckie t, ale nigdy d. Spółgłoski welarne labializowane istniały w najstarszej epoce, potem jednak zmieszały się w dość złożony sposób. Przed spółgłoską labializacja zanikła, przed samogłoską przednią (i, e, ī, ē) powstawała spółgłoska zębowa t, d, th, przed innymi samogłoskami spółgłoska wargowa p, b, ph.

W łacinie różnica dwóch szeregów dźwięcznych została także często zachowana, choć po s, m, n dźwięczne przydechowe utraciły przydech. Poza tym rozwój przypuszczalnie był początkowo taki jak w greckim, z tym że nie doszło do zmian, gdy wyraz zawierał dwie spółgłoski przydechowe. Spółgłoski takie rozwinęły się następnie w szczelinowe, czyli spiranty: *φ, *þ, *x, *xʷ. Symbol φ oznacza dźwięk podobny do f, ale wymawiany bez udziału zębów, samymi wargami. Dla uproszczenia pisze się zwykle zwykłe f (zresztą jak już mówiliśmy, w łacinie f zachowało taką dwuwargową wymowę bardzo długo). Symbol þ zapożyczony jest z pisowni starogermańskiej i oznacza międzyzębowy angielski dźwięk th jak w thank, zamiast niego pisze się też θ. Symbol x z kolei oznacza spółgłoskę welarną szczelinową, czyli polskie ch wypowiadane bez nadmiernych uproszczeń (zamiast x pisze się często χ, co nie jest do końca poprawne). Następnie na początku wyrazu dawne *þ zmieszało się z *f (podobny proces faktycznie ma dziś miejsce w angielskim, tak że zamiast thank słychać często fank), podobną zmianę w f przeszło też *xʷ. Wewnątrz wyrazu, głównie między samogłoskami, wszystkie szczelinowe, w tym także odziedziczone *s, udźwięczniły się. Powstałe w ten sposób dźwięki uległy kolejnym zmianom:

*z (powstałe z *s) uległo następnie zmianie w r (proces ten nazwano rotacyzmem),
*ɣ (dźwięczny odpowiednik *x, powstały z tego właśnie dźwięku, który z kolei rozwinął się z *ǵh, *gh) stało się przydechem h,
*ɣʷ (z wcześniejszego *xʷ i z jeszcze starszego *gʷh) dało *w (symbol ten oznacza angielskie w, czyli polskie ł), zapisywane zwyczajowo v (wymowa tego dźwięku taka jak angielskiego v, tj. taka, jak polskie w, pojawiła się znacznie później, zapewne pod koniec istnienia cesarstwa rzymskiego),
*β (symbol ten oznacza dźwięk szczelinowy dwuwargowy, jak w wymowie hiszpańskiej v, b między samogłoskami, powstały z *φ (*f), a wcześniej z *bh) rozwinęło się w b,
*ð (symbol oznaczający międzyzębową dźwięczną taką jak ang. th w this, czasami zapisywaną δ, dźwięczny odpowiednik *þ i pochodzący z takiego właśnie dźwięku, a wcześniej z *dh) rozwinęło się najczęściej w d, ale czasem w b.

W rezultacie np. na miejscu polskiego d czasem znajdziemy w łacinie d, czasem na początku wyrazu f, wreszcie czasem wewnątrz wyrazu b. Różnica jest i wśród welarnych: na miejscu naszych g oraz z (to drugie z odmianki spalatalizowanej, o czym wyżej) mamy w łacinie raz g, innym razem h, a czasem nawet brak dźwięku – bo h z takiego czy innego powodu zniknęło.

Ciekawe perypetie miały spółgłoski zwarte w językach germańskich, doszło tam bowiem do procesu zwanego przesuwką spółgłosek (określona regułą Raska – Grimma). Schematycznie można by ten proces zapisać tak: gh → g → k → h, co uzasadnia nazwę „przesuwka”. Stare *gh przesunęło się bowiem na miejsce g, stare *g przesunęło się na miejsce k, wreszcie stare *k dało całkiem nowy dźwięk („wysunęło się” ze schematu), mianowicie krtaniowe bezdźwięczne h, choć pierwotnie była to welarna szczelinowa x (= pol. ch). W pewnych warunkach (określonych regułą Vernera) zamiast owego dźwięku pojawiło się jednak g – zależało to od pierwotnego miejsca akcentu (reguła ta działała po samogłosce nieakcentowanej). A tak oto wyglądała przesuwka dla dwóch innych szeregów: dh → d → t → þ, bh → b → p → f.

Podane schematy nieco rozmijają się z prawdą; szczególnie przejścia gh → g, dh → d, bh → b są bardzo teoretyczne. Naprawdę było bowiem tak, że w pierwszym etapie PIE dźwięczne przydechowe *gh, *dh, *bh rozwinęły się germańskim w dźwięczne szczelinowe *ɣ, *ð, *β (znaczenie symboli jak wyżej przy łacinie), i w części wypadków rozwój zatrzymał się na tym etapie. W angielskim na przykład *gh zwykle zostaje w tej postaci w pisowni (gh oznaczające pierwotnie *ɣ) i zanika zupełnie w wymowie, zaś *bh (później *β) daje v, a nie b. Jedynie *dh > *ð (znak większości oznacza kierunek zmian, od dawniejszego do nowszego) konsekwentnie dochodzi w angielskim aż do etapu d (ale np. w islandzkim dawne ð często pozostaje i jest zapisywane właśnie tym symbolem także we współczesnej pisowni islandzkiej). Reguła Vernera działała właśnie na etapie istnienia dźwięcznych szczelinowych; objęła nowe dźwięki *φ, *þ, *x powstałe z PIE *p, *t, *k (oraz *ḱ), udźwięczniając je po nieakcentowanej do *ɣ, *ð, *β. W tych samych warunkach uległo jej również *s, dając *z, z którego następnie w większości języków germańskich (poza gockim) rozwinęło się r (rotacyzm germański). W gockim z kolei końcowa spółgłoska wyrazu ubezdźwięczniła się, stąd islandzkiej końcówce mianownika -r (w pewnej klasie rzeczowników) odpowiada gockie -s (PIE miał tu -*s, germański -*z, które w gockim dało z powrotem -s, a w islandzkim uległo rotacyzmowi). W najstarszych runicznych inskrypcjach nordyckich to nowe r < *z (znak mniejszości oznacza „powstałe z”) różniło się zapisem od zwykłego, dawnego r; w transliteracji takie wtórne r < z zapisujemy umownie jako R. Różnica w rzeczywistej wymowie między nordyckimi r oraz R może być niestety jedynie przedmiotem spekulacji, w nowszych tekstach ujednolicają się one do jednego r.

Osobliwy rozwój mają też dawne welarne labializowane. Stare PIE *gʷh > *ɣʷ daje na ogół wszędzie w i tylko po nosowej gw, *gʷ rozwija się w *kʷ i następnie w kw (w angielskiej pisowni qu, w gockiej używa się litery q bez towarzyszącego u jak to dzieje się w łacinie) lub w zwykłe k, wreszcie PIE *kʷ daje germańskie *xʷ lub *ɣʷ > *w (zgodnie z regułą Vernera, tj. w zależności od akcentu); dla tego pierwszego istnieje w gockim specjalna litera ƕ, w angielskim odpowiada mu dwuznak wh, w islandzkim spotykamy pisownię hv (dziś oznaczającą faktycznie kv).

W późniejszej historii języka angielskiego dawne h zanika na ogół wewnątrz wyrazu, dawne þ zapisywane dziś th ma wymowę þ lub ð w zależności od pozycji, a dawne f często udźwięcznia się do v (i w ten sposób zlewa z v pochodzącym z *bh).

W niemieckim nastąpiła kolejna, druga przesuwka, trochę mniej konsekwentna i bardziej urozmaicona, niemniej wciąż wyraźna: þ → d → t → z lub ß (przy czym z pojawia się na początku wyrazu i oznacza w niemieckiej pisowni to, co w polskiej c, zaś ß rozwija się wewnątrz wyrazu i jest to symbol powstały z dwuznaku sz, oznaczającego „ostre” s, pierwotnie różniące się w wymowie od zwykłego s). Zmianom uległy także niektóre inne spółgłoski, zwłaszcza p → pf, a wewnątrz wyrazu także k → ch (oznaczającego ten dźwięk, co i w polskim). Dlatego właśnie pol. jabłko = ang. apple = niem. Apfel: dawne PIE *b, u nas zachowane, dało (w angielskim) po pierwszej przesuwce p (zdwojenie ma charakter czysto ortograficzny), a po drugiej pf (w niemieckim). Dlatego też pol. do = ang. to = niem. zu, i tak samo pol. dwa = ang. two = niem. zwei. Konsekwentnie zmieniły się w niemieckim spółgłoski podwojone (różnego pochodzenia, niekiedy nie do końca jasnego): PG (pragermańskie) *bb, *dd, *gg > pp, tt, ck (oznaczające kk) oraz PG *pp, *tt, *kk > pf, tz, ch (w starszej pisowni hh). Dziś na ich miejscu wszędzie wymawia się pojedyncze dźwięki, zdwojenie z reguły zostało jednak w ortografii.