Tikriausiai ne kartą teko skaityti naujienų antraštes, kuriose skelbiama, jog vidutinis atlyginimas šalyje ir vėl pasiekė rekordines aukštumas, tačiau pažvelgę į savo ar draugų pajamas, susimąstote: kur tie didžiuliai pinigai? Toks neatitikimas tarp oficialios statistikos ir kasdienės realybės dažniausiai atsiranda ne dėl to, kad kažkas meluoja, o dėl to, jog mes ne visada teisingai interpretuojame pateiktus duomenis. Matematikoje, ekonomikoje ir statistikoje egzistuoja keli skirtingi būdai apibūdinti duomenų centrą, tačiau patys populiariausi ir dažniausiai viešojoje erdvėje sutinkami yra du: aritmetinis vidurkis ir mediana. Nors abu šie terminai iš pirmo žvilgsnio atrodo panašūs ir yra skirti tam pačiam tikslui – parodyti tam tikrą „normą“ ar vidurį, jų skaičiavimo metodika ir visuomenei perduodama žinutė kardinaliai skiriasi. Gebėjimas atskirti šiuos du statistinius dydžius yra ne tik finansinio raštingumo, bet ir kritinio mąstymo pagrindas, leidžiantis kur kas objektyviau vertinti ekonominę situaciją, nekilnojamojo turto rinkos tendencijas, infliacijos poveikį ar netgi konkrečių įmonių pateikiamus veiklos rezultatus.
Kas iš tiesų yra vidurkis ir kaip jis skaičiuojamas matematikoje?
Aritmetinis vidurkis yra pats žinomiausias ir dažniausiai naudojamas statistinis rodiklis. Jį mokykloje mokosi apskaičiuoti kiekvienas, o pats principas yra itin paprastas. Vidurkis parodo bendrą visų reikšmių sumą, padalintą iš tų reikšmių skaičiaus. Šis rodiklis atsižvelgia į absoliučiai kiekvieną duomenų rinkinyje esantį skaičių, nesvarbu, ar jis yra labai mažas, ar neįtikėtinai didelis.
Pavyzdžiui, įsivaizduokite, kad norite sužinoti penkių draugų vidutinį amžių. Jų amžius yra 20, 22, 24, 25 ir 29 metai. Sudėję visus šiuos skaičius gauname 120. Padalinę šią sumą iš penkių (žmonių skaičiaus), gauname 24. Vadinasi, šios grupės amžiaus vidurkis yra 24 metai. Šiame pavyzdyje vidurkis puikiai atspindi realybę, nes visi skaičiai yra gana arti vienas kito.
Tačiau vidurkis turi vieną labai didelį trūkumą – jis yra ypač jautrus vadinamosioms ekstremalioms reikšmėms, dar vadinamoms išskirtimis. Jeigu į mūsų penkių jaunuolių grupę staiga ateitų 80-metis senelis, bendra amžiaus suma išaugtų, ir naujas vidurkis taptų kur kas didesnis, nors penkių iš šešių žmonių amžius nepasikeitė. Būtent dėl šios priežasties vidurkis dažnai iškreipia realų vaizdą, kai kalbame apie duomenis, kuriuose yra didelių skirtumų, pavyzdžiui, apie atlyginimus ar turto vertę.
Kas yra mediana ir kodėl ji dažnai atspindi realybę kur kas tiksliau?
Skirtingai nei vidurkis, mediana nėra skaičiuojama sudedant ir dalinant. Mediana yra paprasčiausias vidurinis taškas duomenų eilėje, kai visi skaičiai yra išrikiuojami didėjimo arba mažėjimo tvarka. Ji padalina visą duomenų rinkinį į dvi lygias dalis: pusė visų reikšmių yra mažesnės už medianą, o kita pusė – didesnės.
Medianos radimo procesas yra vizualus ir logiškas. Norint rasti medianą, reikia atlikti šiuos žingsnius:
- Surinkti visus turimus duomenis (pavyzdžiui, darbuotojų atlyginimus).
- Išrikiuoti šiuos skaičius nuo mažiausio iki didžiausio.
- Rasti patį vidurinį skaičių eilėje. Šis skaičius ir bus mediana.
Jeigu paimtume tuos pačius penkis draugus, kurių amžius yra 20, 22, 24, 25 ir 29 metai, ir juos išrikiuotume eilės tvarka, pats vidurinis asmuo būtų trečiasis. Jo amžius yra 24 metai. Šiuo atveju mediana sutampa su vidurkiu. Bet pažiūrėkime, kas nutinka, kai atsiranda ekstremali reikšmė. Tai atskleidžia tikrąją medianos stiprybę – atsparumą neįprastiems nukrypimams.
Esminiai skirtumai tarp medianos ir vidurkio: klasikinis milijonieriaus pavyzdys
Norint geriausiai suprasti, kuo skiriasi šie du statistiniai rodikliai, verta panagrinėti klasikinį pavyzdį, kuris dažnai vadinamas „milijonieriaus bare“ fenomenu. Įsivaizduokite, kad nedideliame bare sėdi dešimt paprastų žmonių. Kiekvieno iš jų mėnesio pajamos yra lygiai 1000 eurų. Šiuo atveju ir atlyginimų vidurkis, ir mediana yra lygiai 1000 eurų. Realybė atspindėta idealiai.
Staiga durys atsidaro ir į barą užeina milijardierius, kurio mėnesio pajamos siekia 10 000 000 eurų. Dabar bare yra vienuolika žmonių. Pažiūrėkime, kas nutinka statistikai:
- Naujasis vidurkis: Sudedame visų dešimties žmonių pajamas (10 000 eurų) ir pridedame milijardieriaus pajamas (10 000 000 eurų). Gauname 10 010 000 eurų. Padaliname šią sumą iš 11 žmonių. Naujasis atlyginimų vidurkis tampa maždaug 909 090 eurų.
- Naujoji mediana: Išrikiuojame vienuolikos žmonių pajamas nuo mažiausios iki didžiausios. Dešimt žmonių uždirba po 1000 eurų, o vienuoliktas – 10 mln. eurų. Ieškome vidurinio žmogaus – tai yra šeštasis asmuo eilėje. Šeštojo asmens pajamos vis dar yra 1000 eurų. Taigi, mediana lieka 1000 eurų.
Jei rytoj laikraščiai parašytų, kad „vidutinis baro lankytojų atlyginimas siekia beveik milijoną eurų“, tai matematiškai būtų visiška tiesa. Tačiau realybėje dešimt iš vienuolikos žmonių sunkiai suduria galą su galu. Būtent todėl mediana yra kur kas sąžiningesnis rodiklis, kai kalbame apie nelygiaverčius, smarkiai išsiskiriančius duomenis.
Kada geriau naudoti vidurkį, o kada vertėtų kliautis tik mediana?
Statistikoje nėra „gero“ ar „blogo“ rodiklio – abu jie yra naudingi įrankiai, atliekantys skirtingas funkcijas, priklausomai nuo situacijos ir analizuojamų duomenų struktūros.
Aritmetinis vidurkis yra nepakeičiamas, kai: duomenys pasiskirstę tolygiai, simetriškai ir juose nėra ekstremalių, iš konteksto iškrentančių reikšmių. Vidurkis idealiai tinka analizuojant moksleivių testų rezultatus, oro temperatūros pokyčius dienos metu ar gamybos procesų našumą. Kadangi vidurkis atsižvelgia į absoliučiai visą informaciją, jis padeda tiksliai apskaičiuoti bendrus biudžetus ar prognozuoti resursų poreikį.
Mediana yra kur kas pranašesnė, kai: duomenys yra asimetriški arba turi vadinamąją „ilgąją uodegą“ į vieną pusę. Ryškiausi to pavyzdžiai yra gyventojų pajamos ir nekilnojamojo turto kainos. Pajamų statistikoje visada yra mažuma žmonių, uždirbančių dešimtis ar šimtus kartų daugiau nei absoliuti dauguma dirbančiųjų. Ši mažuma dirbtinai išpučia vidurkį, sukurdama iliuziją apie aukštą pragyvenimo lygį. Mediana tokioje situacijoje atlieka stabilizatoriaus vaidmenį ir parodo tikslią ribą, skiriančią turtingesnę visuomenės pusę nuo skurdesnės.
Dažniausiai užduodami klausimai (DUK) apie statistinius dydžius
Ar mediana ir vidurkis kada nors gali sutapti?
Taip, mediana ir vidurkis gali būti visiškai lygūs, tačiau tai nutinka tik tada, kai duomenys yra idealiai simetriški. Tai vadinama normaliuoju pasiskirstymu (arba Gauso kreive). Pavyzdžiui, matuojant atsitiktinai parinktų suaugusių vyrų ūgį didelėje populiacijoje, tiek vidurkis, tiek mediana bus labai artimi arba lygūs, nes labai aukštų ir labai žemų vyrų skaičius yra panašus, o dauguma koncentruojasi ties centru.
Kaip rasti medianą, jei turimas duomenų kiekis yra lyginis?
Jei duomenų kiekis yra nelyginis (pvz., 5, 7, 9 elementai), mediana visada yra tikslus vidurinis skaičius. Tačiau jeigu duomenų kiekis yra lyginis (pvz., 6, 8, 10 elementų), vieno vidurinio skaičiaus nėra. Tokiu atveju reikia paimti du pačius vidurinius skaičius, juos sudėti ir padalinti iš dviejų. Pavyzdžiui, turime skaičių eilę: 2, 4, 6, 8. Viduryje yra skaičiai 4 ir 6. Jų suma yra 10, padalinus iš dviejų, gauname 5. Šios skaičių eilės mediana yra 5.
Kodėl valstybės institucijos ir naujienų portalai dažniau skelbia vidurkį, o ne medianą?
Tam yra keletas priežasčių. Visų pirma, vidurkį yra lengviau apskaičiuoti dideliems duomenų masyvams, nes nereikia visų duomenų išrikiuoti eilės tvarka (kas reikalauja daugiau skaičiavimo resursų). Antra, vidurkis istoriškai yra geriau pažįstamas visuomenei iš mokyklos suolo. Tačiau yra ir politinis niuansas: augant ekonomikai, itin turtingų žmonių pajamos auga greičiau, todėl vidurkis kyla sparčiau nei mediana. Vyriausybėms ir politikams visada parankiau skelbti gražesnius, t. y. didesnius, skaičius, kurie kuria didesnės sėkmės iliuziją.
Ką reiškia, jei atlyginimų vidurkis yra daug didesnis už medianą?
Jeigu matote statistiką, kurioje vidurkis smarkiai lenkia medianą, tai yra aiškus signalas apie didelę turtinę nelygybę tiriamoje grupėje. Tai reiškia, kad didžioji dalis žmonių uždirba palyginti mažai (tai rodo mažesnė mediana), tačiau nedidelė grupė asmenų uždirba neproporcingai dideles sumas, kurios ir tempia matematinį vidurkį į viršų. Tai klasikinis dešiniosios asimetrijos pavyzdys statistikoje.
Duomenų interpretavimo klaidos ir informacijos tikrinimo svarba kasdienybėje
Gyvename informacijos ir didžiųjų duomenų epochoje, kur skaičiai ir grafikai yra nuolat naudojami formuojant viešąją nuomonę, parduodant prekes ar politines idėjas. Atpažinti situacijas, kuomet statistika manipuliuojama pasirenkant patogesnį, bet mažiau tikslų rodiklį, yra gyvybiškai svarbus įgūdis. Nors aritmetinis vidurkis nėra melas pats savaime, jo pateikimas be jokio konteksto gali smarkiai iškreipti suvokimą apie tikrąją padėtį. Kuomet įmonė skelbia, kad jos darbuotojų „vidutinis atlyginimas yra itin konkurencingas“, verta pasidomėti, kiek iš tiesų uždirba eilinis specialistas, o kokią dalį šio vidurkio sudaro vadovybės premijos.
Kaskart skaitydami straipsnį apie kylančias kainas, gerėjantį gyvenimo lygį ar naujus statistinius tyrimus, atkreipkite dėmesį į tai, kokie matavimo vienetai yra naudojami. Neapsiribokite viena antrašte. Jei pranešime minimas tik vidurkis, pamėginkite paieškoti medianos – dažnai šis skaičius būna giliau paslėptas tekste ar oficialiose duomenų bazėse, bet būtent jis suteiks jums realistiškiausią vaizdą. Tik išmokus lyginti abu šiuos dydžius vienu metu, galima susidaryti išsamų paveikslą apie tai, kas iš tiesų vyksta ekonomikoje ir kaip pasiskirsto materialinės gėrybės visuomenėje. Atsakingas požiūris į skaičius apsaugo nuo nepamatuotų lūkesčių, dezinformacijos ir padeda priimti racionalesnius asmeninių finansų sprendimus.
