- Ez a cikk a statisztikarol mint tudomanyagrol szol; a Wikipedia statisztikai
itt erhet?k el
.
A
statisztika
avagy
szamhasonlitas
[1]
a valosag szamszer?
informacioinak
megfigyelesere, osszegzesere, elemzesere es modellezesere iranyulo gyakorlati tevekenyseg es tudomany.
Gyakran hivjak ?statisztikanak” a statisztika modszereit es a statisztikai tevekenyseg eredmenyekent keletkez? adatokat is. Ezenkivul statisztikanak nevezik egy statisztikai minta elemeinek ismeretlen parametert nem tartalmazo
fuggvenyeit
is: lasd
statisztika (fuggveny)
.
Statisztikai alapfogalmak
[
szerkesztes
]
A statisztika, hasonloan mas tudomanyokhoz, sajatos nyelvezettel, modszertannal es szemlelettel rendelkezik. A statisztikusok altal leggyakrabban hasznalt alapfogalmak a kovetkez?k:
A statisztika reszteruletei
[
szerkesztes
]
A statisztikanak alapvet?en ket nagy terulete ismeretes; ezek kozott azonban sok talalkozasi pont, s?t atfedes figyelhet? meg.
Celja egy mar rendelkezesre allo, valosagra vonatkozo adathalmaz osszefoglalasa, elemzese, egyszoval az informaciotomorites.
Sokasag leirasa egy ismerv alapjan:
Kovetkeztet? (matematikai) statisztika
[
szerkesztes
]
Celja a megfelel? ? vagyis a sokasag egeszenek parametereit legjobban tukroz?, reprezentalo ?
minta
kivalasztasa, a sokasagi parametereknek a minta parametereivel torten?
becsles
e, illetve a sokasagi parameterekre vonatkozo feltetelezesek,
hipotezis
ek elfogadasa vagy elvetese. Foglalkozik tovabba a valosag osszefuggeseinek egyszer?sitett megragadasara torekv? modellekkel is, mint az
id?sor-
es
regresszios modellek.
F?bb reszteruletei tehat a kovetkez?k:
A statisztika eredete es tortenete
[
szerkesztes
]
Eredetileg ? ma mar ritka, elavultnak szamito ertelmezes szerint ? a statisztika matematikai eszkozoket igenybe vev?
allamhaztartastant
jelentett, vagyis azon modszerek gy?jtemenyet es elmeletet, amelyek segitsegevel az
ujkorban
kialakulo modern
allamok
szamontarthattak er?forrasaikat es a tarsadalmi problemakat (nepesseg, termeles, betegsegek stb.). Erre utal a szo etimologiaja is, minthogy a szot az
ujlatin
statisticum collegium
(?allamtanacs”) es az olasz
statista
(?allamferfi”, politikus) kifejezesekb?l szarmaztatjak. A statisztika atyja,
Gottfried Achenwall
is ilyen ertelemben hasznalta e szot munkaiban (?az allam tudomanya”), el?szor 1749-ben. A szo mai ertelmet (?az adatgy?jtes es adatfeldolgozas altalanos tudomanya”) csak a tizenkilencedik szazad elejen nyerte el.
A kovetkeztet? statisztika mindenekel?tt a
matematikai
ismeretek (ezeken belul is f?kent a
valoszin?segszamitas
) gyors fejl?desenek kovetkezteben, a leiro statisztika pedig a kulonboz? adatszerzesi es mintaveteli technikak kialakulasaval, fejl?desevel jutott el a mai szintjere.
A statisztika alkalmazasai
[
szerkesztes
]
Adatok osszegzesere, elemzesere,
tudomanyos elmeletek
adatok segitsegevel torten? igazolasara vagy megcafolasara szamtalan
termeszet-
es
tarsadalomtudomanynak
szuksege van. Gyakori eset, hogy egy-egy tudomanyhoz kapcsolodo statisztikai alkalmazasokbol onallo segedtudomanyok jottek letre. Ilyenek peldaul a kovetkez?k:
A statisztika helytelen hasznalata
[
szerkesztes
]
A statisztika helytelen hasznalatarol beszelunk, amikor a statisztika hasznalatanak megsertese miatt indokolatlan kovetkeztetesre jutunk.
Esetenkent ez veletlen, maskor szandekos is lehet, es az elkovet? hasznot huz bel?le.
A teves statisztika csapdaja meglehet?sen artalmas a tudas kereseseben. Peldaul az orvostudomanyban egy teves allitas kijavitasa evtizedeket vehet igenybe, es embereletekbe kerulhet.
A helytelen alkalmazas konnyen el?fordulhat. Kutatokat, meg matematikusokat es statisztikusokat is megteveszthetnek egyszer? modszerek is, meg ha gondosan figyelnek is mindenre. Vannak kutatok, akik a hibat valoszin?segszamitasi tudasuk hianya vagy a tesztjeik standardizalasanak hianya miatt kovetik el.
A helytelen alkalmazas tipusai
[2]
[
szerkesztes
]
A nem tetsz? adatok kihagyasa
[
szerkesztes
]
Vegyunk egy peldat. Egy ceg, semleges hatasu (haszontalan) termeket ugy reklamozhatja, hogy keres, vagy elvegez 40 kutatast 95%-os megbizhatosagi szinttel. Ha a termek tenyleg haszontalan, ebb?l atlagosan egy tanulmany a termek jotekony hatasat mutatna, egy annak karos hatasat mutatna, es harmincnyolc nem mutatna hatast (38 a negyven 95%-a). Minel tobb kiserlet erhet? el, annal tobb olyat fogunk talalni, amelyik a termek hasznossagat is kimutatja. Az olyan szervezetek, melyek nem hoznak nyilvanossagra minden elvegzett tanulmanyt, mint peldaul a dohanyipari cegek, melyek tagadjak a dohanyzas es rak kozotti kapcsolatot, vagy a dohanyellenes csoportok, melyek a dohanyzas es kulonboz? betegsegek kozotti kapcsolatot probaljak bizonyitani, vagy a csodapirulak forgalmazoi, tobbek kozott ezt a taktikat is hasznaljak.
Egy masik gyakori technika az olyan tanulmany veghezvitele, mely nagyszamu fugg? valtozot hasznal egyszerre. Peldaul, egy gyogyaszati kezeles hatekonysagat tesztel? tanulmany fugg? valtozokent hasznalhatja a tuleles valoszin?seget, a korhazban toltott napok szamat, a betegek szubjektiv fajdalomszintjet, stb. Ez annak a valoszin?seget is noveli, hogy legalabb egy valtozo veletlenul osszefuggest fog mutatni a fuggetlen valtozoval, vagyis a gyogyszer hasznalataval.
Befolyasolo kerdezes
[
szerkesztes
]
A befolyasolo kerdezes a felmeresek altalanos modszertani hibaja lehet. A felmeresekre adando valaszok gyakran manipulalhatoak a kerdes olyan megfogalmazasaval, hogy az a valaszadokbol bizonyos valaszok gyakorisagat hozza ki. Peldaul a haborurol torten? szavazas eseten a kovetkez? kerdesek:
- Tamogatja az USA probalkozasat, hogy szabadsagot es demokraciat hozzon kulonboz? orszagokban?
- Tamogatja az USA provokalatlan fegyveres akcioit?
valoszin?leg az adatok kulonboz? iranyu ferdeseget eredmenyezne, bar mindket kerdes a haboru tamogatasarol szol. A kerdes egy jobb megfogalmazasa ez lehetne: Tamogatja az USA jelenlegi, kulfoldi fegyveres akcioit?
A befolyasolo kerdezes egy masik modja az, ha a kutato altal ?vagyott” valaszt tamogato informacio el?zi meg a kerdest. Peldaul valoszin?leg tobb ember felel igennel arra a kerdesre, hogy ?A kozeposztaly csaladjainak novekv? adoterheit tekintve, tamogatja a jovedelemado csokkenteset?” ahhoz a kerdeshez viszonyitva, hogy ?Az orszag allamhaztartasi hianyat, es az allami bevetelek novelesenek rendkivuli szukseget tekintve, tamogatja a jovedelemado csokkenteset?”
A tulaltalanositas az a hiba, mikor egy adott csoportrol szolo statisztikarol azt allitjak, hogy megall olyan csoport tagjaira is, mely csoport nem fed at az eredeti meres csoportjaval.
Egy egyszer? peldakent tegyuk fel, hogy a nyaron megvizsgalt almak 100%-a piros. Az allitas, hogy ?Minden alma piros”, a tulaltalanositasra pelda, mert az eredeti statisztika csak az almak egy alcsoportjara igaz (a nyariakra), amely nem nevezhet? az osszes alma reprezentativ mintajanak.
A tulaltalanositas hibajara a valo eletb?l vett pelda figyelhet? meg a telefonos kozvelemeny-kutatasokbol adodo m?termekben, ha a felmeres soran a mobiltelefonokat nem hivhatjak. A fiatalok mas demografiai csoportokhoz kepest kevesse rendelkeznek vonalas telefonnal. Igy az olyan telefonos kozvelemeny-kutatas, mely csak vonalas telefonhivasokkal meri fel a valaszadokat, a fiatalok nez?pontjat alulreprezentalhatja a felmeres eredmenyeben, ha mas modon nem korrigaljak a mintavetel torzitasat.
[3]
A tulaltalanositas gyakran akkor fordul el?, mikor az informacio nem szakmai forrasokon halad at, peldaul a tomegtajekoztatasi eszkozokon, ugyanis a sajto munkatarsai kevesse kezelik pontosan a mintavetel korlatait.
[4]
Torzitott mintavetel
[
szerkesztes
]
A statisztikaban a mintaveteli torzitasrol akkor beszelunk, ha a mintat ugy vesszuk, hogy a celpopulacio egy resze kevesbe valoszin?, hogy belekerul, mint a tobbi. A mintavetel torzitott, ha nem veletlenszer? a nepesseg (vagy nem emberek) mintaja, vagyis nem minden egyen, vagy eset kerul ugyanolyan esellyel kivalasztasra. Ha ezzel nem szamolunk, akkor az eredmenyeket tevesen tulajdonithatjuk a tanulmanyozott jelensegnek, ahelyett hogy a mintavetel eredmenyenek tekintenenk.
A becsult hiba felreertelmezese vagy felreertese
[
szerkesztes
]
Ha egy kutatocsoport azt szeretne tudni, hogy hogy erez egy bizonyos temarol 300 millio ember, nem lenne praktikus megkerdezni mindannyiukat. Azonban, ha a kutatocsoport kivalaszt veletlenszer?en nagyjabol 1000 szemelyt, eleg biztosak lehetnek benne, hogy a kivalasztott csoport altal nyujtott eredmeny megmutatja, mit valaszolt volna a nagyobb csoport, ha mindannyiukat megkerdezik.
Szamszer?sithet?, hogy mennyire lehetunk biztosak ebben. Ennek az egyik modja a konfidencia hatarokkal tortenik, a konfidenciaintervallum also es fels? vegevel. Altalaban 95%-os konfidencia hatar a hasznalatos, de ett?l el is terhetunk. A 95%-os konfidencia hatar azt jelenti, hogy ha ismetelten veletlen mintakat veszunk es kiszamoljuk az atlagokat es a konfidencia hatarokat minden mintara, a mintak 95%-anak a konfidenciaintervalluma tartalmazza az elmeleti atlagot.
[5]
A legtobb ember azt feltetelezi, hogy mivel a megbizhatosagi ertek nincs feltuntetve, 100%-osan biztos, hogy az igazi eredmeny a becsult hiban belul van. Ez matematikailag helytelen.
Sokan esetleg nem veszik eszre, hogy a minta veletlenszer?sege nagyon fontos. A gyakorlatban sok kozvelemeny-kutatas telefonon tortenik, ami eltorzitja a mintat tobb modon, peldaul kizarja azokat, akiknek nincs telefonjuk, tobb esellyel kerul bele, akinek tobb telefonja van, konnyebben bekerulhetnek, akik hajlamosabbak reszt venni telefonos felmeresben, stb. A nem veletlenszer? mintavetel a becsult hibat megbizhatatlanna teszi.
Gyakran csak egy hibahatart emlitenek a felmeresek. Mikor egy nagyobb meresen belul a nepesseg egy alcsoportjarol szolnak az eredmenyek, nagy lesz a hibahatar, de ezt nem feltetlen hangsulyozzak. Peldaul 1000 ember felmerese 100 f?t tartalmazhat egy bizonyos etnikai csoportbol vagy gazdasagi statuszbol. Az erre a csoportra vonatkozo eredmenyek sokkal kevesbe lesznek megbizhatoak, mint a teljes nepessegre vonatkozo eredmenyek. Ha a teljes mintara vonatkozo hibahatar 4% volt, akkor a hibahatar egy ilyen alcsoportra 13% koruli lehet.
A fentieken tul vannak masfele meresi nehezsegek is a nepesseg felmereseben.
A fent emlitett problemak minden statisztikat alkalmazo kiserletre igazak, nem csak az osszlakossagot erint? felmeresekre.
- ↑
Kosztolanyi Dezs?: Nyelvm?veles - Valasz Schopflin Aladarnak. Nyugat · 1933. 9. szam
http://epa.oszk.hu/00000/00022/00557/17385.htm
- ↑
Aaron Levenstein
“Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.”
- ↑
Silver, Nate. ?
‘Robopolls' Significantly More Favorable to Republicans Than Traditional Surveys
”,
The New York Times
, 2010. oktober 28.
- ↑
Schwartz, L. M.; Woloshin, S. (2003). "On the Prevention and Treatment of Exaggeration". Journal of General Internal Medicine 18 (2): 153?154. doi:10.1046/j.1525-1497.2003.21216.x
- ↑
McDonald, J.H. (2009). Handbook of Biological Statistics (2nd ed.). Baltimore, Maryland: Sparky House Publishing.
http://udel.edu/~mcdonald/statintro.html
Tovabbi informaciok
[
szerkesztes
]