한국   대만   중국   일본 
Statisztika ? Wikipedia Ugras a tartalomhoz

Statisztika

A Wikipediabol, a szabad enciklopediabol
( Matematikai statisztika szocikkb?l atiranyitva)
Ez a cikk a statisztikarol mint tudomanyagrol szol; a Wikipedia statisztikai itt erhet?k el .

A statisztika avagy szamhasonlitas [1] a valosag szamszer? informacioinak megfigyelesere, osszegzesere, elemzesere es modellezesere iranyulo gyakorlati tevekenyseg es tudomany.

Gyakran hivjak ?statisztikanak” a statisztika modszereit es a statisztikai tevekenyseg eredmenyekent keletkez? adatokat is. Ezenkivul statisztikanak nevezik egy statisztikai minta elemeinek ismeretlen parametert nem tartalmazo fuggvenyeit is: lasd statisztika (fuggveny) .

Statisztikai alapfogalmak [ szerkesztes ]

A statisztika, hasonloan mas tudomanyokhoz, sajatos nyelvezettel, modszertannal es szemlelettel rendelkezik. A statisztikusok altal leggyakrabban hasznalt alapfogalmak a kovetkez?k:

A statisztika reszteruletei [ szerkesztes ]

A statisztikanak alapvet?en ket nagy terulete ismeretes; ezek kozott azonban sok talalkozasi pont, s?t atfedes figyelhet? meg.

Leiro statisztika [ szerkesztes ]

Celja egy mar rendelkezesre allo, valosagra vonatkozo adathalmaz osszefoglalasa, elemzese, egyszoval az informaciotomorites.

Sokasag leirasa egy ismerv alapjan:

Kovetkeztet? (matematikai) statisztika [ szerkesztes ]

Celja a megfelel? ? vagyis a sokasag egeszenek parametereit legjobban tukroz?, reprezentalo ? minta kivalasztasa, a sokasagi parametereknek a minta parametereivel torten? becsles e, illetve a sokasagi parameterekre vonatkozo feltetelezesek, hipotezis ek elfogadasa vagy elvetese. Foglalkozik tovabba a valosag osszefuggeseinek egyszer?sitett megragadasara torekv? modellekkel is, mint az id?sor- es regresszios modellek.

F?bb reszteruletei tehat a kovetkez?k:

A statisztika eredete es tortenete [ szerkesztes ]

Eredetileg ? ma mar ritka, elavultnak szamito ertelmezes szerint ? a statisztika matematikai eszkozoket igenybe vev? allamhaztartastant jelentett, vagyis azon modszerek gy?jtemenyet es elmeletet, amelyek segitsegevel az ujkorban kialakulo modern allamok szamontarthattak er?forrasaikat es a tarsadalmi problemakat (nepesseg, termeles, betegsegek stb.). Erre utal a szo etimologiaja is, minthogy a szot az ujlatin statisticum collegium (?allamtanacs”) es az olasz statista (?allamferfi”, politikus) kifejezesekb?l szarmaztatjak. A statisztika atyja, Gottfried Achenwall is ilyen ertelemben hasznalta e szot munkaiban (?az allam tudomanya”), el?szor 1749-ben. A szo mai ertelmet (?az adatgy?jtes es adatfeldolgozas altalanos tudomanya”) csak a tizenkilencedik szazad elejen nyerte el.

A kovetkeztet? statisztika mindenekel?tt a matematikai ismeretek (ezeken belul is f?kent a valoszin?segszamitas ) gyors fejl?desenek kovetkezteben, a leiro statisztika pedig a kulonboz? adatszerzesi es mintaveteli technikak kialakulasaval, fejl?desevel jutott el a mai szintjere.

A statisztika alkalmazasai [ szerkesztes ]

Adatok osszegzesere, elemzesere, tudomanyos elmeletek adatok segitsegevel torten? igazolasara vagy megcafolasara szamtalan termeszet- es tarsadalomtudomanynak szuksege van. Gyakori eset, hogy egy-egy tudomanyhoz kapcsolodo statisztikai alkalmazasokbol onallo segedtudomanyok jottek letre. Ilyenek peldaul a kovetkez?k:

A statisztika helytelen hasznalata [ szerkesztes ]

A statisztika helytelen hasznalatarol beszelunk, amikor a statisztika hasznalatanak megsertese miatt indokolatlan kovetkeztetesre jutunk.

Esetenkent ez veletlen, maskor szandekos is lehet, es az elkovet? hasznot huz bel?le.

A teves statisztika csapdaja meglehet?sen artalmas a tudas kereseseben. Peldaul az orvostudomanyban egy teves allitas kijavitasa evtizedeket vehet igenybe, es embereletekbe kerulhet.

A helytelen alkalmazas konnyen el?fordulhat. Kutatokat, meg matematikusokat es statisztikusokat is megteveszthetnek egyszer? modszerek is, meg ha gondosan figyelnek is mindenre. Vannak kutatok, akik a hibat valoszin?segszamitasi tudasuk hianya vagy a tesztjeik standardizalasanak hianya miatt kovetik el.

A helytelen alkalmazas tipusai [2] [ szerkesztes ]

A nem tetsz? adatok kihagyasa [ szerkesztes ]

Vegyunk egy peldat. Egy ceg, semleges hatasu (haszontalan) termeket ugy reklamozhatja, hogy keres, vagy elvegez 40 kutatast 95%-os megbizhatosagi szinttel. Ha a termek tenyleg haszontalan, ebb?l atlagosan egy tanulmany a termek jotekony hatasat mutatna, egy annak karos hatasat mutatna, es harmincnyolc nem mutatna hatast (38 a negyven 95%-a). Minel tobb kiserlet erhet? el, annal tobb olyat fogunk talalni, amelyik a termek hasznossagat is kimutatja. Az olyan szervezetek, melyek nem hoznak nyilvanossagra minden elvegzett tanulmanyt, mint peldaul a dohanyipari cegek, melyek tagadjak a dohanyzas es rak kozotti kapcsolatot, vagy a dohanyellenes csoportok, melyek a dohanyzas es kulonboz? betegsegek kozotti kapcsolatot probaljak bizonyitani, vagy a csodapirulak forgalmazoi, tobbek kozott ezt a taktikat is hasznaljak.

Egy masik gyakori technika az olyan tanulmany veghezvitele, mely nagyszamu fugg? valtozot hasznal egyszerre. Peldaul, egy gyogyaszati kezeles hatekonysagat tesztel? tanulmany fugg? valtozokent hasznalhatja a tuleles valoszin?seget, a korhazban toltott napok szamat, a betegek szubjektiv fajdalomszintjet, stb. Ez annak a valoszin?seget is noveli, hogy legalabb egy valtozo veletlenul osszefuggest fog mutatni a fuggetlen valtozoval, vagyis a gyogyszer hasznalataval.

Befolyasolo kerdezes [ szerkesztes ]

A befolyasolo kerdezes a felmeresek altalanos modszertani hibaja lehet. A felmeresekre adando valaszok gyakran manipulalhatoak a kerdes olyan megfogalmazasaval, hogy az a valaszadokbol bizonyos valaszok gyakorisagat hozza ki. Peldaul a haborurol torten? szavazas eseten a kovetkez? kerdesek:

  • Tamogatja az USA probalkozasat, hogy szabadsagot es demokraciat hozzon kulonboz? orszagokban?
  • Tamogatja az USA provokalatlan fegyveres akcioit?

valoszin?leg az adatok kulonboz? iranyu ferdeseget eredmenyezne, bar mindket kerdes a haboru tamogatasarol szol. A kerdes egy jobb megfogalmazasa ez lehetne: Tamogatja az USA jelenlegi, kulfoldi fegyveres akcioit?

A befolyasolo kerdezes egy masik modja az, ha a kutato altal ?vagyott” valaszt tamogato informacio el?zi meg a kerdest. Peldaul valoszin?leg tobb ember felel igennel arra a kerdesre, hogy ?A kozeposztaly csaladjainak novekv? adoterheit tekintve, tamogatja a jovedelemado csokkenteset?” ahhoz a kerdeshez viszonyitva, hogy ?Az orszag allamhaztartasi hianyat, es az allami bevetelek novelesenek rendkivuli szukseget tekintve, tamogatja a jovedelemado csokkenteset?”

Tulaltalanositas [ szerkesztes ]

A tulaltalanositas az a hiba, mikor egy adott csoportrol szolo statisztikarol azt allitjak, hogy megall olyan csoport tagjaira is, mely csoport nem fed at az eredeti meres csoportjaval.

Egy egyszer? peldakent tegyuk fel, hogy a nyaron megvizsgalt almak 100%-a piros. Az allitas, hogy ?Minden alma piros”, a tulaltalanositasra pelda, mert az eredeti statisztika csak az almak egy alcsoportjara igaz (a nyariakra), amely nem nevezhet? az osszes alma reprezentativ mintajanak.

A tulaltalanositas hibajara a valo eletb?l vett pelda figyelhet? meg a telefonos kozvelemeny-kutatasokbol adodo m?termekben, ha a felmeres soran a mobiltelefonokat nem hivhatjak. A fiatalok mas demografiai csoportokhoz kepest kevesse rendelkeznek vonalas telefonnal. Igy az olyan telefonos kozvelemeny-kutatas, mely csak vonalas telefonhivasokkal meri fel a valaszadokat, a fiatalok nez?pontjat alulreprezentalhatja a felmeres eredmenyeben, ha mas modon nem korrigaljak a mintavetel torzitasat. [3]

A tulaltalanositas gyakran akkor fordul el?, mikor az informacio nem szakmai forrasokon halad at, peldaul a tomegtajekoztatasi eszkozokon, ugyanis a sajto munkatarsai kevesse kezelik pontosan a mintavetel korlatait. [4]

Torzitott mintavetel [ szerkesztes ]

A statisztikaban a mintaveteli torzitasrol akkor beszelunk, ha a mintat ugy vesszuk, hogy a celpopulacio egy resze kevesbe valoszin?, hogy belekerul, mint a tobbi. A mintavetel torzitott, ha nem veletlenszer? a nepesseg (vagy nem emberek) mintaja, vagyis nem minden egyen, vagy eset kerul ugyanolyan esellyel kivalasztasra. Ha ezzel nem szamolunk, akkor az eredmenyeket tevesen tulajdonithatjuk a tanulmanyozott jelensegnek, ahelyett hogy a mintavetel eredmenyenek tekintenenk.

A becsult hiba felreertelmezese vagy felreertese [ szerkesztes ]

Ha egy kutatocsoport azt szeretne tudni, hogy hogy erez egy bizonyos temarol 300 millio ember, nem lenne praktikus megkerdezni mindannyiukat. Azonban, ha a kutatocsoport kivalaszt veletlenszer?en nagyjabol 1000 szemelyt, eleg biztosak lehetnek benne, hogy a kivalasztott csoport altal nyujtott eredmeny megmutatja, mit valaszolt volna a nagyobb csoport, ha mindannyiukat megkerdezik.

Szamszer?sithet?, hogy mennyire lehetunk biztosak ebben. Ennek az egyik modja a konfidencia hatarokkal tortenik, a konfidenciaintervallum also es fels? vegevel. Altalaban 95%-os konfidencia hatar a hasznalatos, de ett?l el is terhetunk. A 95%-os konfidencia hatar azt jelenti, hogy ha ismetelten veletlen mintakat veszunk es kiszamoljuk az atlagokat es a konfidencia hatarokat minden mintara, a mintak 95%-anak a konfidenciaintervalluma tartalmazza az elmeleti atlagot. [5]

A legtobb ember azt feltetelezi, hogy mivel a megbizhatosagi ertek nincs feltuntetve, 100%-osan biztos, hogy az igazi eredmeny a becsult hiban belul van. Ez matematikailag helytelen.

Sokan esetleg nem veszik eszre, hogy a minta veletlenszer?sege nagyon fontos. A gyakorlatban sok kozvelemeny-kutatas telefonon tortenik, ami eltorzitja a mintat tobb modon, peldaul kizarja azokat, akiknek nincs telefonjuk, tobb esellyel kerul bele, akinek tobb telefonja van, konnyebben bekerulhetnek, akik hajlamosabbak reszt venni telefonos felmeresben, stb. A nem veletlenszer? mintavetel a becsult hibat megbizhatatlanna teszi.

Gyakran csak egy hibahatart emlitenek a felmeresek. Mikor egy nagyobb meresen belul a nepesseg egy alcsoportjarol szolnak az eredmenyek, nagy lesz a hibahatar, de ezt nem feltetlen hangsulyozzak. Peldaul 1000 ember felmerese 100 f?t tartalmazhat egy bizonyos etnikai csoportbol vagy gazdasagi statuszbol. Az erre a csoportra vonatkozo eredmenyek sokkal kevesbe lesznek megbizhatoak, mint a teljes nepessegre vonatkozo eredmenyek. Ha a teljes mintara vonatkozo hibahatar 4% volt, akkor a hibahatar egy ilyen alcsoportra 13% koruli lehet.

A fentieken tul vannak masfele meresi nehezsegek is a nepesseg felmereseben.

A fent emlitett problemak minden statisztikat alkalmazo kiserletre igazak, nem csak az osszlakossagot erint? felmeresekre.

Forrasok [ szerkesztes ]

  1. Kosztolanyi Dezs?: Nyelvm?veles - Valasz Schopflin Aladarnak. Nyugat · 1933. 9. szam http://epa.oszk.hu/00000/00022/00557/17385.htm
  2. Aaron Levenstein “Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.”
  3. Silver, Nate. ? ‘Robopolls' Significantly More Favorable to Republicans Than Traditional Surveys ”, The New York Times , 2010. oktober 28.  
  4. Schwartz, L. M.; Woloshin, S. (2003). "On the Prevention and Treatment of Exaggeration". Journal of General Internal Medicine 18 (2): 153?154. doi:10.1046/j.1525-1497.2003.21216.x
  5. McDonald, J.H. (2009). Handbook of Biological Statistics (2nd ed.). Baltimore, Maryland: Sparky House Publishing. http://udel.edu/~mcdonald/statintro.html

Tovabbi informaciok [ szerkesztes ]