한국   대만   중국   일본 
frekwencja liter w polskich tekstach - Poradnia j?zykowa PWN

frekwencja liter w polskich tekstach

frekwencja liter w polskich tekstach
20.03.2006
20.03.2006
Witam,
interesuje mnie, jaka jest frekwencja poszczegolnych liter w polskich słowach. Ktore litery wyst?puj? najcz??ciej, a ktore najrzadziej? Czy s? jakie? procentowe wyliczenia?
Pozdrawiam,
Bartosz
Poni?sza tabelka prezentuje procentowy udział poszczegolnych liter w?probce 2.?wydania Korpusu IPI PAN licz?cej ponad 30 milionow segmentow (około 25 milionow słow ortograficznych). W?korpusie tym zdarzały si? tak?e wyst?pienia liter z?innych alfabetow, były one jednak znacznie rzadsze ni? najrzadsze litery w?tabelce poni?ej. Na przykład kolejna co do cz?sto?ci litera, e , wyst?piła 1939 razy, w?porownaniu do 22429 wyst?pie? litery x czy 81474 wyst?pie? litery ? . Warto przy okazji zauwa?y?, ?e niektore znaki interpunkcyjne wyst?puj? w?tekstach polskich cz??ciej ni? wiele liter. Na przykład najcz?stszy polski znak przestankowy, przecinek, wyst?puje cz??ciej ni? litera b .
a 8.91% ??w 4.65% ??p 3.13% ??g 1.42% ??? 0.40%
i 8.21% ??s 4.32% ??m 2.80% ??? 1.11% ??f 0.30%
o 7.75% ??t 3.98% ??u 2.50% ??h 1.08% ??? 0.20%
e 7.66% ??c 3.96% ??j 2.28% ??? 0.99% ??q 0.14%
z 5.64% ??y 3.76% ??l 2.10% ??o 0.85% ??? 0.06%
n 5.52% ??k 3.51% ??ł 1.82% ??? 0.83% ??v 0.04%
r 4.69% ??d 3.25% ??b 1.47% ??? 0.66% ??x 0.02%
Adam Przepiorkowski, Instytut Podstaw Informatyki PAN
zgło? uwag?