Abecedni ?azeni
je zp?sob neutralniho
?azeni
textovych ?et?zc?
v seznamech,
slovnicich
, encyklopediich apod., zalo?eny na tradi?nim uspo?adani p?islu?ne
abecedy
. Po?adi pismen v abeced? zpravidla nema ?adny logicky vyznam, jedna se pouze o ustaleny zvyk. V r?znych
jazycich
se m??e toto uspo?adani li?it, zvla?t? pro specificke prvky p?islu?neho jazyka (znaky s
diakritikou
apod.).
Zakladni princip ?azeni ? postupne porovnavani ?azenych ?et?zc? po jednotlivych znacich, p?i?em? o se?azeni rozhoduje v?dy prvni nalezeny rozdil, se ozna?uje jako
lexikograficke ?azeni
.
Abecedni ?azeni se pou?iva ve slovnicich,
telefonnich seznamech
a mnoha dal?ich rozsahlych souborech dat, nebo? umo??uje efektivni hledani: pro vyhledani polo?ky v
n
-prvkovem uspo?adanem seznamu je pot?eba pouze
logaritmicky
po?et krok?; srovnejte jednoduchost hledani v telefonnim seznamu podle jmena, podle ktereho je seznam se?azen, oproti hledani podle telefonniho ?isla, p?i kterem je nutno seznam projit cely polo?ku po polo?ce.
Zakladni latinka, anglicka abeceda, ASCII
[
editovat
|
editovat zdroj
]
Zakladni forma
latinky
(nap?.
anglicka abeceda
) obsahuje 26 pismen, ktera jsou ?azena nasledujicim zp?sobem:
- A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Toto ?azeni se odra?i v uspo?adani znak? v po?ita?ovych znakovych kodovanich, jako nap?.
ASCII
,
EBCDIC
,
Unicode
.
Pou?ivana posloupnost znak? je nasledkem historickeho vyvoje, neni pro ni ?adny dal?i logicky d?vod. (Oproti tomu si lze p?edstavit nap?. system podle
fonetickych
vyznam?
hlasek
, ?adici
samohlasky
p?ed
souhlasky
, seskupujici hlasky podle
zn?losti
nebo mista tvo?eni apod.)
Pro
?e?tinu
upravuje abecedni ?azeni norma
?SN
97 6030 z roku
1994
(ktera nahradila star?i a slo?it?j?i ?SN 01 0181 z roku
1977
, p?i?em? aplikovatelnost normy roz?i?ila i na po?ita?ove ?azeni). Podle teto normy se ?adi cela slova (p?ipadn? skupiny slov), p?i?em? za slovo se pova?uje ?et?zec pismen, ?islic, znaku
apostrof
a
spojovnik
?i
nezlomitelna mezera
(s vyjimkou situace, kdy jsou tyto dva znaky na za?atku ?i konci ?et?zce); po?et mezer odd?lujicich jednotliva slova neni podstatny.
Zakladem ?azeni je op?t abeceda, tentokrat i s ?eskymi znaky. P?i ?azeni se v?ak nejprve nep?ihli?i ke v?em diakritickym znamenk?m, v prvnim pr?chodu se bere ohled jen na nasledujici standardizovanou ?eskou abecedu:
- A B C ? D E F G H Ch I J K L M N O P Q R ? S ? T U V W X Y Z ?
Ostatni znaky s diakritikou (?, ?, ? a samohlasky s diakritikou) se v teto prvni fazi ?adi stejn? jako verze bez diakritiky (nap?. D, N, T). Toto sni?eni vyznamnosti ?, ? a ? souvisi s tim, ?e nej?ast?ji se pi?i tyto hlasky znakem bez ha?ku a zm?k?eni se vyzna?uje nasledujici samohlaskou (? nebo I, I, resp. ?, i, i).
Pouze pokud aplikaci teto primarni ?adici schopnosti nelze rozhodnout mezi ?azenim n?kolika slov, bere se ohled na ostatni diakriticka znamenka. Sekundarni ?adici platnost ur?uje vzajemne po?adi jinak stejnych slov li?icich se pouze diakritickymi znamenky:
- znaky bez diakritickych znamenek,
- znaky s
?arkou
,
- znaky s
ha?kem
(pokud nema ji? primarni ?adici platnost),
- znaky s
krou?kem
.
Obecne pravidlo pro sekundarni ?adici platnost, umo??ujici ?adit i znaky z jinych abeced, je definovano pomoci t?i krok?: nejprve se porovnava umist?ni diakritickeho znamenka vzhledem k znaku; to ur?uje nasledujici po?adi:
- bez diakritickych znamenek,
- diakritika nad znakem,
- diakritika pod znakem,
- diakritika za znakem (vpravo od znaku),
- diakritika p?ed znakem (vlevo od znaku),
- diakritika uvnit? znaku ?i p?es znak.
Pokud pomoci tohoto pravidla nelze rozhodnout, ve druhem kroku se jednoduche diakriticke znamenko (nap?. ?arka) ?adi p?ed dvojita diakriticka znamenka (nap?.
p?ehlaska
) a ta se ?adi p?ed trojita diakriticka znamenka (t?i te?ky). Pokud ani toto pravidlo nerozhodne, definuje norma po?adi jednotlivych druh? diakritickych znamenek:
- te?ka
(resp.
p?ehlaska
?i t?i te?ky),
- ?arka
,
- vodorovna ?arka
(makron),
- svisla ?arka,
- ?arka zleva dole doprava nahoru (resp.
dv? ?arky
),
- ?arka zleva naho?e doprava dol? (resp.
dvojita zp?tna ?arka
),
- st?i?ka
(circumflex),
- ha?ek
,
- tilda
(vlnovka),
- oblou?ek
,
- obraceny oblou?ek,
- cedilla
,
- ocasek
,
- krou?ek
.
Pokud se v textu pou?ivaji indexy ?i exponenty, p?ihli?i se k nim jen sekundarn?, obdobn? jako by se jednalo o diakriticka znamenka p?ed ?i za pismenem.
Velikost pismen a ostatni znaky (?islice, apostrof, spojovnik)
[
editovat
|
editovat zdroj
]
P?i ?azeni se v?bec nebere ohled na mala a velka pismena (slova li?ici se jen velikosti pismen mohou byt v libovolnem vzajemnem po?adi), co? je zjednodu?eni oproti p?edchozi norm? (ktera mala pismena ?adila p?ed velka).
?islice
se ?adi za v?emi pismeny, p?i?em? se ?adi podle sve ?iselne hodnoty, apostrof je je?t? za ?islicemi.
Spojovnik a nezlomitelna mezera se naopak ?adi p?ed celou abecedu, tedy p?ed A.
- pada
- sal
(
s
>
p
)
- sala
(del?i ne? p?edch?dce)
- sala
(
a
>
a
, se sekundarni ?adici platnosti)
- sala
(
a
>
a
, se sekundarni ?adici platnosti)
- satira
(
t
>
l
)
- si leha
(
i
>
a
)
- si nese
(
n
>
l
)
- sili
(
si
je krat?i ne?
sili
)
- ?ala
(
?
>
s
s primarni ?adici platnosti)
- ?at
(
t
>
l
)
- ta
(
t
>
?
)
V?echny jazyky pou?ivajici latinku maji abecedni po?adi v zasad? stejne (odvozene z vy?e uvedeneho zakladniho po?adi), ale v detailech existuji rozdily, p?sobene zejmena
sp?e?kami
a
diakritiky
, s nimi? r?zne jazyky p?i ?azeni zachazeji jinak. V n?kterych latinkach se take navic pou?ivaji zvla?tni znaky jako
æ, þ
,
ß
a dal?i.
V
N?mecku
plati dva standardy ?azeni pou?ivajici se v r?znych kontextech, od nich? se je?t? li?i standard
rakousky
. Hlavni odli?nost je v zachazeni s
p?ehlaskami
. V n?meckych slovnicich se nap?.
o
a
o
primarn? neli?i, zatimco v
telefonnim seznamu
ma
o
platnost jako
oe
(tak?e nap?.
Gothe
je v abeced? p?ed
Goldmann
). V Rakousku pak naopak na p?ehlasce zale?i a
o
se v?dy ?adi a? za
o
. Podobn? ma v N?mecku stejnou platnost
ss
a
ß
, zatimco v Rakousku nasleduje
ß
a? po
s
.
Samostatnou platnost maji polske znaky
?
,
?
,
?
,
?
, po
z
pak nasleduje
?
a nakonec
?
. Ha?ky (nap?. nad ?eskymi jmeny) se naopak nezohled?uji.
Sp?e?ky
se rovn?? nezohled?uji (patrne je to zejmena u
ch
).
Zvla?tni po?adi maji digrafy
cs, gy, ly, ny, sz, ty
a
zs
(tak?e nap?. sekvence
cs
nasleduje a? po
cy
a
cz
). Oproti tomu
ch
se jako dvojznak nebere. U samohlasek primarn? nezale?i na delce, ale zale?i na
p?ehlasce
, tak?e nap?.
o
je v?dy ?azeno p?ed
o
.
Ka?de standardizovane hlaskove pismo ma sve zavazne po?adi znak?. Abecedy p?ibuzne latince, jako
alfabeta
nebo r?zne verze
cyrilice
, maji v ?azeni ur?ite spole?ne rysy (nap?. na za?atku je v?dy A, shoduje se po?adi hlasek ve st?edni pasa?i), ale v jinych ohledech se li?i. Ni?e je uvedeno n?kolik p?iklad?:
Zakladnich 24 znak?
?ecke abecedy
ma toto po?adi:
- A B Γ Δ E Z H Θ I K Λ M N Ξ O Π P Σ T Y Φ X Ψ Ω
Ruska
azbuka
ma 30 zakladnich znak?, navic 2 znaky s diakritikou a jeden
digraf
, ktery paradoxn? p?edchazi znaku, ktery je jeho sou?asti. S ?eckou abecedou ma spole?ne nap?. umist?ni [z] a sekvenci hlasek [u?f?ch]. Na konci jsou ?azeny specialni znaky jako ?tvrde E“ (Э) nebo zm?k?ujici samohlasky.
- A Б B Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
Srbska
cyrilice
ma ?azeni zna?n? podobne te ruske, navic ma vlo?ene specialni znaky odpovidajici v latince pismen?m ?, đ nebo sp?e?kam d?, lj, nj apod. Posledni hlaskou srbske abecedy je [?].
- A Б В Г Д ? Е Ж З И ? К Л ? М Н ? О П Р С Т ? У Ф Х Ц Ч ? Ш
Sou?asna
gruzin?tina
pou?iva pismo
mchedruli
, ktere ma 33 pou?ivanych znak? v nasledujicim po?adi. I zde prvni pismeno reprezentuje hlasku [a].
- ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
U znakovych pisem (nap?.
?inske znaky
?i
japonske
kand?i
) nem??e existovat zapamatovatelne uspo?adani v?ech znak? pisma. ?azeni proto funguje na mirn? odli?nem principu: u znaku se ur?i zakladni slo?ka a po?et tah? znaku. Znaky jsou primarn? set?id?ny podle ko?ene, v ramci jednoho ko?ene se ?adi vzestupn? podle po?tu tah?. Nap?. znak ? se ?adi pod sv?j ko?en 女 a v n?m mezi t?inactitahove znaky.
Tato metoda je evidentn? slo?it?j?i ne? abecedni ?azeni latinky, proto se jako alternativni metoda ?asto pou?iva take ryze abecedni ?azeni podle vyslovnosti p?islu?neho znaku: nap?. slovo
Tokio
zapsane v kanji (東京) se da ?adit podle posloupnosti abecednich znak? popisujicich jeho vyslovnost
to-u-ki-
jo
-u
(とうきょう). Pro pou?iti teto alternativy je v?ak pot?eba znat vyslovnost znak?, co? pou?itelnost teto metody omezuje.
P?i pou?ivani
po?ita??
se abecedni ?azeni objevuje v mnoha ulohach, ?azeni pat?i k jedne ze zakladnich schopnosti
databazi
. S ?azenim v?ak je (a hlavn? v minulosti bylo) spojeno mnoho praktickych problem?. Zvla?t? star?i programy nejsou schopny dodr?ovat jednotlive narodni zvyklosti a normy a jsou schopny ?adit pouze anglicke texty, resp. texty ?adi p?imo podle hodnot znak? v p?islu?nem kodovani (ordinalni ?azeni). Pro ?eske texty to znamena hlavn? ignorovani zvla?tniho postaveni ?eskeho pismene
Ch
, ktere je v takovem p?ipad? ?azeno ke znaku
C
(mezi sekvenci
cg
a
ci
), a ?azeni znak? s diakritikou a? za v?echna ostatni pismena abecedy a navic v p?ehazenem po?adi.
V modernich programech je ji? v?t?ina narodnich zvyklosti (a po?adavk? p?islu?nych norem) respektovana, ov?em pro spravne chovani programu je nutno v konfiguraci nastavit spravny jazyk a narodni prost?edi.