Kromě vybírání dat je rovněž potřebujeme nějak rozumně řadit (a to nejenom
podle abecedy). V dnešním díle seriálu o MySQL se podíváme, jak na
to.
10.5.2005 15:00 | Petr Zajíc |
přečteno 6904×
Data mohou být do databáze vkládána v nahodilém pořadí. Často je však
potřebujeme prezentovat v nějaké setříděné formě. Je jasné, že MySQL na to musí
mít nějaké nástroje. A my je dnes prozkoumáme.
Příkaz SELECT může být následován klauzulí ORDER BY, která zajistí seřazení
výsledné množiny záznamů podle nějakého výrazu. Tím "nějakým výrazem" je
nejčastěji hodnota polí ve sloupci, ale jak ještě uvidíme, nemusí to tak být
vždy. Řadit můžeme nejen podle čísel, ale i podle datumů (databáze si poradí s
lahůdkami typu přechodných roků), a samozřejmě podle řetězců.
Tip.: Řetězce se porovnávají způsobem, který
je definován při tvorbě tabulky pomocí slova collate. Jestliže žádné řazení
nedefinujete, bývá pro řetězce použito výchozí řazení databáze, případně
serveru. Je to častým námětem diskusí a ještě o tom bude řeč.
Jestliže je požadováno jak filtrování, tak i řazení, musí být klauzule WHERE uvedena před klauzulí ORDER BY. Následuje několik příkladů:
select * from faktury order by datum;
select * from knihy where cena >= 500 order by nazev;
Další příklady ukazují pro jistotu i nesprávnou syntaxi:
select * from faktury orderby datum;
select * from knihy order by nazev where cena >= 500;
V prvním případě jsem vynechal mezeru mezi "order" a "by". Ta mezera tam
skutečně musí být. To se vám může v zápalu psaní stát docela často. Ve druhém
případě jsem umístil řazení před filtrování (to se vám moc často stávat nebude;
příkaz SELECT je totiž přes svoji složitost poměrně intuitivní).
Často budete potřebovat řadit ne podle jednoho sloupce, ale podle více údajů najednou. Například budete chtít faktury seřadit podle data vydání a faktury se stejným datem vystavení ještě podle ceny. Není to žádný problém, když si uvědomíte, že ORDER BY může přijímat seznam výrazů. Řadí pak zleva doprava. Náš příklad bychom tedy mohli napsat asi takhle:
select * from faktury order by datum,
cena;
Řazení podle více sloupců je samozřejmě časově náročnější než řazení podle jednoho sloupce; v praxi se to však používá docela často. Všechna řazení, o nichž jsme zatím mluvili, byla vzestupná. To znamená, že čísla se řadila od menších k větším, události v čase od starších k novějším a řetězce od A do Z. Často ale můžeme potřebovat opačnou věc. Tak třeba bezpečnostní protokol uložený v databázi můžeme chtít seřadit od nejnovějších událostí ke starším. Není to problém. Stačí uvést směr řazení pomocí klíčového slova DESC (descending = sestupně):
select * from protokol order by datum
desc;
Existuje i klauzule ASC (ascending = vzestupně); jestliže se nepoužije, program ji dosadí automaticky. Při řazení podle více sloupců lze samozřejmě kombinovat, takže následující zápis je správný a udělá to, co má:
select jmeno, prijmeni, datum_nastupu
from zamestnanci
order by datum nastupu desc, prijmeni asc, jmeno;
Při práci s databází se snadno můžeme dostat do situace, kdy potřebujeme řadit podle určitého sloupce ve výsledné sadě záznamů, přičemž neznáme předem jeho název. Například můžete chtít napsat obecnou proceduru, která seřadí dodanou sadu podle prvního sloupce. MySQL to umí - stačí místo názvu sloupce v klauzuli ORDER BY uvést jeho pořadové číslo. Takže například následující zápisy jsou rovnocenné:
select id, cislo, datum from smlouvy
order by datum;
select id, cislo, datum from smlouvy order by 3;
Ale pozor - v kombinaci s "hvězdičkovým" příkazem SELECT to může být poměrně
ošemetné. Chcete li řadit například podle třetího sloupce a zároveň nemáte ani
ponětí, v jakém pořadí databáze vrátí sloupce, pravděpodobně seřadíte data
jinak, než jste zamýšleli.
Následující věc nejlépe vysvětlím na příkladu: Dejme tomu, že budete chtít seřadit jednotlivé státy na světě (a třeba je poskytnout webové aplikaci jako podklady pro formulář):
create table staty(nazev varchar
(30));
insert into staty values ('Andorra');
...
insert into staty
values ('Česká republika');
...
insert into staty values ('Slovenská
republika');
...
insert into staty values ('Zambie');
Asi na to půjdete takto:
select nazev from staty order by
nazev;
Jenomže časem za vámi přijde šéf a bude chtít, abyste na začátek seznamu dali ČR, pak SR a zbytek už podle abecedy. Je to jednoduché, pokud si uvědomíme, že součástí klauzule ORDER BY může být i výraz:
SELECT * FROM staty order by
(nazev='Česká republika') DESC,
(nazev='Slovenská republika') DESC, nazev
Nejprve budeme řadit podle logického výrazu "je to Česká republika?", pak
totéž pro Slovensko a zbytek podle abecedy. Protože však chceme, aby ČR a SR
byly nahoře a protože logická jednička se řadí POD logickou nulu, musíme v
prvních dvou případech řadit sestupně. Celý výraz by se pochopitelně dal přepsat
pomocí predikátu IN.
Až na malé výjimky byste se měli bránit řazení v cílových aplikacích a měli byste nechat řadit MySQL. Důvodem je fakt, že řazení data v databázích prošlo dlouhým vývojem a je silně optimalizováno. Bude tak v naprosté většině případů mnohem rychlejší než cokoli, co byste snad vymysleli sami. Pokud je databáze na jiném (a typicky silnějším) stroji než aplikace, je to o důvod navíc nechat všechnu "špinavou práci" s řazením na MySQL.