Większość graficznych menedżerów plików nie sortuje ściśle leksykograficznie, lecz stosuje sortowanie „naturalne”. Bloki liczb w nazwach są interpretowane jako liczby – większy blok liczb wygrywa, nawet jeśli w przypadku alfabetu sytuacja byłaby odwrotna. Idea sortowania naturalnego: ludzie zazwyczaj chcą „9 przed 10”, „Rozdział 2 przed rozdziałem 10” – bez konieczności dodawania zer na początku.
Poniższe pary plików są naturalnie sortowane w kolejności rosnącej w następujący sposób:
build-9e2.logbuild-950.log
Niesamowite, ale wytłumaczalne: Pierwsza cyfra \(9\) jest mniejsza niż pierwszy blok cyfr \(950\) .
IMG_12113419_90.jpgIMG_0554363070_90.jpg
Liczba \(12113419\) jest mniejsza niż \(554363070\) (początkowe \(0\) zostało usunięte).
temp_0C.txttemp_2C.txttemp_-3C.txttemp_10C.txttemp_-12C.txt
Porównywane są liczby \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – znak „-” nie jest uważany za część liczby.
Nawet „alfabetyczny” nie jest globalnie jednoznaczny: kapitalizacja, umlauty, takie jak ä (niemiecki), czy litery wieloznakowe, takie jak ch (czeski), prowadzą do poprawnych wariantów. „Czysty alfabetyczny” jest zatem zależny od kontekstu. Eksplorator Windows implementuje to w funkcji StrCmpLogicalW . Chociaż jej kod źródłowy (shlwapi.dll) jest zastrzeżony i nie jest publicznie dostępny, istnieją reimplementacje, na przykład w ReactOS.:
{
TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
if (!str || !comp)
return 0;
while (*str)
{
if (!*comp)
return 1;
else if (*str >= '0' && *str <= '9')
{
int str_value, comp_value;
if (*comp < '0' || *comp > '9')
return -1;
/* Compare the numbers */
StrToIntExW(str, 0, &str_value);
StrToIntExW(comp, 0, &comp_value);
if (str_value < comp_value)
return -1;
else if (str_value > comp_value)
return 1;
/* Skip */
while (*str >= '0' && *str <= '9') str++;
while (*comp >= '0' && *comp <= '9') comp++;
}
else if (*comp >= '0' && *comp <= '9')
return 1;
else
{
int diff = ChrCmpIW(*str, *comp);
if (diff > 0)
return 1;
else if (diff < 0)
return -1;
str++;
comp++;
}
}
if (*comp)
return -1;
return 0;
}
Google Drive, OneDrive, KDE i inne oferują podobne zachowanie sortowania. Narzędzia CLI, takie jak ls oraz find Sortują one jednak inaczej niż menedżery plików z interfejsem graficznym. Semantyka tkwi w nazwach plików, a nie w API. Aby uzyskać wyniki bez niespodzianek, zdefiniuj konwencje: spójne separatory, uzupełnione liczby i przejrzyste zarządzanie jednostkami. Wtedy „alfabetyczny” porządek znów stanie się przewidywalny.