De fleste grafiske filhåndteringsprogrammer sorterer ikke strengt leksikografisk, men bruger snarere "naturlig" sortering. Talblokke i navne fortolkes som tal – den større talblok vinder, selvom det modsatte ville være tilfældet alfabetisk. Ideen bag naturlig sortering: Det, folk normalt ønsker, er "9 før 10", "Kapitel 2 før Kapitel 10" – uden at skulle tilføje foranstillede nuller.
Følgende filpar er naturligt sorteret i stigende rækkefølge som følger:
build-9e2.logbuild-950.log
Utroligt, men forklarligt: Det første ciffer \(9\) er mindre end den første blok af cifre \(950\) .
IMG_12113419_90.jpgIMG_0554363070_90.jpg
Tallet \(12113419\) er mindre end \(554363070\) (det indledende \(0\) er fjernet).
temp_0C.txttemp_2C.txttemp_-3C.txttemp_10C.txttemp_-12C.txt
De sammenlignede tal er \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – "-" betragtes ikke som en del af tallet.
Selv "alfabetisk" er ikke globalt entydig: Store bogstaver, umlauter som ä (tysk) eller flertegnsbogstaver som ch (tjekkisk) fører til legitime varianter. "Rent alfabetisk" er derfor kontekstafhængig. Windows Stifinder implementerer dette i StrCmpLogicalW -funktionen. Selvom kildekoden (shlwapi.dll) er proprietær og ikke offentlig, findes der reimplementeringer, for eksempel fra ReactOS.:
{
TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
if (!str || !comp)
return 0;
while (*str)
{
if (!*comp)
return 1;
else if (*str >= '0' && *str <= '9')
{
int str_value, comp_value;
if (*comp < '0' || *comp > '9')
return -1;
/* Compare the numbers */
StrToIntExW(str, 0, &str_value);
StrToIntExW(comp, 0, &comp_value);
if (str_value < comp_value)
return -1;
else if (str_value > comp_value)
return 1;
/* Skip */
while (*str >= '0' && *str <= '9') str++;
while (*comp >= '0' && *comp <= '9') comp++;
}
else if (*comp >= '0' && *comp <= '9')
return 1;
else
{
int diff = ChrCmpIW(*str, *comp);
if (diff > 0)
return 1;
else if (diff < 0)
return -1;
str++;
comp++;
}
}
if (*comp)
return -1;
return 0;
}
Google Drive, OneDrive, KDE og andre viser en lignende sorteringsadfærd. CLI-værktøjer som f.eks. ls og find De sorterer dog anderledes end GUI-filhåndteringssystemer. Semantikken findes i filnavnene, ikke i API'en. Hvis du vil have resultater uden overraskelser, skal du definere konventioner: ensartede separatorer, udfyldningstegn og tydelig håndtering af enheder. Så bliver "alfabetisk" forudsigelig igen.