De flesta grafiska filhanterare sorterar inte strikt lexikografiskt, utan använder snarare "naturlig" sortering. Sifferblock i namn tolkas som siffror – det större sifferblocket vinner, även om det motsatta skulle gälla alfabetiskt. Tanken bakom naturlig sortering: Det folk vanligtvis vill ha är "9 före 10", "Kapitel 2 före Kapitel 10" – utan att behöva lägga till inledande nollor.
Följande filpar sorteras naturligtvis i stigande ordning enligt följande:
build-9e2.logbuild-950.log
Otroligt, men förklarligt: Den första siffran \(9\) är mindre än det första sifferblocket \(950\) .
IMG_12113419_90.jpgIMG_0554363070_90.jpg
Talet \(12113419\) är mindre än \(554363070\) (den inledande \(0\) är borttagen).
temp_0C.txttemp_2C.txttemp_-3C.txttemp_10C.txttemp_-12C.txt
De jämförda talen är \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – "-" räknas inte som en del av talet.
Även "alfabetisk" är inte globalt entydig: Stor bokstav, omljud som ä (tyska) eller flerteckensbokstäver som ch (tjeckiska) leder till legitima varianter. "Rent alfabetisk" är därför kontextberoende. Utforskaren i Windows implementerar detta i funktionen StrCmpLogicalW . Även om dess källkod (shlwapi.dll) är proprietär och inte offentlig, finns det omimplementeringar, till exempel från ReactOS.:
{
TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
if (!str || !comp)
return 0;
while (*str)
{
if (!*comp)
return 1;
else if (*str >= '0' && *str <= '9')
{
int str_value, comp_value;
if (*comp < '0' || *comp > '9')
return -1;
/* Compare the numbers */
StrToIntExW(str, 0, &str_value);
StrToIntExW(comp, 0, &comp_value);
if (str_value < comp_value)
return -1;
else if (str_value > comp_value)
return 1;
/* Skip */
while (*str >= '0' && *str <= '9') str++;
while (*comp >= '0' && *comp <= '9') comp++;
}
else if (*comp >= '0' && *comp <= '9')
return 1;
else
{
int diff = ChrCmpIW(*str, *comp);
if (diff > 0)
return 1;
else if (diff < 0)
return -1;
str++;
comp++;
}
}
if (*comp)
return -1;
return 0;
}
Google Drive, OneDrive, KDE och andra visar ett liknande sorteringsbeteende. CLI-verktyg som ls och find De sorterar dock annorlunda än GUI-filhanterare. Semantiken finns i filnamnen, inte i API:et. Om du vill ha resultat utan överraskningar, definiera konventioner: konsekventa avgränsare, utfyllda siffror och tydlig hantering av enheter. Då blir "alfabetisk" förutsägbar igen.