Більшість графічних файлових менеджерів не сортують виключно лексикографічно, а використовують «природне» сортування. Блоки чисел в іменах інтерпретуються як числа — більший блок чисел перемагає, навіть якщо в алфавітному порядку все навпаки. Ідея природного сортування: люди зазвичай хочуть «9 перед 10», «Розділ 2 перед розділом 10» — без необхідності додавати початкові нулі.
Наступні пари файлів природним чином відсортовані у порядку зростання наступним чином:
build-9e2.logbuild-950.log
Дивовижно, але можна пояснити: перша цифра \(9\) менша за перший блок цифр \(950\) .
IMG_12113419_90.jpgIMG_0554363070_90.jpg
Число \(12113419\) менше за \(554363070\) (початковий \(0\) видаляється).
temp_0C.txttemp_2C.txttemp_-3C.txttemp_10C.txttemp_-12C.txt
Порівнювані числа: \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – знак «-» не вважається частиною числа.
Навіть «алфавітний» не є однозначним у всьому світі: використання великих літер, умлаути, такі як ä (німецька), або багатосимвольні літери, такі як ch (чеська), призводять до легітимних варіантів. Тому «чисто алфавітний» залежить від контексту. Провідник Windows реалізує це у функції StrCmpLogicalW . Хоча її вихідний код (shlwapi.dll) є власним і не є публічним, існують ререалізації, наприклад, з ReactOS.:
{
TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
if (!str || !comp)
return 0;
while (*str)
{
if (!*comp)
return 1;
else if (*str >= '0' && *str <= '9')
{
int str_value, comp_value;
if (*comp < '0' || *comp > '9')
return -1;
/* Compare the numbers */
StrToIntExW(str, 0, &str_value);
StrToIntExW(comp, 0, &comp_value);
if (str_value < comp_value)
return -1;
else if (str_value > comp_value)
return 1;
/* Skip */
while (*str >= '0' && *str <= '9') str++;
while (*comp >= '0' && *comp <= '9') comp++;
}
else if (*comp >= '0' && *comp <= '9')
return 1;
else
{
int diff = ChrCmpIW(*str, *comp);
if (diff > 0)
return 1;
else if (diff < 0)
return -1;
str++;
comp++;
}
}
if (*comp)
return -1;
return 0;
}
Google Диск, OneDrive, KDE та інші демонструють подібну поведінку сортування. Інструменти командного рядка, такі як ls і find Однак, вони сортують інакше, ніж файлові менеджери з графічним інтерфейсом. Семантика знаходиться в іменах файлів, а не в API. Якщо ви хочете отримати результати без несподіванок, визначте умовні положення: узгоджені роздільники, доповнені числа та чітку обробку одиниць вимірювання. Тоді "алфавітний" знову стає передбачуваним.