Konfuzion në rendin natyror të renditjes

Shumica e menaxherëve grafikë të skedarëve nuk rendisin në mënyrë të rreptë leksikografike, por përdorin renditjen "natyrore". Blloqet e numrave në emra interpretohen si numra - blloku më i madh i numrave fiton, edhe nëse e kundërta do të ishte e vërtetë sipas renditjes alfabetike. Ideja pas renditjes natyrore: Ajo që njerëzit zakonisht duan është "9 para 10", "Kapitulli 2 para Kapitullit 10" - pa pasur nevojë të shtojnë zero fillestare.


Çiftet e mëposhtme të skedarëve renditen natyrshëm në rend rritës si më poshtë::

  • build-9e2.log
  • build-950.log

E mahnitshme, por e shpjegueshme: Shifra e parë \(9\) është më e vogël se blloku i parë i shifrave \(950\) .

  • IMG_12113419_90.jpg
  • IMG_0554363070_90.jpg

Numri \(12113419\) është më i vogël se \(554363070\) ( \(0\) që e çon është hequr).

  • temp_0C.txt
  • temp_2C.txt
  • temp_-3C.txt
  • temp_10C.txt
  • temp_-12C.txt

Numrat e krahasuar janë \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – shenja “-” nuk konsiderohet pjesë e numrit.

Edhe "alfabetik" nuk është globalisht i qartë: Shkronjat e mëdha, umlautet si ä (gjermanisht) ose shkronjat me shumë karaktere si ch (çekisht) çojnë në variante legjitime. Prandaj, "Thjesht alfabetik" varet nga konteksti. Windows Explorer e zbaton këtë në funksionin StrCmpLogicalW . Ndërsa kodi i tij burimor (shlwapi.dll) është pronësor dhe jo publik, ka ri-zbatime, për shembull, nga ReactOS.:

{
    TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
 
    if (!str || !comp)
        return 0;
 
    while (*str)
    {
        if (!*comp)
            return 1;
        else if (*str >= '0' && *str <= '9')
        {
            int str_value, comp_value;
 
            if (*comp < '0' || *comp > '9')
                return -1;
 
            /* Compare the numbers */
            StrToIntExW(str, 0, &str_value);
            StrToIntExW(comp, 0, &comp_value);
 
            if (str_value < comp_value)
                return -1;
            else if (str_value > comp_value)
                return 1;
 
            /* Skip */
            while (*str >= '0' && *str <= '9') str++;
            while (*comp >= '0' && *comp <= '9') comp++;
        }
        else if (*comp >= '0' && *comp <= '9')
            return 1;
        else
        {
            int diff = ChrCmpIW(*str, *comp);
            if (diff > 0)
                return 1;
            else if (diff < 0)
                return -1;
 
            str++;
            comp++;
        }
    }
 
    if (*comp)
      return -1;
 
    return 0;
}

Google Drive, OneDrive, KDE dhe të tjerë shfaqin një sjellje të ngjashme renditjeje. Mjetet CLI si p.sh. ls dhe find Megjithatë, ato renditen ndryshe nga menaxherët e skedarëve GUI. Semantika është në emrat e skedarëve, jo në API. Nëse dëshironi rezultate pa surpriza, përcaktoni konventa: ndarës të qëndrueshëm, numra të mbushur dhe trajtim të qartë të njësive. Pastaj "alfabetik" bëhet përsëri i parashikueshëm.

Mbrapa