Konfuzo en la natura ordigordo

Plej multaj grafikaj dosieradministriloj ne ordigas strikte leksikografie, sed prefere uzas "naturan" ordigon. Blokoj de nombroj en nomoj estas interpretataj kiel nombroj — la pli granda bloko de nombroj venkas, eĉ se la malo estus vera alfabete. La ideo malantaŭ natura ordigo: Kion homoj kutime volas estas "9 antaŭ 10", "Ĉapitro 2 antaŭ Ĉapitro 10" — sen devi aldoni antaŭajn nulojn.


La jenaj dosierparoj estas nature ordigitaj en kreskanta ordo jene:

  • build-9e2.log
  • build-950.log

Mirinde, sed klarigebla: La unua cifero \(9\) estas pli malgranda ol la unua bloko de ciferoj \(950\) .

  • IMG_12113419_90.jpg
  • IMG_0554363070_90.jpg

La nombro \(12113419\) estas malpli ol \(554363070\) (la komenca \(0\) estas forigita).

  • temp_0C.txt
  • temp_2C.txt
  • temp_-3C.txt
  • temp_10C.txt
  • temp_-12C.txt

La komparitaj nombroj estas \(0\) , \(2\) , \(3\) , \(10\) , \(12\) – la “-” ne estas konsiderata parto de la nombro.

Eĉ "alfabeta" ne estas tutmonde nedubebla: Majuskligo, umlaŭtoj kiel ä (germana), aŭ plursignaj literoj kiel ch (ĉeĥa) kondukas al legitimaj variaĵoj. "Pure alfabeta" do dependas de la kunteksto. La Windows Explorer efektivigas tion en la funkcio StrCmpLogicalW . Kvankam ĝia fontkodo (shlwapi.dll) estas proprieta kaj ne publika, ekzistas reimplementoj, ekzemple, de ReactOS.:

{
    TRACE("%s, %s\n", wine_dbgstr_w(str), wine_dbgstr_w(comp));
 
    if (!str || !comp)
        return 0;
 
    while (*str)
    {
        if (!*comp)
            return 1;
        else if (*str >= '0' && *str <= '9')
        {
            int str_value, comp_value;
 
            if (*comp < '0' || *comp > '9')
                return -1;
 
            /* Compare the numbers */
            StrToIntExW(str, 0, &str_value);
            StrToIntExW(comp, 0, &comp_value);
 
            if (str_value < comp_value)
                return -1;
            else if (str_value > comp_value)
                return 1;
 
            /* Skip */
            while (*str >= '0' && *str <= '9') str++;
            while (*comp >= '0' && *comp <= '9') comp++;
        }
        else if (*comp >= '0' && *comp <= '9')
            return 1;
        else
        {
            int diff = ChrCmpIW(*str, *comp);
            if (diff > 0)
                return 1;
            else if (diff < 0)
                return -1;
 
            str++;
            comp++;
        }
    }
 
    if (*comp)
      return -1;
 
    return 0;
}

Google Drive, OneDrive, KDE, kaj aliaj montras similan ordigan konduton. CLI-iloj kiel ls kaj find Tamen, ili ordigas malsame ol GUI-dosieradministriloj. Semantiko estas en la dosiernomoj, ne en la API. Se vi volas rezultojn sen surprizoj, difinu konvenciojn: koherajn apartigilojn, remburitajn nombrojn kaj klaran traktadon de unuoj. Tiam "alfabeta" denove fariĝas antaŭvidebla.

Reen