Стабилизируете стандартную библиотеку qsort?

Я предполагаю, что старая добрая функция qsort в stdlib нестабильна, потому что на странице руководства об этом ничего не говорится. Это функция, о которой я говорю:

   #include <stdlib.h>
   void qsort(void *base, size_t nmemb, size_t size,
              int(*compar)(const void *, const void *));  

Я предполагаю, что если я изменю свою функцию сравнения, чтобы включить в нее адрес того, что я сравниваю, она будет стабильной. Это верно?

Например:

int compareFoos( const void* pA, const void *pB ) {
    Foo *pFooA = (Foo*) pA;
    Foo *pFooB = (Foo*) pB;

    if( pFooA->id < pFooB->id ) {
        return -1;
    } else if( pFooA->id > pFooB->id ) {
        return 1;
    } else if( pA < pB ) {
        return -1;            
    } else if( pB > pA ) {
       return 1;
    } else {
       return 0;
    }
}   

Ответов (3)

Решение

Нет, к сожалению, на это нельзя полагаться. Предположим, у вас есть массив (два поля в каждой записи используются для проверки, но только первое поле используется для сортировки):

BBBB,1
BBBB,2
AAAA,3

Quicksort может сравнить BBBB, 1 с AAAA, 3 и поменять их местами, давая:

AAAA,3
BBBB,2
BBBB,1

Если бы следующим шагом было сравнение BBBB, 2 с BBBB, 1, ключи были бы одинаковыми, и, поскольку BBBB, 2 имеет адрес меньше BBBB, 1, свопинг не произойдет. Для стабильной сортировки у вас должно получиться:

AAAA,3
BBBB,1
BBBB,2

Единственный способ сделать это - присоединить начальный адрес указателя (а не его текущий адрес) и выполнить сортировку, используя его, а также другие ключи. Таким образом, исходный адрес становится второстепенной частью ключа сортировки, так что в BBBB,1 конечном итоге он окажется раньше, BBBB,2 независимо от того, куда BBBB идут две строки в процессе сортировки.

Это не работает, потому что во время процедуры сортировки порядок изменится, и два элемента не будут иметь согласованного вывода. Чтобы сделать старый добрый qsort стабильным, я добавляю начальный индекс внутри моей структуры и инициализирую это значение перед передачей его в qsort.

typedef struct __bundle {
    data_t some_data;
    int sort_score;
    size_t init_idx;
} bundle_t;

/*
 .
 .
 .
 .
*/

int bundle_cmp(void *ptr1, void *ptr2) {
    bundle_t *b1, *b2;
    b1 = (budnel_t *) ptr1;
    b2 = (budnel_t *) ptr2;
    if (b1->sort_score < b2->sort_score) {
        return -1;
    }
    if (b1->sort_score > b2->sort_score) {
        return 1;
    }
    if (b1->init_idx < b2->init_idx) {
        return -1;
    }
    if (b1->init_idx > b2->init_idx) {
        return 1;
    }
    return 0;
}

void sort_bundle_arr(bundle_t *b, size_t sz) {
    size_t i;
    for (i = 0; i < sz; i++) {
        b[i]->init_idx = i;
    }
    qsort(b, sz, sizeof(bundle_t), bundle_cmp);
}

Каноническое решение состоит в том, чтобы создать (то есть выделить память и заполнить) массив указателей на элементы исходного массива и qsort этот новый массив, используя дополнительный уровень косвенности и возвращаясь к сравнению значений указателей, когда то, на что они указывают равны. Этот подход имеет потенциальное побочное преимущество, заключающееся в том, что вы вообще не изменяете исходный массив, но если вы хотите, чтобы исходный массив был отсортирован в конце, вам придется переставить его, чтобы он соответствовал порядку в массиве указателей после qsort возвращается.