Стабилизируете стандартную библиотеку qsort?
Я предполагаю, что старая добрая функция qsort в stdlib нестабильна, потому что на странице руководства об этом ничего не говорится. Это функция, о которой я говорю:
#include <stdlib.h>
void qsort(void *base, size_t nmemb, size_t size,
int(*compar)(const void *, const void *));
Я предполагаю, что если я изменю свою функцию сравнения, чтобы включить в нее адрес того, что я сравниваю, она будет стабильной. Это верно?
Например:
int compareFoos( const void* pA, const void *pB ) {
Foo *pFooA = (Foo*) pA;
Foo *pFooB = (Foo*) pB;
if( pFooA->id < pFooB->id ) {
return -1;
} else if( pFooA->id > pFooB->id ) {
return 1;
} else if( pA < pB ) {
return -1;
} else if( pB > pA ) {
return 1;
} else {
return 0;
}
}
Ответов (3)3
Нет, к сожалению, на это нельзя полагаться. Предположим, у вас есть массив (два поля в каждой записи используются для проверки, но только первое поле используется для сортировки):
BBBB,1
BBBB,2
AAAA,3
Quicksort может сравнить BBBB, 1 с AAAA, 3 и поменять их местами, давая:
AAAA,3
BBBB,2
BBBB,1
Если бы следующим шагом было сравнение BBBB, 2 с BBBB, 1, ключи были бы одинаковыми, и, поскольку BBBB, 2 имеет адрес меньше BBBB, 1, свопинг не произойдет. Для стабильной сортировки у вас должно получиться:
AAAA,3
BBBB,1
BBBB,2
Единственный способ сделать это - присоединить начальный адрес указателя (а не его текущий адрес) и выполнить сортировку, используя его, а также другие ключи. Таким образом, исходный адрес становится второстепенной частью ключа сортировки, так что в BBBB,1
конечном итоге он окажется раньше, BBBB,2
независимо от того, куда BBBB
идут две строки в процессе сортировки.
Это не работает, потому что во время процедуры сортировки порядок изменится, и два элемента не будут иметь согласованного вывода. Чтобы сделать старый добрый qsort стабильным, я добавляю начальный индекс внутри моей структуры и инициализирую это значение перед передачей его в qsort.
typedef struct __bundle {
data_t some_data;
int sort_score;
size_t init_idx;
} bundle_t;
/*
.
.
.
.
*/
int bundle_cmp(void *ptr1, void *ptr2) {
bundle_t *b1, *b2;
b1 = (budnel_t *) ptr1;
b2 = (budnel_t *) ptr2;
if (b1->sort_score < b2->sort_score) {
return -1;
}
if (b1->sort_score > b2->sort_score) {
return 1;
}
if (b1->init_idx < b2->init_idx) {
return -1;
}
if (b1->init_idx > b2->init_idx) {
return 1;
}
return 0;
}
void sort_bundle_arr(bundle_t *b, size_t sz) {
size_t i;
for (i = 0; i < sz; i++) {
b[i]->init_idx = i;
}
qsort(b, sz, sizeof(bundle_t), bundle_cmp);
}
Каноническое решение состоит в том, чтобы создать (то есть выделить память и заполнить) массив указателей на элементы исходного массива и qsort
этот новый массив, используя дополнительный уровень косвенности и возвращаясь к сравнению значений указателей, когда то, на что они указывают равны. Этот подход имеет потенциальное побочное преимущество, заключающееся в том, что вы вообще не изменяете исходный массив, но если вы хотите, чтобы исходный массив был отсортирован в конце, вам придется переставить его, чтобы он соответствовал порядку в массиве указателей после qsort
возвращается.