7. Сортиране. Хеширане
Сортиране -
общи положения; сортиране чрез сравнение
** Класификации на алгоритмите за сортиране [Глава 3,
стр.187]
* В зависимост от местонахождението на данните:
- вътрешно (директен достъп), например бързо сортиране и
- външно (последователен достъп), например сливане.
* В зависимост от операцията:
- чрез сравнение (<,
> и ==) на двойки елементи
и
- чрез трансформация, напр. сортиране чрез броене.
* Свойство на алгоритъма за сортиране:
- устойчиви - относителният ред на елементите с равни
ключове остава непроменен и
- неустойчиви - разместване на елементи с равни ключове
(сортиране с 2 ключа)
* Ефективност на алгоритмите за сортиране - брой на извършени
сравнения и размени (присвоявания).
* Използване на допълнителна памет.
** Дърво на сравненията; сортиране на 3 числа.
** Класически универсални "елементарни" методи за сортиране чрез
сравнение O(n2):
- пряко вмъкване - намираме елемент, който "не е сортиран" и
го поставяме на мястото му в сортираната част;
- пряка селекция (избор) - намираме най-малкия елемент и го
поставяме на мястото му в окончателно сортираната част;
- мехурчето - последователно се разглеждат двойки елементи и
евентуално се разменят.
** Бързо сортиране на Хоор - O(n
log2n)
средно и O(n2) в най-лошия
случай.
** Пирамидално сортиране, сортиране чрез сливане: O(n log2n) и тази оценка не може да
се подобри при сортиране чрез сравняване.
** Сортиране
чрез трансформация [3.2]
** Сортиране чрез множество [3.2.1]
Дадено е множество M от числа в затворения интервал [a, b] и инективна функция за
нареждане f: M -> [a, b], т.е. ако x1 и x2 са различни, то са различни и f (x1) и f (x2).
Построяваме нулев масив S с индекси от a до b и с едно минаване през множеството M поставяме стойности 1 на S[f (x)]
за всяко x от M.
След това минаваме през масива S за да подредим елементите на M.
Сложност O(m+n), където n е броят на елементите на M, а m = b - a + 1.
** Сортиране чрез броене [3.2.2]
** Побитово сортиране [3.2.3]
** Метод на бройните системи [3.2.4]
** Сортиране чрез пермутация [3.2.5]
Дадено е множество M
от n елементи.
Означаваме с S
множеството {1, 2, 3, ..., n}. Функцията за
нареждане f: S -> S е сюрективна (инективна и върху), т.е. ако x1 и x2 са различни,
то f (x1) и f (x2) са различни за всяко y от S съществува x от S такова, че y = f (x).
Разменяме m[1] с m[m[1]]
докато на 1-во място
не дойде 1. После по
същия начин с втория елемент и т.н.
позиции 1234567
4375612
5374612
6374512
1374562
1734562
1234567
Броят на размените не недвишава n, а броят на сравненията - 2n.
Бързо сортиране
А. Разделяне на дялове:
1. Избираме случаен елемент x
от масива a
2. Преглеждаме масива отляво (от началото), докато достигнем
до елемент > x
3. Преглеждаме масива отдясно (от края), докато достигнем до
елемент < x
4. Разменяме местата на двата елемента
vector<int> a(n);
void partition(int x)
{
int i=1, j=n;
do
{
while (a[i] < x) i++;
while (a[j] > x) j--;
if (i<=j) { swap(a[i], a[j]); i++; j--; }
}
while (i<=j);
}
Б. Сортиране - след като масивът се раздели,
двата му дяла се подлагат на същата обработка и това продължава,
докато се получат дялове само с по един елемент.
//
qsort.cpp
void quicksort(int left, int right)
{
int i=left, j=right;
int x=a[(i + j)/2];
do
{
while (a[i] < x) i++;
while (a[j] > x) j--;
if (i<=j)
{ swap(a[i], a[j]); i++;
j--; }
}
while (i<=j);
if (left<j)
quicksort(left, j);
if (i<right) quicksort(i,
right);
}
Сортиране чрез сливане
mergesort.cpp
Сортиране в STL
- sort, qsort
- контейнер set
Хеширане
** Структура от данни речник (dictionary):
ключ-елемент
** Търсене в речник
** Хеш-функция h: key -> [0, N-1], пример h(x) = x mod N
** Хеширане в
курса Структури от данни (англ.)
- контейнер map
Сортиране
- кога каква сортировока е възможна и/или
най-ефективна
- големи цели числа, типа long
long, максимално число от даден тип
unsigned long long k = 0; // всички битове на
числото са нули
cout << (~k) << endl; // всички битове на числото са единици
отпечатва най-голямото число от този (без знак!) тип, в случая
unsigned long long
- сравняване на големи цели числа като низове, напр.
string s1 = "1234", s2 = "99";
един начин:
s1.length() < s2.length() следва,
че числото, записано в s1 е
по-малко от числото, записано в s2
s1.length() >
s2.length() следва, че числото, записано в s1 е по-голямо от числото, записано в
s2
s1.length() ==
s2.length() наредбата на числата е както
наредбата на низовете, т. е. s1
<= s2