lеcture02

2. Оценка и сложност на алгоритми [1.4]

Три главни свойства на компютърен алгоритъм:

простота и елегантност;

коректност;

бързодействие.

Нека разгледаме следния програмен фрагмент:

cin >> n;
sum = 0;
for (i=0; i<n; i++)
for (j=0; j<n; j++) sum++;

Колко бързо ще работи горната програма, т.е. какви са критериите по-които се определя бързината й? Това, което можем да направим експериментално е да проверим за колко време ще се изпълни и ще завърши работата си. За да изследваме по-общо нейното поведение е възможно да я изпълним за други стойности на n.

Резултатите от последното са обобщени в следната таблица:

Размер на входа n	Време за изпълнение сек.
10	10^-6
100	10^-4
1000	0.01
10⁴	1.071
10⁶	106.5
10⁸	10663.6

От таблицата се вижда, че когато увеличаваме размерността на входа n 10 пъти, времето за изпълнение се увеличава 100 пъти.
Времето за изпълнение е пророрционално на f (n) = c₁n²+ c₂n+ c₃, където c₁, c₂, c₃ са константи, които могат лесно да се определят от дадената част от програмата.

Сравняване на двете функции f (n)= 2n²и g(n)= 200n, които показват времето за изпълнение на два дадени алгоритъма А₁ и A₂, в зависимост от n.

Асимптотично алгоритъмът A₂ е по-бърз и неговата сложност е линейна, докато тази на A₁ е квадратична.

n	f (n)	g(n)
1	2	200
10	200	2000
100	2.10⁴	2.10⁴
1000	2.10⁶	2.10⁵
10⁴	2.10⁸	2.10⁶
10⁶	2.10¹²	2.10⁸

Размер на входните данни

Нека е дадена задача, в която размерът на входните данни е определен от дадено цяло число n. Почти всички задачи, които ще разглеждаме, притежават това свойство. Ще поясним последното като разгледаме няколко примера:

Пример 1.
Да се сортира масив с n елемента.
Размерът на входните данни се определя от броя n на елементите на масива .

Пример 2.
Да се намери най-големият общ делител на a и b.
В този пример размерът на входните данни се определя от броя на двоичните цифри (битовете) на по-голямото от числата a и b.

Пример 3.
Да се намери покриващо дърво на граф.
В този случай характеризираме размера на входа с две числа: брой на върховете и брой на ребрата.

Асимптотична нотация

Когато се интересуваме от сложността на алгоритъм най-често се интересуваме как ще работи при достатъчно голям размер n на входните данни. При формалното оценяване на сложността на алгоритмите изследваме поведението им при "достатъчно голямо" n, т.е. клонящо към безкрайност.

1. O(F) определя множеството от всички функции f, които нарастват не по-бързо от F, т.е. съществува константа c > 0 такава, че f (n) <= cF(n), за всички достатъчно големи стойности на n.

2. Q (F) определя множеството от всички функции f, които нарастват толкова бързо, колкото и F (с точност до константен множител), т.е. съществуват константи c₁ > 0 и c₂ > 0 такава, че c₁F(n) <= f (n) <= c₂F(n), за всички достатъчно големи стойности на n.

3. W (F) определя множеството от всички функции f, които нарастват не по-бавно от F, т.е. съществува константа c > 0 такава, че f (n) >= cF(n), за всички достатъчно големи стойности на n.

O(F): Свойства и примери

Нотацията О(F) е най-често използваната при оценка на сложност на алгоритми и програми.
По-важни свойства на O(F) (с ~ тук означаваме принадлежност):

рефлексивност: f ~ О( f );

транзитивност: ако f ~ О(g), g ~ О(h), то f ~ О(h);

транспонирана симетрия: ако f ~ W (g), то g ~ O( f ) и обратно;

константите могат да бъдат игнорирани: за всяко k > 0, kF ~ О(F);

n, повдигнато в по-висока степен, нараства по-бързо: n^r~ О(n^s), за 0 < r < s.

нарастването на сума от функции се определя от най-бързо нарастващата от тях: f + g ~ max(O( f ), O(g));

ако f(n) е полином от степен d, то f ~ О(n^d);

ако f нараства по-бързо от g, а g нараства по-бързо от h, то следва, че f нараства по-бързо от h.

Нарастване на най-често използваните функции:

Функция / n	1	2	10	100	1000
5	5	5	5	5	5
log n	0	1	3.32	6.64	9.96
n	1	2	10	100	1000
n log n	0	2	33.2	664	9996
n²	1	4	100	10⁴	10⁶
n³	1	8	1000	10⁶	10⁹
2ⁿ	2	4	1024	10³⁰	10³⁰⁰
n!	1	2	3628800	10¹⁵⁷	10²⁵⁶⁷
nⁿ	1	4	10¹⁰	10²⁰⁰	10³⁰⁰⁰

Определяне на сложност на алгоритъм:
- елементарна операция - не зависи от размера на обработваните данни - O(1) ;
- последователност от оператори - определя се от асимтотично най-бавния - f + g ~ max(O( f ), O(g));
- композиция на оператори - произведение от сложностите - f g ~ O( f g);
- условни оператори - определя се от асимтотично най-бавния между условието и различните случаи;
- цикли, вложени цикли - O(n), O(n^p) .

Примери:
/* Брой цифри на число */
// digits.cpp
#include <iostream>
using namespace std;
int main()
{
unsigned n;
cin >> n; unsigned d, m = n;
for (d = 0; m > 0; d++, m /= 10);
cout << d;
return 0;
}

/* Брой цифри на число */
// ldigit.cpp
#include <iostream>
#include <cmath>
using namespace std;
int main()
{    unsigned n;     cin >> n;     cout << int(1 + log10(n));
    return 0;
}

Оценка на сложността на следните цикли (колко пъти ще се изпълни цикъла в най-лошия случай):
// 1
for (i = 0; i < n; i++)
for (j = 0; j < n; j++, sum++);
// 2
for (i = 0; i < n; i++)
for (j = 0; j < n; j++) if (a[i] == b[j]) return;
// 3
for (i = 0; i < n; i++)
for (j = 0; j < n; j++) if (a[i] != b[j]) return;
// 4
for (i = 0; i < n; i++)
for (j = 0; j < n; j++) if (a[i] == a[j]) return;
// 5
for (i = 0; i < n; i++)
for (j = 0; j < i; j++) sum++;
// 6
for (i = 0; i < n; i++)
for (j = 0; j < n*n; j++) sum++;
// 7
for (i = 0; i < n; i++)
for (j = 0; j < i*i; j++) sum++;
// 8
for (i = 0; i < n; i++)
for (j = 0; j < i*i; j++)
   for (k = 0; k < j*j; k++) sum++;

Логаритмична сложност.

Да разгледаме цикъла:
for (sum = 0, i = 0; i < n; i *= 2) sum++;
Променливата i приема стойности 1, 2, 4, ..., 2^k, ... докато надмине n. Цикълът се изпълнява [log n] пъти. Сложността е O(log n).

    Изчисляване на сложност при рекурсия.
Пример: Двоично търсене - рекурсивен алгоритъм.
    Броим обръщенията към елементите на масива. В рекурсивната функция се разглежда средния елемент и се прави едно рекурсивно извикване с два пъти по-малък масив. Следователно, ако T(n) е функцията, която задава броя на обръщенията, то T(n) = T(n/2) + 1. От равенствата
                T(n) = T(n/2) + 1 = T(n/4) + 2 = T(n/8) + 3 = ... = T(n/2^k) + k
получаваме за n = 2^k, че T(n) = T(1) + log n, т.е. сложността на алгоритъма е O(log n).

Най-добър случай, най-лош случай, обща сложност.
Проблеми при асимптотичната нотация [1.4.11]