2545a7415595b7ec80fa84a9eafa9ab8f633218a
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,10pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
56 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
57 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
58 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
59
60 \maketitle
61 \begin{abstract}
62 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
63 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
64 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
65 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
66 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
67 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
68 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
69 das hinbekomme bzw. Recht behalte.}
70 \end{abstract}
71 \newpage
72
73 \tableofcontents
74 \newpage
75
76 \section{Motivation und Einleitung}
77
78 \subsection{Motivation}\label{sect:motivation}
79
80 \begin{itemize}
81 \item Sortiernetzwerke sind toll, weil $\ldots$
82 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
83 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
84   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
85 \end{itemize}
86
87 \subsection{Einleitung}\label{sect:einleitung}
88
89 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
90
91 {\em Komparatoren} sind die Bausteine, die {\em Sortiernetzwerken} zugrunde
92 liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten können.
93 Ausserdem besitzt ein {\em Komparator} zwei Ausgänge, die im Gegensatz zu den
94 Eingängen unterscheidbar sind: Die grö"sere der beiden Zahlen wird immer auf
95 dem einen, die kleinere der beiden Zahlen immer auf dem anderen Ausgang
96 ausgegeben.
97
98 Wenn man nun mehrere {\em Komparatoren} miteinander kombiniert, also die
99 Ausgänge von Komparatoren mit dem Eingängen anderer Komparatoren verbindet,
100 erhält man ein {\em Komparatornetzwerk}.
101
102 \begin{figure}
103 \begin{center}
104 \input{images/einfaches_komparatornetzwerk.tex}
105 \end{center}
106 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
107 aus 5~Komparatoren.}
108 \label{fig:einfaches_komparatornetzwerk}
109 \end{figure}
110
111 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
112 Komparatornetzwerk aus fünf Komparatoren in der üblichen Darstellungsweise:
113 Die horizontalen Linien stellen Leitungen von den Eingängen auf der linken
114 Seite zu den Ausgängen auf er rechten Seite dar. Die vertikalen Pfeile
115 symbolisieren die Komparatoren, die die Werte "`auf den Leitungen"'
116 vergleichen und ggf. vertauschen. Nach einem Komparator befindet sich die
117 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
118 befindet sich auf der Leitung auf der der Pfeil seinen Ursprung hat.
119
120 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
121 gleichzeitig angewandt werden. Das Beispiel in
122 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
123 vergleicht in einem ersten Schritt die zwei oberen und die zwei unteren
124 Leitungen gleichzeitig. Eine Gruppe von Komparatoren, die gleichzeitig
125 angewendet werden können, nennt man eine \emph{Schicht} des
126 Komparatornetwerks. Die \emph{Verzögerung} eines Komparatornetzwerks ist
127 gleichbedeutend mit der Anzahl der Schichten, in die sich die Komparatoren
128 mindestens gruppieren lassen, da sie die Anzahl der benötigten parallelen
129 Schritte darstellt.
130
131 Komparatornetzwerke, die für jede beliebige Eingabepermutation eine
132 Ausgabe erzeugen, die der Sortierung der Eingabe entspricht, heißen 
133 {\em Sortiernetzwerke}. Das in
134 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
135 ist kein Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ würde zur Ausgabe
136 ${(2, 1, 3, 4)}$ führen -- die bestehenden Sortierung wird also sogar
137 zerstört.
138
139 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft
140 {\em nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich.
141 Dieses Gegenbeispiel zu finden ist allerdings aufwendig.
142
143 \todo{Wie findet man die Gegenbeispiele? Die {\em Entscheidung}, ob ein
144 Netzwerk sortiert, ist doch NP-vollständig, also müsste doch das Finden eines
145 Gegenbeispiels im Allgemeinen auch exponentialle Laufzeit haben..?}
146 \todo{Wenn die {\em Entscheidung}, ob ein Netzwerk sortiert, NP-vollständig
147 ist, müsse man dann nicht einen Zeugen für die Sortiereigenschaft angeben
148 können?}
149
150 \todo{$0-1$-Prinzip}
151
152 Um zu überprüfen, ob ein gegebenes Komparatornetzwerk die Sortiereigenschaft
153 besetzt, müssen nicht alle $n!$ Permutationen von $n$~unterschiedlichen Zahlen
154 ausprobieren. Stattdessen reicht es zu überprüfen, dass das Netzwerk alle
155 $2^n$~0-1-Folgen sortiert.
156
157 Sortiernetzwerke:
158 \begin{itemize}
159 \item Ein Komparator-Netzwerk ist $\ldots$
160 \item Ein Komparator-Netzwerk ist ein Sortiernetzwerk, wenn $\ldots$
161 \item Die Frage nach der Sortiereigenschaft ist NP-vollständig.
162 \end{itemize}
163
164 \subsubsection{Evolutionäre Algorithmen}
165
166 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
167 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
168 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
169 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
170 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
171 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
172 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
173 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
174 praktikablen Zeitkonstanten gefunden werden.
175
176 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
177 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
178 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
179 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
180 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
181 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
182
183 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
184 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
185 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
186 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
187 als {\em Individuum} bezeichnet.
188
189 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
190 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
191 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
192 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
193 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
194 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
195 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
196 werden bessere Lösungen bevorzugt. Zur Bewertung die die sogenannte {\em
197 Gütefunktion}.
198
199 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
200 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
201 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
202 es oft einfach ist {\em irgendeine} Lösung anzugeben. Zum anderen muss eine
203 Methode für die Rekombination existieren. Das insbesondere dann problematisch
204 wenn {\em Nebenbedingungen} eingehalten werden müssen.
205
206 \begin{itemize}
207 \item Unter einem "`Evolutionären Algorithmus"' versteht man $\ldots$
208 \item Da die Sortiereigenschaft zu überprüfen NP-schwer ist, ist die
209 Mutation \textit{(vermutlich)} nicht (effizient) möglich.
210 \end{itemize}
211
212 \section{Bekannte konstruktive Sortiernetzwerke}
213
214 Übersicht über bekannte konstruktive Sortiernetzwerke.
215
216 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
217 \label{sect:odd_even_transpositionsort}
218
219 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
220 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
221 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
222 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
223 ${n = 8}$ Leitungen.
224
225 \begin{figure}
226   \begin{center}
227     \input{images/oe-transposition-8.tex}
228   \end{center}
229   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
230   \label{fig:odd-even-transposition-08}
231 \end{figure}
232
233 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
234 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
235 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
236 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
237 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
238 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
239
240 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
241 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
242 Herausschneiden einer Leitung reduziert. In
243 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
244 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
245 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
246
247 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
248 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
249 Komparatoren anordnen lassen, effizient. Es benötigt
250 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
251 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
252 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
253 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
254
255 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
256 folgenden Algorithmen benötigen ein (einfaches) Sortiernetzwerk als
257 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
258 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
259 Algorithmen.
260
261 \subsection{Das bitone Mergesort-Netzwerk}
262
263 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
264 Sortiernetzwerk, das 1968 von \emph{K.~E.~Batcher} veröffentlicht wurde. Es
265 ist deutlich effizienter als das Odd-Even-Transporitionsort-Netzwerk -- sowohl
266 in Bezug auf die Anzahl der Komparatoren als auch bezüglich der benötigten
267 Zeit, also der Anzahl der Schichten.
268
269 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
270 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
271 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
272 verleiht dem Sortiernetzwerk seinen Namen.
273
274 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
275 Instanzen des Netzwerks, deren Leitungszahl eine Zweierpotenz ist,
276 $\operatorname{BS}(n = 2^t)$.
277
278 Ein Netzwerk von K.~E.~Batcher. Siehe:
279 K.E. Batcher: Sorting Networks and their Applications. Proc. AFIPS Spring
280 Joint Comput. Conf., Vol. 32, 307-314 (1968)
281 \todo{Bibtex!}
282
283 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
284
285 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
286 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
287 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
288 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
289 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
290 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
291 entstehen können. Die wichtigsten Varianten für das \emph{bitone
292 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
293 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
294 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
295 ist wichtig zu beachten, dass das letzte Element nicht größer
296 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
297 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
298 darf.
299
300 \begin{figure}
301   \centering
302   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
303   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
304   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
305   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
306   \caption{Beispiele bitoner Folgen.}
307   \label{fig:beispiel-biton}
308 \end{figure}
309
310 \begin{figure}
311   \centering
312   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
313   \qquad
314   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
315   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
316   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
317   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
318   resultierenden Teilfolgen sind wiederum biton.}
319   \label{fig:bitonic-merge-schema}
320 \end{figure}
321
322 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
323 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
324 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
325 sortiert, die Folge $V$ sei absteigend sortiert:
326 \begin{eqnarray}
327  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
328  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
329 \end{eqnarray}
330 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
331 Positionen verglichen und ggf. vertauscht:
332 \begin{equation}
333 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
334 \end{equation}
335 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
336 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
337 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
338 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
339 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
340 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
341 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
342 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
343 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
344 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
345 zeigt die Situationen vor und nach diesem Schritt des Mischers.
346
347 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
348 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
349 mithilfe des bitonen Mischers, mit zwei Instanzen von
350 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
351 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
352 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
353 definiert ist.
354
355 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
356 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
357 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
358 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
359 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
360 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
361 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
362
363 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
364 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
365 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
366 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
367 besteht, die in $\log(n)$~Schichten angeordnet werden können.
368
369 \subsubsection{Das bitone Mergesort-Netzwerk}
370
371 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
372 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
373 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
374 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
375 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
376 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
377 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
378 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
379 $\operatorname{BS}(2)$ identisch.
380
381 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
382 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
383 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
384 alle Komparatoren in die gleiche Richtung zeigen.
385
386 \begin{figure}
387   \begin{center}
388   \input{images/batcher-8.tex}
389   \end{center}
390   \caption{$S(8)$, Batcher's {\em bitone Mergesort-Netzwerk} für acht
391   Eingänge. Markiert sind die beiden Instanzen von $S(4)$ (rot), die beiden
392   bitonen Mischer~$M(4)$ (blau) und die Komparatoren, die im letzten rekursiven
393   Schritt hinzugefügt wurden (grün).}
394   \label{fig:batcher_08}
395 \end{figure}
396
397 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
398 Abbildung~\ref{fig:batcher_08} zu sehen. Eingezeichnet sind ebenfalls die
399 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
400 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
401 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
402 grün hinterlegt.
403
404 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
405 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
406 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
407 Schichten angeordnet sind.
408
409 %\begin{figure}
410 %\begin{center}
411 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
412 %\end{center}
413 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
414 %$S(n/2)$ und dem Mischer $M(n)$.}
415 %\label{fig:bms_rekursiver_aufbau}
416 %\end{figure}
417
418 \subsection{Das Odd-Even-Mergesort-Netzwerk}
419
420 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
421 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
422 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
423 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
424 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
425 \textit{K.~Batcher} gefunden worden und wird rekursiv durch einen Mischer
426 definiert.
427
428 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
429
430 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
431 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
432 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
433 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
434 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
435 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
436 Umständen mehr Schichten als der \emph{bitone Mischer}.\footnote{Knuth,
437 “Bitonic Sorting”, Seite~230}
438
439 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
440 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
441 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
442 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
443 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
444 \begin{equation}
445 w_i = \left\{ \begin{array}{ll}
446         u_i,     & i < n \\
447         v_{i-n}, & i \geqq n
448       \end{array} \right.,
449       \quad 0 \leqq i < N
450 \end{equation}
451
452 \begin{figure}
453   \begin{center}
454   \input{images/oe-merge.tex}
455   \end{center}
456   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
457   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
458   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
459   \label{fig:oe-merge}
460 \end{figure}
461
462 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
463 geraden Indizes und je eine Liste der ungeraden Indizes.
464 \begin{eqnarray}
465   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
466   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
467   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
468   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
469 \end{eqnarray}
470
471 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
472 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
473 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
474 Ausgang der Mischer die Folgen
475 \begin{eqnarray}
476   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
477   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
478 \end{eqnarray}
479 ergeben.
480
481 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
482 hinzugefügt,
483 \begin{equation}
484   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
485 \end{equation}
486 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
487 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
488
489 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
490 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
491 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
492 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
493 Aufbau lauten:
494 \begin{itemize}
495   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
496   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
497   einzelnen Komparator.
498 \end{itemize}
499
500 Dass die resultierende Folge sortiert ist, lässt sich mit dem
501 {\em 0-1-Prinzip} zeigen:
502 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
503 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
504 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
505 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
506 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
507 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
508 \begin{eqnarray}
509   \left|W_{\textrm{gerade}}\right|_0
510   &=& \left|U_{\textrm{gerade}}\right|_0
511     + \left|V_{\textrm{gerade}}\right|_0
512    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
513    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
514   \left|W_{\textrm{ungerade}}\right|_0
515   &=& \left|U_{\textrm{ungerade}}\right|_0
516     + \left|V_{\textrm{ungerade}}\right|_0
517    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
518    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
519 \end{eqnarray}
520 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
521 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
522 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
523 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
524 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
525 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
526 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
527 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
528
529 \begin{figure}
530   \centering
531   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
532   \qquad
533   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
534   \qquad
535   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
536   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
537   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
538   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
539   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
540   sortiert ist.}
541   \label{fig:oe-post-recursive}
542 \end{figure}
543
544 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
545 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
546 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
547 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
548 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
549
550 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
551 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
552 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
553 \begin{displaymath}
554   K(n,m) = \left\{ \begin{array}{ll}
555     nm, & \mathrm{falls} \quad nm \leqq 1 \\
556     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
557     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
558     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
559   \end{array} \right.
560 \end{displaymath}
561 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
562 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
563 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
564
565 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
566 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
567 Rekursionsschritt der OEM-Konstruktion fügt
568 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
569 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
570 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
571 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
572 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
573 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
574 \begin{displaymath}
575   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
576 \end{displaymath}
577 Komparatoren eingespart. Damit ergibt sich
578 \begin{displaymath}
579   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
580 \end{displaymath}
581 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
582 benötigt werden.
583
584 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
585
586 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht, --~wie
587 das \emph{bitonen Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
588 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
589 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
590 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
591 $\operatorname{OES}(n)$ aus
592 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
593 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
594 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
595 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
596 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
597 Komparatornetzwerke definiert sind.
598
599 \begin{figure}
600   \begin{center}
601   \input{images/oe-mergesort-8.tex}
602   \end{center}
603   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
604   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
605   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
606   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
607   Komparatoren zwischen benachbarten Leitungen (grün).}
608   \label{fig:odd-even-mergesort-08}
609 \end{figure}
610
611 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
612 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
613 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
614 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
615 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
616 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
617
618 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
619 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
620 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
621 \begin{displaymath}
622   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
623        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
624        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
625 \end{displaymath}
626 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
627 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
628 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
629
630 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
631 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{K.~Batcher}
632 zeigt in seiner Arbeit\footnote{\todo{Referenz!}}, dass in diesem Fall
633 \begin{displaymath}
634   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
635 \end{displaymath}
636 gilt.
637
638 % gnuplot:
639 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
640 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
641 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
642
643 %\begin{itemize}
644 %\item Pairwise sorting-network
645 %\end{itemize}
646
647 \section{Transformation von Sortiernetzwerken}
648
649 \subsection{Komprimieren}
650
651 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
652
653 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
654 gleichzeitig ausgewertet werden, wie bereits in
655 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
656 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
657 von \emph{Schichten} verstanden.
658
659 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
660 Komparatornetzwerken interessant. \dots
661
662 \subsection{Normalisieren}
663
664 \begin{figure}
665   \centering
666   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
667   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
668   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
669   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
670   intuitiven Konstruktion und die normalisierte Variante.}
671   \label{fig:beispiel_normalisieren}
672 \end{figure}
673
674 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
675 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
676 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
677 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
678 einen Algorithmus an.
679
680 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
681 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
682 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
683 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
684 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
685 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
686 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
687 Definition.
688
689 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
690 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
691 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
692 und das Trichtermuster zu sehen.
693
694 \subsection{Zwei Netzwerke kombinieren}
695
696 \begin{itemize}
697 \item Mit dem Bitonic-Merge
698 \item Mit dem Odd-Even-Merge
699 \item Nach dem Pairwise sorting-network Schema.
700 \end{itemize}
701
702 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
703
704 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
705 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
706 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
707 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
708 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
709 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
710
711 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
712 Sortiernetzwerk mit $(n-1)$~Leitungen verkleinern, indem man eine Leitung
713 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
714 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
715 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
716 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
717 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
718 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
719 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
720 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
721 das {\em Odd-Even-Transpositionsort-Netzwerk}.
722
723 \begin{figure}
724   \centering
725   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
726   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
727   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
728   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
729   \caption{Eine Leitung wird aus dem {\em Odd-Even-Transpositionsort} Netzwerk
730   $\textrm{OET}(8)$ entfernt: Auf der rot markierten Leitung wird $\infty$
731   angelegt. Da der Wert bei jedem Komparator am unteren Ende herauskommt, ist
732   der Pfad fest vorgegeben. Da die restlichen Werte trotzdem noch richtig
733   sortiert werden müssen, kann dieser Pfad herausgetrennt werden. In der
734   letzten Abbildung ist $\textrm{OET}(7)$ markiert.}
735 \end{figure}
736
737 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
738 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
739 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
740 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
741 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
742 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
743 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
744 auf die keine Komparatoren mehr berührt
745 (Abbildung~\ref{fig:oe-transposition-cut1}).
746
747 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
748 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
749 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
750 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
751 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
752 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
753 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
754 mit $(n-1)$~Elementen darstellen.
755
756 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
757 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
758 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
759 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
760 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
761
762 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
763 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
764 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
765 Darstellung ergibt. Ausserdem ist das
766 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
767 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
768 Ausgabe und kann entfernt werden.
769
770 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
771 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
772 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können wir auf diese Art und
773 Weise einen Sortiernetzwerk mit $2n$~Eingängen wieder auf ein Sortiernetzwerk
774 mit $n$~Eingängen reduzieren.
775
776 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
777 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
778 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
779 ein $n$-Sortiernetzwerk auf ein $m$-Sortiernetzwerk zu reduzieren, ergeben
780 sich insgesamt
781 \begin{displaymath}
782   \prod_{i=n}^{m+1} 2i = 2^{n-m} \frac{n!}{m!}
783   \quad (n > m)
784 \end{displaymath}
785 Möglichkeiten. Diese Möglichkeiten sind nicht alle unterschiedlich. Legt man
786 beispielsweise das Minimum auf die unterste Leitung und das Maximum auf die
787 oberste Leitung eines Standard-Sortiernetzwerks, führen beide Reihenfolgen zum
788 selben Ergebnis.
789
790 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass
791 es möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise
792 Maximum vorzubelegen. Dadurch wird die Anzahl der möglichen Schnitte
793 reduziert, die Menge der erreichbaren Sortiernetzwerke bleibt aber
794 unverändert. Die Anzahl der möglichen „Schnittmuster“ setzt sich zusammen aus
795 der Anzahl von Möglichkeiten, $n-m$~Leitungen aus $n$ Leitungen auszuwählen,
796 und die möglichen Minimum-~/ Maximum-Muster. Damit ergibt sich folgende
797 Formel:
798 \begin{displaymath}
799   2^{n-m} \cdot \left( \begin{array}{c} n \\ n-m \end{array} \right)
800   = 2^{n-m} \cdot \frac{n!}{(n-m)! m!}
801   = 2^{n-m} \cdot \frac{n!}{m!} \cdot \frac{1}{(n-m)!}
802   \quad (n > m)
803 \end{displaymath}
804
805 Die Anzahl der möglichen Schnitte wird mit der Anzahl der zu entfernenden
806 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
807 ein Sortiernetzwerk mit 16~Ein\-gängen zu reduzieren sind 16~Schnitte notwendig,
808 für die es bereits etwa ${3,939 \cdot 10^{13}}$ Möglichkeiten gibt. Ein
809 Ausprobieren aller Möglichkeiten ist für große Netzwerke nicht oder nur unter
810 erheblichem Ressourcenaufwand möglich.
811
812 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
813 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
814 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
815 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
816 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
817 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
818 gute Schnittmuster gesucht.
819
820 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die
821 \emph{Schnitt-Sequenzen} als Individuen. Eine \emph{Schnitt-Sequenz} ist eine
822 Liste mit $c$~Schnitten, die jeweils durch die Start-Leitung und die Richtung
823 \textit{Min} beziehungsweise \textit{Max} gegeben ist. Der Algorithmus wendet
824 jeden Schnitt einzeln an, so dass eine Leitungsnummer mehrfach in einer
825 Schnittsequenz vorkommen kann. Die höchste zulässige Leitungsnummer ist
826 abhängig von der Position des Schnitts in der Sequenz. Der Schnitt an
827 Position~$i$ darf höchstens die Leitungsnummer~${n-i-1}$
828 enthalten.\footnote{Die niedrigste Leitungsnummer ist $0$, die höchste
829 Leitungsnummer eines $n$-Sortiernetzwerks ist $n-1$.}
830
831 Um zwei Individuen zu rekombinieren werden die ersten $r$~Schnitte der einen
832 Schnitt-Sequenz verwendet und die letzten ${c-r}$~Schnitte der zweiten
833 Sequenz. $r$ ist eine Zufallsvariable mit $0 \leqq r \leqq c$.
834
835 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
836 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
837 Schnitt-Richtung.
838
839 In ihrer Arbeit \textit{“Improving Bitonic Sorting by Wire Elimination”}
840 zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka}, wie man einen
841 bitonen Mischer, der nach Batchers Methode konstruiert wurde, durch
842 systematisches Entfernen von Leitungen in einen ebenfalls bitonen Mischer mit
843 der Hälfte der Leitungen transformiert. Diese alternativen Mischer sparen im
844 Vergleich zu den Mischern, die nach Batchers Methode konstruiert werden,
845 Komparatoren ein.
846
847 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
848 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
849 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
850 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
851 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
852 Komparatoren ein.
853
854 \begin{figure}
855   \begin{center}
856     \input{images/16-ec-1277186619.tex}
857   \end{center}
858   \caption{{\tt images/16-ec-1277186619.tex}: Sortiernetzwerk mit 16~Leitungen
859     und 68~Komparatoren in 10~Schichten. Das Netzwerk wurde von dem
860     Algorithmus \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
861     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
862   \label{fig:16-ec-1277186619}
863 \end{figure}
864
865 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
866 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
867 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
868 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in
869 Abbildung~\ref{fig:16-ec-1277186619} zu sehen.
870
871 \begin{itemize}
872   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
873   \item Wie gut kann man durch wegschneiden werden?
874   \item Wieviele Schnitte ergeben das selbe Netzwerk?
875   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
876 \end{itemize}
877
878 \section{Der evolutionäre Ansatz}
879
880 Um einen evolutionären Algorithmus für Sortiernetzwerke zu entwickeln, werden
881 die vorgestellten Methoden kombiniert.
882
883 \subsection{Bewertungsfunktion}\label{sect:bewertung}
884
885 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
886 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
887 die interessant sind:
888 \begin{itemize}
889   \item Möglichst wenige Komparatoren ("`klein"')
890   \item Möglichst wenige Schichten ("`schnell"')
891 \end{itemize}
892
893 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
894 kleinste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
895 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
896 9~Schichten.
897
898 Eine Gütefunktion, die die beiden Ziele "`klein"' und "`schnell"'
899 berücksichtigen kann, hat die folgende allgemeine Form:
900 \begin{equation}
901   \mathit{Guete}(S) = w_{\mathrm{Basis}}
902                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
903                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
904 \end{equation}
905 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
906 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
907 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
908 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
909 jegliche Ergebnisse sind dann rein zufälliger Natur.
910
911 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
912 genommen werden. Ist er groß, wird der relative Unterschied der Güten
913 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
914 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
915 klein, in Abhängigkeit von den anderen beiden Parametern sind auch negative
916 Werte möglich, werden die relativen Unterschiede groß. Dadurch wird die {\em
917 Exploitation}, das Finden lokaler Optima, bevorzugt.
918
919 \subsection{Selektion}
920
921 ...
922
923 \subsection{Rekombination}
924
925 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
926 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
927 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
928 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
929 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
930 Anschließend entfernen wir zufällig $n$~Leitungen wie in
931 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
932
933 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
934 erhält.
935
936 \subsection{Mutation}
937
938 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
939 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
940 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
941 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
942 Eigenschaft zerstören.
943
944 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
945 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
946 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
947 Ausprobieren aller $2^n$~Bitmuster.
948
949 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
950 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
951 Population überprüft das Programm die Notwendigkeit jedes einzelnen
952 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
953 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
954
955 \begin{itemize}
956 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
957 Schichten, kobiniert)
958 \item Rekombination: Merge Anhängen und Leitungen entfernen.
959 \end{itemize}
960
961 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
962 Abbildung~\ref{fig:evolutionary_08}.
963
964 \begin{figure}
965 \begin{center}
966 \input{images/evolutionary-08.tex}
967 \end{center}
968 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
969 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
970 \label{fig:evolutionary_08}
971 \end{figure}
972
973 \begin{figure}
974 \begin{center}
975 \input{images/08-e2-1237993371.tex}
976 \end{center}
977 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
978 \label{fig:08-e2-1237993371}
979 \end{figure}
980
981 \begin{figure}
982 \begin{center}
983 \input{images/09-e2-1237997073.tex}
984 \end{center}
985 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
986 \label{fig:09-e2-1237997073}
987 \end{figure}
988
989 \begin{figure}
990 \begin{center}
991 \input{images/09-e2-1237999719.tex}
992 \end{center}
993 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
994 \label{fig:09-e2-1237999719}
995 \end{figure}
996
997 \begin{figure}
998 \begin{center}
999 \input{images/10-e2-1239014566.tex}
1000 \end{center}
1001 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1002 \label{fig:10-e2-1239014566}
1003 \end{figure}
1004
1005 \subsection{Güte}
1006
1007 \begin{itemize}
1008 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1009 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1010 \end{itemize}
1011
1012 \section{Markov-Kette}
1013
1014 Der evolutionäre Algorithmus aus dem vorherigen Abschnitt verwendete immer
1015 zwei zufällige Sortiernetzwerke („Individuen“) aus einer Population. Da die
1016 beiden „Eltern“ zufällig und unabhängig voneinander ausgewählt werden, kann es
1017 vorkommen, dass das selbe Sortiernetzwerk zweimal verwendet und mit sich
1018 selbst kombiniert wird.
1019
1020 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1021 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1022 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1023 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1024 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1025 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1026
1027 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1028 gerichteten Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1029 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1030 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von $S_0$
1031 ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1032 selbst erzeugen kann.
1033
1034 Der Algorithmus {\sc SN-Markov} legt auf diesem Graph einen zufälligen Weg
1035 (englisch: \textit{random walk}) zurück. Er startet auf einem gegebenen
1036 Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu gelangen
1037 rekombiniert er das aktuelle Sortiernetzwerk mit sich selbst und erhält so
1038 einen zufälligen Nachfolger.
1039
1040 \begin{itemize}
1041   \item $n \leftarrow \mathrm{Input}$
1042   \item \texttt{while} \textit{true}
1043   \begin{itemize}
1044     \item $n \leftarrow \operatorname{recombine} (n, n)$
1045   \end{itemize}
1046 \end{itemize}
1047
1048 \begin{itemize}
1049   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1050   \item Anzahl der erreichbaren Sortiernetzwerke.
1051   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1052     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1053 \end{itemize}
1054
1055 \begin{figure}
1056   \begin{center}
1057   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16.pdf}
1058   \end{center}
1059   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen), die von {\sc SN-Markov} durchlaufen wurden.}
1060   \label{fig:markov-comparators-16}
1061 \end{figure}
1062
1063 %\input{shmoo-aequivalenz.tex}
1064
1065 \section{Optimierung der Schnitte}
1066
1067 \todo{In den Abschnitt "`Leitungen entfernen"' einbauen.}
1068
1069 \begin{figure}
1070 \begin{center}
1071 \input{images/32-ec-1277190372.tex}
1072 \end{center}
1073 \caption{{\tt images/32-ec-1277190372.tex}: Sortiernetzwerk mit 32~Leitungen
1074   und 206~Komparatoren in 15~Schichten. Das Netzwerk wurde von dem Algorithmus
1075   \textsc{SN-Evolution-Cut} aus dem Bitonic-Mergesort-Netzwerk $BS(64)$ durch
1076   32~Schnitte erzeugt.}
1077 \label{fig:32-ec-1277190372}
1078 \end{figure}
1079
1080 Abbildung~\ref{fig:32-ec-1277190372} zeigt ein 32-Sortiernetzwerk, dass vom
1081 \textsc{SN-Evolution-Cut}-Algorithmus aus dem $BS(64)$-Netzwerk erzeugt wurde.
1082 Es besteht aus 206~Komparatoren in 15~Schichten -- 34~Komparatoren weniger als
1083 $BS(32)$ und zwei Komparatoren weniger als das Netzwerk, das nach Mühlenthaler
1084 und Wankas Methode konstruiert wird. Die Anzahl der Schichten ist bei allen
1085 Netzwerken gleich.
1086
1087 \textbf{TODO:} $BS(128) \rightarrow n=64$: 584~Komparatoren in 21~Schichten
1088 möglich (nach ca. 600k Iterationen). Moritz und Rolf: $672-80=592$
1089 Komparatoren; $BS(64)$: 672~Komparatoren.
1090
1091 Schnitt-Sequenz:
1092 MIN( 92)
1093 MAX( 80)
1094 MIN(100)
1095 MAX( 54)
1096 MAX(102)
1097 MAX( 53)
1098 MAX(105)
1099 MAX(  6)
1100 MAX( 99)
1101 MAX( 79)
1102 MAX( 26)
1103 MIN(111)
1104 MAX( 12)
1105 MIN( 22)
1106 MAX( 61)
1107 MAX( 72)
1108 MAX( 68)
1109 MIN( 80)
1110 MAX( 80)
1111 MAX( 99)
1112 MAX(105)
1113 MAX(  0)
1114 MIN(  8)
1115 MAX( 40)
1116 MAX( 74)
1117 MAX( 40)
1118 MAX( 40)
1119 MIN( 56)
1120 MAX( 27)
1121 MAX( 13)
1122 MAX(  1)
1123 MAX( 81)
1124 MAX( 17)
1125 MAX(  4)
1126 MIN( 36)
1127 MIN( 22)
1128 MAX( 13)
1129 MIN( 72)
1130 MAX( 24)
1131 MAX(  5)
1132 MIN( 10)
1133 MAX( 59)
1134 MIN( 37)
1135 MAX( 65)
1136 MAX( 46)
1137 MAX( 73)
1138 MAX( 58)
1139 MAX( 29)
1140 MAX( 65)
1141 MIN( 23)
1142 MAX( 56)
1143 MAX( 11)
1144 MIN( 75)
1145 MIN( 51)
1146 MIN( 46)
1147 MIN( 34)
1148 MAX( 32)
1149 MAX(  6)
1150 MAX( 37)
1151 MIN(  4)
1152 MIN( 28)
1153 MIN( 20)
1154 MAX( 33)
1155 MAX( 34)
1156
1157 % images/32-ec-1277190372.tex
1158
1159 \section{Empirische Beobachtungen}
1160
1161 \begin{itemize}
1162 \item So schnell konvergiert der Algorithmus.
1163 \item $\ldots$
1164 \end{itemize}
1165
1166 \section{Ausblick}
1167
1168 Das würde mir noch einfallen$\ldots$
1169
1170 %\bibliography{references}
1171 %\bibliographystyle{plain}
1172
1173 %\listoffigures
1174
1175 \end{document}
1176
1177 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :