21ff5e0377a580aa181acfed54aca62f5b12f214
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{edge minimum} = [edge,color=blue!20]
56 \tikzstyle{edge maximum} = [edge,color=red!20]
57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
63 \tikzstyle{comp active minimum} = [comp]
64 \tikzstyle{comp active maximum} = [comp]
65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
69
70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
74
75 \maketitle
76 \begin{abstract}
77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
84 das hinbekomme bzw. Recht behalte.}
85 \end{abstract}
86 \newpage
87
88 \tableofcontents
89
90 \newpage
91 \section{Motivation und Einleitung}
92
93 \subsection{Motivation}\label{sect:motivation}
94
95 \begin{itemize}
96 \item Sortiernetzwerke sind toll, weil $\ldots$
97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
100 \end{itemize}
101
102 \subsection{Einleitung}\label{sect:einleitung}
103
104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
105
106 {\em Komparatoren} sind die Bausteine, die {\em Sortiernetzwerken} zugrunde
107 liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten können.
108 Ausserdem besitzt ein {\em Komparator} zwei Ausgänge, die im Gegensatz zu den
109 Eingängen unterscheidbar sind: Die grö"sere der beiden Zahlen wird immer auf
110 dem einen, die kleinere der beiden Zahlen immer auf dem anderen Ausgang
111 ausgegeben.
112
113 Wenn man nun mehrere {\em Komparatoren} miteinander kombiniert, also die
114 Ausgänge von Komparatoren mit dem Eingängen anderer Komparatoren verbindet,
115 erhält man ein {\em Komparatornetzwerk}.
116
117 \begin{figure}
118 \begin{center}
119 \input{images/einfaches_komparatornetzwerk.tex}
120 \end{center}
121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
122 aus 5~Komparatoren.}
123 \label{fig:einfaches_komparatornetzwerk}
124 \end{figure}
125
126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
127 Komparatornetzwerk aus fünf Komparatoren in der üblichen Darstellungsweise:
128 Die horizontalen Linien stellen Leitungen von den Eingängen auf der linken
129 Seite zu den Ausgängen auf er rechten Seite dar. Die vertikalen Pfeile
130 symbolisieren die Komparatoren, die die Werte "`auf den Leitungen"'
131 vergleichen und ggf. vertauschen. Nach einem Komparator befindet sich die
132 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
133 befindet sich auf der Leitung auf der der Pfeil seinen Ursprung hat.
134
135 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
136 gleichzeitig angewandt werden. Das Beispiel in
137 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
138 vergleicht in einem ersten Schritt die zwei oberen und die zwei unteren
139 Leitungen gleichzeitig. Eine Gruppe von Komparatoren, die gleichzeitig
140 angewendet werden können, nennt man eine \emph{Schicht} des
141 Komparatornetwerks. Die \emph{Verzögerung} eines Komparatornetzwerks ist
142 gleichbedeutend mit der Anzahl der Schichten, in die sich die Komparatoren
143 mindestens gruppieren lassen, da sie die Anzahl der benötigten parallelen
144 Schritte darstellt.
145
146 Komparatornetzwerke, die für jede beliebige Eingabepermutation eine
147 Ausgabe erzeugen, die der Sortierung der Eingabe entspricht, heißen 
148 {\em Sortiernetzwerke}. Das in
149 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
150 ist kein Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ würde zur Ausgabe
151 ${(2, 1, 3, 4)}$ führen -- die bestehenden Sortierung wird also sogar
152 zerstört.
153
154 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft
155 {\em nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich.
156 Dieses Gegenbeispiel zu finden ist allerdings aufwendig.
157
158 \todo{Wie findet man die Gegenbeispiele? Die {\em Entscheidung}, ob ein
159 Netzwerk sortiert, ist doch NP-vollständig, also müsste doch das Finden eines
160 Gegenbeispiels im Allgemeinen auch exponentialle Laufzeit haben..?}
161 \todo{Wenn die {\em Entscheidung}, ob ein Netzwerk sortiert, NP-vollständig
162 ist, müsse man dann nicht einen Zeugen für die Sortiereigenschaft angeben
163 können?}
164
165 \todo{$0-1$-Prinzip}
166
167 Um zu überprüfen, ob ein gegebenes Komparatornetzwerk die Sortiereigenschaft
168 besetzt, müssen nicht alle $n!$ Permutationen von $n$~unterschiedlichen Zahlen
169 ausprobieren. Stattdessen reicht es zu überprüfen, dass das Netzwerk alle
170 $2^n$~0-1-Folgen sortiert.
171
172 Sortiernetzwerke:
173 \begin{itemize}
174 \item Ein Komparator-Netzwerk ist $\ldots$
175 \item Ein Komparator-Netzwerk ist ein Sortiernetzwerk, wenn $\ldots$
176 \item Die Frage nach der Sortiereigenschaft ist NP-vollständig.
177 \end{itemize}
178
179 \subsubsection{Evolutionäre Algorithmen}
180
181 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
182 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
183 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
184 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
185 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
186 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
187 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
188 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
189 praktikablen Zeitkonstanten gefunden werden.
190
191 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
192 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
193 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
194 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
195 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
196 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
197
198 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
199 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
200 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
201 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
202 als {\em Individuum} bezeichnet.
203
204 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
205 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
206 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
207 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
208 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
209 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
210 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
211 werden bessere Lösungen bevorzugt. Zur Bewertung die die sogenannte {\em
212 Gütefunktion}.
213
214 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
215 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
216 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
217 es oft einfach ist {\em irgendeine} Lösung anzugeben. Zum anderen muss eine
218 Methode für die Rekombination existieren. Das insbesondere dann problematisch
219 wenn {\em Nebenbedingungen} eingehalten werden müssen.
220
221 \begin{itemize}
222 \item Unter einem "`Evolutionären Algorithmus"' versteht man $\ldots$
223 \item Da die Sortiereigenschaft zu überprüfen NP-schwer ist, ist die
224 Mutation \textit{(vermutlich)} nicht (effizient) möglich.
225 \end{itemize}
226
227 \newpage
228 \section{Bekannte konstruktive Sortiernetzwerke}
229
230 Übersicht über bekannte konstruktive Sortiernetzwerke.
231
232 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
233 \label{sect:odd_even_transpositionsort}
234
235 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
236 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
237 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
238 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
239 ${n = 8}$ Leitungen.
240
241 \begin{figure}
242   \begin{center}
243     \input{images/oe-transposition-8.tex}
244   \end{center}
245   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
246   \label{fig:odd-even-transposition-08}
247 \end{figure}
248
249 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
250 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
251 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
252 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
253 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
254 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
255
256 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
257 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
258 Herausschneiden einer Leitung reduziert. In
259 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
260 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
261 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
262
263 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
264 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
265 Komparatoren anordnen lassen, effizient. Es benötigt
266 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
267 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
268 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
269 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
270
271 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
272 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
273 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
274 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
275 Algorithmen.
276
277 \subsection{Das bitone Mergesort-Netzwerk}
278
279 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
280 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
281 veröffentlicht wurde. Es ist deutlich effizienter als das
282 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
283 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
284 Schichten.
285
286 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
287 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
288 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
289 verleiht dem Sortiernetzwerk seinen Namen.
290
291 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
292 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
293 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
294
295 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
296
297 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
298 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
299 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
300 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
301 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
302 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
303 entstehen können. Die wichtigsten Varianten für das \emph{bitone
304 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
305 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
306 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
307 ist wichtig zu beachten, dass das letzte Element nicht größer
308 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
309 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
310 darf.
311
312 \begin{figure}
313   \centering
314   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
315   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
316   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
317   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
318   \caption{Beispiele bitoner Folgen.}
319   \label{fig:beispiel-biton}
320 \end{figure}
321
322 \begin{figure}
323   \centering
324   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
325   \qquad
326   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
327   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
328   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
329   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
330   resultierenden Teilfolgen sind wiederum biton.}
331   \label{fig:bitonic-merge-schema}
332 \end{figure}
333
334 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
335 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
336 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
337 sortiert, die Folge $V$ sei absteigend sortiert:
338 \begin{eqnarray}
339  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
340  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
341 \end{eqnarray}
342 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
343 Positionen verglichen und ggf. vertauscht:
344 \begin{equation}
345 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
346 \end{equation}
347 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
348 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
349 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
350 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
351 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
352 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
353 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
354 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
355 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
356 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
357 zeigt die Situationen vor und nach diesem Schritt des Mischers.
358
359 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
360 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
361 mithilfe des bitonen Mischers, mit zwei Instanzen von
362 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
363 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
364 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
365 definiert ist.
366
367 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
368 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
369 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
370 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
371 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
372 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
373 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
374
375 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
376 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
377 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
378 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
379 besteht, die in $\log(n)$~Schichten angeordnet werden können.
380
381 \subsubsection{Das bitone Mergesort-Netzwerk}
382
383 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
384 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
385 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
386 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
387 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
388 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
389 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
390 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
391 $\operatorname{BS}(2)$ identisch.
392
393 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
394 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
395 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
396 alle Komparatoren in die gleiche Richtung zeigen.
397
398 \begin{figure}
399   \begin{center}
400   \input{images/batcher-8.tex}
401   \end{center}
402   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
403   für acht Eingänge. Markiert sind die beiden Instanzen von
404   $\operatorname{BS}(4)$ (rot), die beiden bitonen
405   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
406   rekursiven Schritt hinzugefügt wurden (grün).}
407   \label{fig:bitonic-08}
408 \end{figure}
409
410 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
411 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
412 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
413 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
414 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
415 grün hinterlegt.
416
417 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
418 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
419 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
420 Schichten angeordnet sind.
421
422 %\begin{figure}
423 %\begin{center}
424 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
425 %\end{center}
426 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
427 %$S(n/2)$ und dem Mischer $M(n)$.}
428 %\label{fig:bms_rekursiver_aufbau}
429 %\end{figure}
430
431 \subsection{Das Odd-Even-Mergesort-Netzwerk}
432
433 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
434 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
435 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
436 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
437 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
438 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
439 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
440 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
441
442 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
443
444 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
445 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
446 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
447 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
448 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
449 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
450 Umständen mehr Schichten als der \emph{bitone Mischer}.\footnote{Knuth,
451 “Bitonic Sorting”, Seite~230}
452
453 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
454 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
455 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
456 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
457 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
458 \begin{equation}
459 w_i = \left\{ \begin{array}{ll}
460         u_i,     & i < n \\
461         v_{i-n}, & i \geqq n
462       \end{array} \right.,
463       \quad 0 \leqq i < N
464 \end{equation}
465
466 \begin{figure}
467   \begin{center}
468   \input{images/oe-merge.tex}
469   \end{center}
470   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
471   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
472   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
473   \label{fig:oe-merge}
474 \end{figure}
475
476 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
477 geraden Indizes und je eine Liste der ungeraden Indizes.
478 \begin{eqnarray}
479   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
480   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
481   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
482   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
483 \end{eqnarray}
484
485 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
486 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
487 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
488 Ausgang der Mischer die Folgen
489 \begin{eqnarray}
490   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
491   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
492 \end{eqnarray}
493 ergeben.
494
495 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
496 hinzugefügt,
497 \begin{equation}
498   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
499 \end{equation}
500 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
501 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
502
503 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
504 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
505 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
506 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
507 Aufbau lauten:
508 \begin{itemize}
509   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
510   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
511   einzelnen Komparator.
512 \end{itemize}
513
514 Dass die resultierende Folge sortiert ist, lässt sich mit dem
515 {\em 0-1-Prinzip} zeigen:
516 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
517 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
518 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
519 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
520 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
521 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
522 \begin{eqnarray}
523   \left|W_{\textrm{gerade}}\right|_0
524   &=& \left|U_{\textrm{gerade}}\right|_0
525     + \left|V_{\textrm{gerade}}\right|_0
526    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
527    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
528   \left|W_{\textrm{ungerade}}\right|_0
529   &=& \left|U_{\textrm{ungerade}}\right|_0
530     + \left|V_{\textrm{ungerade}}\right|_0
531    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
532    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
533 \end{eqnarray}
534 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
535 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
536 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
537 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
538 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
539 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
540 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
541 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
542
543 \begin{figure}
544   \centering
545   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
546   \qquad
547   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
548   \qquad
549   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
550   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
551   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
552   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
553   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
554   sortiert ist.}
555   \label{fig:oe-post-recursive}
556 \end{figure}
557
558 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
559 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
560 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
561 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
562 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
563
564 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
565 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
566 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
567 \begin{displaymath}
568   K(n,m) = \left\{ \begin{array}{ll}
569     nm, & \mathrm{falls} \quad nm \leqq 1 \\
570     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
571     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
572     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
573   \end{array} \right.
574 \end{displaymath}
575 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
576 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
577 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
578
579 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
580 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
581 Rekursionsschritt der OEM-Konstruktion fügt
582 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
583 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
584 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
585 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
586 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
587 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
588 \begin{displaymath}
589   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
590 \end{displaymath}
591 Komparatoren eingespart. Damit ergibt sich
592 \begin{displaymath}
593   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
594 \end{displaymath}
595 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
596 benötigt werden.
597
598 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
599
600 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
601 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
602 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
603 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
604 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
605 $\operatorname{OES}(n)$ aus
606 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
607 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
608 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
609 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
610 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
611 Komparatornetzwerke definiert sind.
612
613 \begin{figure}
614   \begin{center}
615   \input{images/oe-mergesort-8.tex}
616   \end{center}
617   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
618   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
619   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
620   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
621   Komparatoren zwischen benachbarten Leitungen (grün).}
622   \label{fig:odd-even-mergesort-08}
623 \end{figure}
624
625 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
626 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
627 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
628 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
629 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
630 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
631
632 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
633 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
634 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
635 \begin{displaymath}
636   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
637        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
638        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
639 \end{displaymath}
640 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
641 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
642 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
643
644 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
645 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
646 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
647 \begin{displaymath}
648   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
649 \end{displaymath}
650 gilt.
651
652 % gnuplot:
653 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
654 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
655 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
656
657 %\begin{itemize}
658 %\item Pairwise sorting-network
659 %\end{itemize}
660
661 \newpage
662 \section{Transformation von Sortiernetzwerken}
663
664 \subsection{Komprimieren}
665
666 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
667
668 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
669 gleichzeitig ausgewertet werden, wie bereits in
670 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
671 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
672 von \emph{Schichten} verstanden.
673
674 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
675 Komparatornetzwerken interessant. \dots
676
677 \subsection{Normalisieren}
678
679 \begin{figure}
680   \centering
681   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
682   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
683   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
684   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
685   intuitiven Konstruktion und die normalisierte Variante.}
686   \label{fig:beispiel_normalisieren}
687 \end{figure}
688
689 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
690 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
691 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
692 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
693 einen Algorithmus an.
694
695 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
696 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
697 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
698 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
699 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
700 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
701 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
702 Definition.
703
704 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
705 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
706 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
707 und das Trichtermuster zu sehen.
708
709 \subsection{Zwei Netzwerke kombinieren}
710
711 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
712 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
713 Sortiernetzwerk zusammenzufassen.
714
715 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
716 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
717 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
718 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
719 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
720 und Weise rekursiv aufgebaut.
721
722 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
723 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
724 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
725 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
726 zusammenfügen.
727
728 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
729 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
730 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
731 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
732 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
733 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
734
735 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
736 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
737 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
738 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
739 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
740 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
741 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
742 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
743 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
744 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
745 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
746 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
747 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
748 6~Komparatoren weniger.
749
750 % 9   9
751 % 9  18
752 % 9  27
753 % 9  36
754 % 9  45
755 % 8  53
756 % 8  61
757 % 7  68
758 % 7  75
759 % 6  81
760 % 5  86
761
762 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
763 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
764 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
765 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
766 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
767 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
768 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
769 nur mit exponentiellem Aufwand möglich ist.
770
771 %\begin{itemize}
772 %\item Mit dem Bitonic-Merge
773 %\item Mit dem Odd-Even-Merge
774 %\item Nach dem Pairwise sorting-network Schema.
775 %\end{itemize}
776
777 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
778
779 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
780 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
781 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
782 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
783 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
784 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
785
786 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
787 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
788 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
789 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
790 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
791 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
792 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
793 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
794 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
795 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
796 das {\em Odd-Even-Transpositionsort-Netzwerk}.
797
798 \begin{figure}
799   \centering
800   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
801   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
802   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
803   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
804   \caption{Eine Leitung wird aus dem
805   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
806   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
807   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
808   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
809   Pfad herausgetrennt werden. In der letzten Abbildung ist
810   $\operatorname{OET}(7)$ markiert.}
811   \label{fig:oe-transposition-cut}
812 \end{figure}
813
814 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
815 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
816 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
817 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
818 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
819 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
820 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
821 auf die keine Komparatoren mehr berührt
822 (Abbildung~\ref{fig:oe-transposition-cut1}).
823
824 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
825 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
826 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
827 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
828 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
829 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
830 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
831 mit $(n-1)$~Elementen darstellen.
832
833 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
834 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
835 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
836 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
837 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
838
839 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
840 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
841 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
842 Darstellung ergibt. Ausserdem ist das
843 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
844 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
845 Ausgabe und kann entfernt werden.
846
847 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
848 \label{sect:anzahl_schnittmuster}
849
850 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
851 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
852 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können wir auf diese Art und
853 Weise einen Sortiernetzwerk mit $2n$~Eingängen wieder auf ein Sortiernetzwerk
854 mit $n$~Eingängen reduzieren. Das Anwenden mehrerer Minimum- und
855 Maximum-Schnitte bezeichnen wir als \emph{Schnittmuster}.
856
857 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
858 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
859 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
860
861 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
862 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
863 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
864 ein $n$-Sortiernetzwerk auf ein $m$-Sortiernetzwerk zu reduzieren, ergeben
865 sich insgesamt
866 \begin{equation}\label{eqn:anzahl_schnittmuster}
867   \prod_{i=n}^{m+1} 2i = 2^{n-m} \frac{n!}{m!}
868   \quad (n > m)
869 \end{equation}
870 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
871 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
872 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
873 führen beide Reihenfolgen zum selben Ergebnis.
874
875 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass
876 es möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise
877 Maximum vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster
878 reduziert, die Menge der so erzeugbaren Sortiernetzwerke bleibt aber
879 unverändert. Die Anzahl der möglichen Schnittmuster setzt sich zusammen aus
880 der Anzahl von Möglichkeiten, $n-m$~Leitungen aus $n$ Leitungen auszuwählen,
881 und die möglichen Minimum-~/ Maximum-Muster. Damit ergibt sich folgende
882 Formel für die Anzahl der Schnittmuster:
883 \begin{displaymath}
884   2^{n-m} \cdot \left( \begin{array}{c} n \\ n-m \end{array} \right)
885   = 2^{n-m} \cdot \frac{n!}{(n-m)! m!}
886   = 2^{n-m} \cdot \frac{n!}{m!} \cdot \frac{1}{(n-m)!}
887   \quad (n > m)
888 \end{displaymath}
889
890 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
891 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
892 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
893 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
894 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
895 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
896
897 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
898 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
899 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
900 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
901 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
902 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
903 Werte unterscheiden.
904
905 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
906 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
907 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
908 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
909 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
910 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
911 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
912 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
913
914 \begin{figure}
915   \begin{center}
916     \includegraphics[viewport=0 0 360 216,width=15cm]{images/count-cuts-16.pdf}
917   \end{center}
918   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
919   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
920   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
921   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
922   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
923   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
924   \label{fig:count-cuts-16}
925 \end{figure}
926
927 Um die Anzahl der \emph{unterschiedlichen} Schnittmuster abschätzen zu können,
928 wurden je eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
929 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
930 angewandt. Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
931 \emph{unterschiedlichen} Sortiernetzwerke gegen die Anzahl der zufälligen
932 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
933 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
934 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
935 nahe ist.
936
937 Die Anzahl der 8-Schnittmuster ist entsprechend der
938 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
939 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
940 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
941 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
942 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
943 Iterationen die Anzahl der unterschiedlichen Netzwerke noch wachsen lässt. Die
944 Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
945 Annahme, dass Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
946 vernachlässigbar klein ist.
947
948 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
949 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar. Um
950 die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu können,
951 kann man sich einer stochastischen Methode bedienen, der sogenannten
952 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
953 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
954 zufällig erzeugt, und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
955 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in $S$
956 enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
957 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
958 unterschiedlichen Schnittmuster abschätzen.
959
960 \begin{figure}
961   \begin{center}
962     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
963   \end{center}
964   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
965   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
966   $\operatorname{BS}(32)$.}
967   \label{fig:collisions-10000-1000000-32}
968 \end{figure}
969
970 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
971 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
972 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
973 jedem Sortiernetzwerk wurden zunächst eine Menge von 10.000
974 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
975 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
976 die identisch zu einem in der Menge enthalten Schnittmuster sind, berechnet.
977 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
978 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
979 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
980 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
981
982 \begin{figure}
983   \begin{center}
984     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
985   \end{center}
986   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
987   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
988   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
989   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
990   unterschiedlichen Schnittmustern.}
991   \label{fig:collisions-100000-1000000-32-ps}
992 \end{figure}
993
994 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
995 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
996 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
997 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
998 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
999 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1000 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1001 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1002 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1003 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1004 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1005 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1006 Schnittmuster gefunden, die ein Sortiernetzwerk aus dieser Menge erzeugen.
1007 Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$ unterschiedlichen
1008 Schnittmustern -- zwei Zehnerpotenzen mehr als bei den vorherigen
1009 Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als die Anzahl
1010 der \emph{möglichen} Schnittmuster.
1011
1012 \newpage
1013 \section{Der \textsc{SN-Evolution}-Algorithmus}
1014
1015 Um einen evolutionären Algorithmus für Sortiernetzwerke zu entwickeln, werden
1016 die vorgestellten Methoden kombiniert.
1017
1018 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1019
1020 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1021 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1022 die interessant sind:
1023 \begin{itemize}
1024   \item Möglichst wenige Komparatoren ("`klein"')
1025   \item Möglichst wenige Schichten ("`schnell"')
1026 \end{itemize}
1027
1028 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1029 kleinste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
1030 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
1031 9~Schichten.
1032
1033 Eine Gütefunktion, die die beiden Ziele "`klein"' und "`schnell"'
1034 berücksichtigen kann, hat die folgende allgemeine Form:
1035 \begin{equation}
1036   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1037                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1038                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1039 \end{equation}
1040 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1041 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1042 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1043 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1044 jegliche Ergebnisse sind dann rein zufälliger Natur.
1045
1046 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1047 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1048 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1049 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1050 klein, in Abhängigkeit von den anderen beiden Parametern sind auch negative
1051 Werte möglich, werden die relativen Unterschiede groß. Dadurch wird die {\em
1052 Exploitation}, das Finden lokaler Optima, bevorzugt.
1053
1054 \subsection{Selektion}
1055
1056 ...
1057
1058 \subsection{Rekombination}
1059
1060 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1061 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1062 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1063 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1064 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1065 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1066 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1067
1068 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1069 erhält.
1070
1071 \subsection{Mutation}
1072
1073 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1074 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1075 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1076 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1077 Eigenschaft zerstören.
1078
1079 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1080 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1081 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1082 Ausprobieren aller $2^n$~Bitmuster.
1083
1084 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1085 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1086 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1087 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1088 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1089
1090 \begin{itemize}
1091 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1092 Schichten, kobiniert)
1093 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1094 \end{itemize}
1095
1096 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1097 Abbildung~\ref{fig:evolutionary_08}.
1098
1099 \begin{figure}
1100 \begin{center}
1101 \input{images/evolutionary-08.tex}
1102 \end{center}
1103 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1104 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1105 \label{fig:evolutionary_08}
1106 \end{figure}
1107
1108 \begin{figure}
1109 \begin{center}
1110 \input{images/08-e2-1237993371.tex}
1111 \end{center}
1112 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1113 \label{fig:08-e2-1237993371}
1114 \end{figure}
1115
1116 \begin{figure}
1117 \begin{center}
1118 \input{images/09-e2-1237997073.tex}
1119 \end{center}
1120 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1121 \label{fig:09-e2-1237997073}
1122 \end{figure}
1123
1124 \begin{figure}
1125 \begin{center}
1126 \input{images/09-e2-1237999719.tex}
1127 \end{center}
1128 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1129 \label{fig:09-e2-1237999719}
1130 \end{figure}
1131
1132 \begin{figure}
1133 \begin{center}
1134 \input{images/10-e2-1239014566.tex}
1135 \end{center}
1136 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1137 \label{fig:10-e2-1239014566}
1138 \end{figure}
1139
1140 \subsection{Güte}
1141
1142 \begin{itemize}
1143 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1144 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1145 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1146 \end{itemize}
1147
1148 %\input{shmoo-aequivalenz.tex}
1149
1150 \newpage
1151 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1152 \label{sect:sn-evolution-cut}
1153
1154 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1155 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1156 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1157 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1158 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1159 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1160 gute Schnittmuster gesucht.
1161
1162 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1163 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1164 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1165 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1166 $0 \leqq r \leqq c$.
1167
1168 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1169 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1170 Schnitt-Richtung.
1171
1172 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1173
1174 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1175 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1176 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1177 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1178 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1179 werden, Komparatoren ein.
1180
1181 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1182 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1183 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1184 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1185 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1186 Komparatoren ein.
1187
1188 \begin{figure}
1189   \begin{center}
1190     \input{images/16-ec-from-bs32.tex}
1191   \end{center}
1192   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1193     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1194     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1195     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1196   \label{fig:16-ec-from-bs32}
1197 \end{figure}
1198
1199 \begin{figure}
1200   \begin{center}
1201     \input{images/16-ec-from-bs32-normalized.tex}
1202   \end{center}
1203   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1204     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1205     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1206     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1207   \label{fig:16-ec-from-bs32-normalized}
1208 \end{figure}
1209
1210 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1211 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1212 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1213 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1214 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1215 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1216 und das
1217 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1218 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1219 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1220 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1221 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1222 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1223 Netzwerks scheinen rein zufällig zu sein.
1224
1225 \begin{figure}
1226   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1227   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1228   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1229   % 63:MAX
1230   \begin{center}
1231     \input{images/32-ec-from-bs64.tex}
1232   \end{center}
1233   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1234     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1235     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1236     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1237     Schnittmuster ist
1238     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1239     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1240     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1241   \label{fig:32-ec-from-bs64}
1242 \end{figure}
1243
1244 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1245 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1246 konstruiert haben, kann demnach auch erreicht werden, wenn
1247 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1248 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1249 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1250 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1251 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1252 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1253 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1254 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1255 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1256 Verzögerung dieser Sortiernetzwerke gleich ist.
1257
1258 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1259 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1260 gute Schnittmuster anzugeben.
1261
1262 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1263 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1264 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1265 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1266 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1267 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1268 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1269 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1270 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1271
1272 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1273 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1274 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1275 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1276 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1277 $\operatorname{OET}(n-m)$-Netzwerk. 
1278
1279 \begin{figure}
1280   \begin{center}
1281     \input{images/16-ec-from-ps32.tex}
1282   \end{center}
1283   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1284     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1285     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1286     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1287   \label{fig:16-ec-from-ps32}
1288 \end{figure}
1289
1290 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1291
1292 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1293 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1294 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1295 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1296 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1297 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1298 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1299 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1300
1301 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1302 einsetzt und auch nicht auf einem Mischer basiert, ist der
1303 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1304 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1305 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1306 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1307 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1308
1309 \begin{displaymath}
1310 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1311   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1312    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1313         ? & \quad \mathrm{sonst}
1314   \end{array} \right.
1315 \end{displaymath}
1316
1317 \begin{figure}
1318   \begin{center}
1319     \input{images/32-pairwise-cut-16-pairwise.tex}
1320   \end{center}
1321   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1322   \label{fig:ps16-from-ps32}
1323 \end{figure}
1324
1325 \begin{figure}
1326   \begin{center}
1327     \input{images/16-pairwise.tex}
1328   \end{center}
1329   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1330   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1331   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1332   \label{fig:16-pairwise}
1333 \end{figure}
1334
1335 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1336 man $\operatorname{OES}(8)$ erhalten.
1337
1338 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1339
1340 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1341
1342 \begin{itemize}
1343   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1344   \item Wie gut kann man durch wegschneiden werden?
1345   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1346   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1347   Netzwerk / Knoten in der Markov-Kette?
1348   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1349 \end{itemize}
1350
1351 \newpage
1352 \section{Der \textsc{SN-Markov}-Algorithmus}
1353
1354 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1355 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1356 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1357 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1358 verwendet und mit sich selbst kombiniert wird.
1359
1360 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1361 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1362 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1363 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1364 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1365 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1366
1367 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1368 gerichteten Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1369 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1370 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von $S_0$
1371 ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1372 selbst erzeugen kann.
1373
1374 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1375 (unterschiedlichen) Schnittmuster und damit die Anzahl der Nachfolger sehr
1376 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1377 zu
1378 \begin{displaymath}
1379   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1380 \end{displaymath}
1381 Nachfolger.
1382
1383 Der Algorithmus {\sc SN-Markov} legt auf diesem Graph einen zufälligen Weg
1384 (englisch: \textit{random walk}) zurück. Er startet auf einem gegebenen
1385 Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu gelangen
1386 rekombiniert er das aktuelle Sortiernetzwerk mit sich selbst und erhält so
1387 einen zufälligen Nachfolger.
1388
1389 \begin{itemize}
1390   \item $n \leftarrow \mathrm{Input}$
1391   \item \texttt{while} \textit{true}
1392   \begin{itemize}
1393     \item $n \leftarrow \operatorname{recombine} (n, n)$
1394   \end{itemize}
1395 \end{itemize}
1396
1397 \begin{itemize}
1398   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1399   \item Anzahl der erreichbaren Sortiernetzwerke.
1400   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1401     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1402 \end{itemize}
1403
1404 \begin{figure}
1405   \begin{center}
1406   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1407   \end{center}
1408   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1409   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1410   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1411   \label{fig:markov-comparators-12}
1412 \end{figure}
1413
1414 \begin{figure}
1415   \begin{center}
1416   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1417   \end{center}
1418   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1419   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1420   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1421   \label{fig:markov-comparators-14}
1422 \end{figure}
1423
1424 \begin{figure}
1425   \begin{center}
1426   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1427   \end{center}
1428   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1429   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1430   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1431   \label{fig:markov-comparators-16}
1432 \end{figure}
1433
1434 \newpage
1435 \section{Empirische Beobachtungen}
1436
1437 \begin{itemize}
1438 \item So schnell konvergiert der Algorithmus.
1439 \item $\ldots$
1440 \end{itemize}
1441
1442 \newpage
1443 \section{Ausblick}
1444
1445 Das würde mir noch einfallen$\ldots$
1446
1447 \newpage
1448 \bibliography{references}
1449 \bibliographystyle{plain}
1450
1451 %\listoffigures
1452
1453 \end{document}
1454
1455 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :