Viele Tippfehler entfernt.
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newcommand{\oes}[1]{\ensuremath{\operatorname{OES}(#1)}}
40 \newcommand{\bs}[1]{\ensuremath{\operatorname{BS}(#1)}}
41 \newcommand{\ps}[1]{\ensuremath{\operatorname{PS}(#1)}}
42 \newcommand{\oem}[1]{\ensuremath{\operatorname{OEM}(#1)}}
43 \newcommand{\bm}[1]{\ensuremath{\operatorname{BM}(#1)}}
44 \newcommand{\oet}[1]{\ensuremath{\operatorname{OET}(#1)}}
45
46 \newtheorem{definition}{Definition}
47 \newtheorem{satz}{Satz}
48
49 % Zeige Nummern nur bei referenzierten Gleichungen an.
50 \mathtoolsset{showonlyrefs=true}
51
52 \begin{document}
53
54 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
55 \tikzstyle{comp}     = [draw,thick,-]
56 \tikzstyle{compup}   = [draw,thick,->]
57 \tikzstyle{compdown} = [draw,thick,<-]
58 \tikzstyle{edge}     = [draw,thick,-]
59 \tikzstyle{diredge}  = [draw,thick,->]
60 \tikzstyle{prob}     = [font=\tiny]
61
62 \tikzstyle{edge minimum} = [edge,color=blue!20]
63 \tikzstyle{edge maximum} = [edge,color=red!20]
64 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
65 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
66 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
67 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
68 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
69 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
70 \tikzstyle{comp active minimum} = [comp]
71 \tikzstyle{comp active maximum} = [comp]
72 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
73 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
74 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
75 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
76
77 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
78 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
79 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
80 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
81
82 \maketitle
83 \begin{abstract}
84 \todo{Einleitung schreiben.}
85
86 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
87 vorgestellt (Odd-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
88 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
89 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
90 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
91 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
92 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
93 das hin bekomme bzw. Recht behalte.}
94 \end{abstract}
95 \newpage
96
97 \tableofcontents
98
99 \newpage
100 \section{Motivation und Einleitung}
101
102 \subsection{Motivation}\label{sect:motivation}
103
104 \emph{Sortiernetzwerke} sind ein theoretisches Konstrukt, dass auch von
105 Personen ohne Zugang zum Thema beziehungsweise der theoretischen Informatik
106 schnell verstanden werden kann. Eine Einführung wird in
107 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} gegeben. Nichtsdestotrotz ist
108 das Finden von Sortiernetzwerken sowie das Beweisen, dass ein
109 Komparatornetzwerk jede beliebige Eingabe sortiert, im Allgemeinen sehr
110 schwierig und nach heutigem Kenntnisstand nur mit exponentiellem Aufwand zu
111 bewältigen.
112
113 Einfacher ist der Korrektheitsbeweis bei konstruktiven Verfahren, da hier die
114 Konstruktionsvorschrift genutzt werden kann um die Korrektheit für beliebige
115 Eingabegrößen zu beweisen. Im Abschnitt~\ref{sect:konstruktive_netzwerke}
116 geschieht dies beispielsweise für zwei von \emph{Kenneth~E. Batcher} 1968
117 gefundenen Konstruktionsvorschriften.
118
119 Um effiziente und schnelle Sortiernetzwerke zu finden, wurden schon früh
120 Computer und automatische Suchverfahren eingesetzt. Bisherige Ansätze
121 versuchen meist, in der Menge aller Komparatornetzwerke jene zu finden, die
122 die Sortiereigenschaft besitzen und aus wenigen Komparatoren bestehen. Die
123 Eigenschaft, jede Eingabepermutation zu sortieren, ist also ein
124 Optimierungsziel und nicht durch das Vorgehen gewährleistet. Dafür können
125 theoretisch alle Sortiernetzwerke durch diese Algorithmen gefunden werden --
126 genügend Laufzeit vorausgesetzt.
127
128 In dieser Arbeit werden Methoden verwendet, die die Menge der Sortiernetzwerke
129 nie verlassen, dafür aber auch nicht alle existierenden Sortiernetzwerke
130 erzeugen können. So muss für ein gefundenes Komparatornetzwerk nicht mehr
131 nachgewiesen werden, dass es jede beliebige Eingabe sortiert, weil diese
132 Eigenschaft durch das Verfahren sichergestellt ist.
133
134 \subsection{Einleitung}\label{sect:einleitung}
135
136 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
137
138 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
139 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
140 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
141 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
142 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
143 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
144
145 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
146 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
147 erhält man ein {\em Komparatornetzwerk}.
148
149 \begin{figure}
150 \begin{center}
151 \input{images/einfaches_komparatornetzwerk.tex}
152 \end{center}
153 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
154 aus 5~Komparatoren.}
155 \label{fig:einfaches_komparatornetzwerk}
156 \end{figure}
157
158 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
159 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
160 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
161 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
162 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
163 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
164 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichtlichkeit
165 durch schwarze Punkte symbolisiert.
166
167 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
168 das Netzwerk hinein gegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
169 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
170 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
171 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
172
173 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
174 gleichzeitig angewandt werden. Das Beispiel in
175 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
176 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
177 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
178 eine \emph{Schicht} des Komparatornetzwerks. Die \emph{Verzögerung} eines
179 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
180 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
181 benötigten parallelen Schritte darstellt.
182
183 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
184 erzeugen, die der Sortierung der Eingabe entspricht, heißen
185 \emph{Sortiernetzwerke}. Das in
186 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
187 ist \emph{kein} Sortiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
188 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
189 zerstört.
190
191 \begin{figure}
192   \begin{center}
193     \input{images/09-e2-c24-allbut1.tex}
194   \end{center}
195   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
196   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
197   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
198   \label{fig:09-e2-c24-allbut1}
199 \end{figure}
200 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
201 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
202 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
203 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
204 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
205 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
206 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
207 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
208 nicht \emph{effizient} möglich.
209
210 Beispielsweise sortiert das im Rahmen dieser Arbeit entdeckte
211 Komparatornetzwerk in Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880
212 möglichen Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4,
213 8, 6)$ lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
214 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge $(1,
215 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
216
217 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
218 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
219 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
220 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
221 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
222 ist.\footnote{1.307.674.368.000 Permutationen}
223
224 \label{sect:0-1-prinzip}
225 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
226 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
227 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
228 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
229 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
230 in der Ausgabe, die die Sortierbedingung verletzt:
231 \begin{displaymath}
232   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
233 \end{displaymath}
234 Die Eingabe kann mittels
235 \begin{displaymath}
236   \hat{e}_j = \left\{
237     \begin{array}{cl}
238       0 & e_j \leqq a_i \\
239       1 & e_j > a_i
240     \end{array} \right.
241 \end{displaymath}
242 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme vom
243 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
244 Verhalten jedes einzelnen Komparators nicht: Wenn bei der Permutation eine
245 Zahl größer als $a_i$ und eine Zahl kleiner oder gleich $a_i$ verglichen
246 wurden, liegen jetzt entsprechend eine Null und eine Eins an, die genauso
247 vertauscht werden oder nicht, wie das bei der Permutation der Fall war. Liegen
248 zwei Nullen oder zwei Einsen an, entsprechen sie zwei Zahlen kleiner als $a_i$
249 oder zwei Zahlen größer oder gleich $a_i$. Da im Fall der 0-1-Folge zwei
250 gleiche Zahlen am Komparator anliegen, dürfen wir davon ausgehen, dass sich
251 der Komparator so verhält, wie er sich bei der Permutation verhalten hat --
252 ohne das Ergebnis zu beeinflussen. Entsprechend kommen an den Ausgängen $i-1$
253 und $i$ eine Null und eine Eins in der falschen Reihenfolge an. Das steht im
254 Widerspruch zu der Annahme, dass alle 0-1-Folgen sortiert werden.
255
256 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
257 Komplexitätsklasse
258 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
259 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
260 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
261 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
262 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
263 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
264 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
265 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
266 4,3~Milliarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
267 beschäftigen.
268
269 \subsubsection{Evolutionäre Algorithmen}
270
271 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
272 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
273 \textit{NP}, das heißt das keine Verfahren bekannt sind, die das Problem
274 effizient exakt lösbar. Sollte sich herausstellen, dass diese Probleme nicht
275 in der Komplexitätsklasse~\textit{P} liegen, wäre eine Konsequenz, dass es
276 effiziente exakte Algorithmen für diese Probleme nicht geben kann. Falls sich
277 hingegen herausstellt, dass diese Probleme in der
278 Komplexitätsklasse~\textit{P} liegen, wird es mit großer Wahrscheinlichkeit
279 noch einige Zeit dauern, bis auch Algorithmen mit praktikablen Zeitkonstanten
280 gefunden werden.
281
282 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
283 die beziehungsweise eine der {\em optimalen} Lösungen als einzige Ausgabe des
284 Algorithmus zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele
285 dieser Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur.
286 Beispielsweise imitieren die „Ameisenalgorithmen“ das Verhalten von Ameisen
287 auf der Futtersuche, um kurze Rundreisen auf Graphen zu berechnen.
288
289 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
290 ist, bekannte Lösungen zu neuen -- unter Umständen besseren -- Lösungen zu
291 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
292 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem als {\em
293 Individuen} bezeichnet.
294
295 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
296 bestehenden Lösungsmenge, der {\em Population}, werden zufällig Lösungen
297 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
298 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
299 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
300 eingefügt wird. Die verwendeten Wahrscheinlichkeiten, beispielsweise bei der
301 {\em Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
302 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
303 Gütefunktion}.
304
305 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
306 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
307 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
308 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
309 Algorithmen verwenden als einfache, initiale Lösung häufig das
310 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
311 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
312 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
313 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
314
315 Beim Aussuchen von zufälligen Lösungen aus der Population, der
316 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
317 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
318 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
319 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
320 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
321 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
322 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
323 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
324 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
325 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
326 findet er aber in der Regel bessere Lösungen.
327
328 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
329 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
330 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
331 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
332 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
333 zwischen verschiedenen Leitungszahlen stark unterscheiden.
334
335 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
336 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
337 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
338 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
339 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
340 „Ausbrechen“ und finden noch besserer Lösungen.
341
342 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
343 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
344 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
345 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
346 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
347 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
348
349 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
350 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
351 mutieren lediglich Transformationen von Sortiernetzwerken, die die
352 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
353 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
354 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
355
356
357 \begin{figure}
358   \begin{center}
359     \input{images/16-hillis.tex}
360   \end{center}
361   \caption{Das 16-Sortiernetzwerk, das \textit{Hillis} in~\cite{H1992} angibt.
362   Es besteht aus 61~Komparatoren in 11~Schichten.}
363   \label{fig:16-hillis}
364 \end{figure}
365 Evolutionäre Algorithmen wurden bereits mehrfach eingesetzt, um
366 Sortiernetzwerke zu untersuchen. \textit{W.~Daniel Hillis} verwendete
367 \emph{Co-Evolution} um neben Komparatornetzwerken auch „schwierige Eingaben“
368 zu optimieren~\cite{H1992}. Diese \emph{Parasiten} genannten Eingaben wurden
369 daran gemessen, bei wie vielen Komparatornetzwerken sie beweisen konnten, dass
370 sie keine Sortiernetzwerke sind. So mussten bei neuen Individuen~/
371 Komparatornetzwerken nicht alle 0-1-Folgen, sondern nur erfolgreiche
372 Parasiten~/ schwierige Eingaben überprüft werden. Auf diese Art und Weise
373 gelang es \textit{Hillis} ein 16-Sortiernetzwerk mit 61~Komparatoren
374 anzugeben, das in Abbildung~\ref{fig:16-hillis} zu sehen ist.
375
376 \begin{figure}
377   \centering
378   \subfigure{\input{images/13-juille-0.tex}}
379   \subfigure{\input{images/13-juille-1.tex}}
380   \caption{13-Sortiernetzwerke, die von \textit{Hugues Juillé} mithilfe des
381   END-Algorithmus gefunden wurden. Sie bestehen jeweils aus 45~Komparatoren in
382   10~Schichten.}
383   \label{fig:13-juille}
384 \end{figure}
385 \textit{Hugues Juillé} entwickelte ein Verfahren, das er \emph{Evolving
386 Non-Determinism} (END) nannte~\cite{J1995}. Dabei handelt es sich nicht um
387 einen \emph{Evolutionären Algorithmus}, wie sie hier vorgestellt wurden,
388 sondern um eine verteilte, probabilistische Breitensuche, die an die
389 \emph{Strahlsuche} (englisch: \textit{beam search}), ein Verfahren der
390 Künstlichen Intelligenz, angelehnt ist. Die aufwendigste Operation bei diesem
391 Ansatz ist die Bewertungsfunktion, die abschätzt, wie viele Komparatoren zu
392 einem Komparatornetzwerk hinzugefügt werden müssen, um ein Sortiernetzwerk zu
393 erhalten. Mit diesem Ansatz gelang es \textit{Juillé} zwei 13-Sortiernetzwerke
394 anzugeben, die mit 45~Komparatoren effizienter sind als alle bis dahin
395 Bekannten (Abbildung~\ref{fig:13-juille}).
396
397 \newpage
398 \section{Bekannte konstruktive Sortiernetzwerke}
399 \label{sect:konstruktive_netzwerke}
400
401 Übersicht über bekannte konstruktive Sortiernetzwerke.
402
403 \todo{Einleitungssatz}
404
405 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
406 \label{sect:odd_even_transpositionsort}
407
408 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
409 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
410 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
411 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
412 ${n = 8}$ Leitungen.
413
414 \begin{figure}
415   \begin{center}
416     \input{images/oe-transposition-8.tex}
417   \end{center}
418   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
419   \label{fig:odd-even-transposition-08}
420 \end{figure}
421
422 Dass das Odd-Even-Transpositionsort-Netzwerk tatsächlich jede beliebige
423 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
424 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
425 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
426 Odd-Even-Transpositionsort-Netzwerk mit drei Eingängen,
427 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
428
429 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
430 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
431 Herausschneiden einer Leitung reduziert. In
432 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
433 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
434 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
435
436 Das Odd-Even-Transpositionsort-Netzwerk ist weder in Bezug auf die Anzahl der
437 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
438 Komparatoren anordnen lassen, effizient. Es benötigt
439 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
440 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
441 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
442 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
443
444 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
445 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
446 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
447 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
448 Algorithmen.
449
450 \subsection{Das bitone Mergesort-Netzwerk}
451
452 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
453 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
454 veröffentlicht wurde. Es ist deutlich effizienter als das
455 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
456 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
457 Schichten.
458
459 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
460 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
461 \emph{„bitone Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
462 verleiht dem Sortiernetzwerk seinen Namen.
463
464 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
465 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
466 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
467
468 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
469
470 Das \emph{bitone Mergesort}-Netzwerk basiert auf dem sogenannten \emph{bitonen
471 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine
472 beliebige \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine
473 \emph{bitone Folge} ist eine monoton steigende Folge gefolgt von einer monoton
474 absteigenden Folge, oder ein zyklischer Shift davon.
475 Abbildung~\ref{fig:beispiel-biton} zeigt die vier prinzipiellen Möglichkeiten
476 die durch zyklische Shifts entstehen können. Die wichtigsten Varianten für das
477 \emph{bitone Mergesort}-Netzwerk zeigen die
478 Abbildungen~\ref{fig:beispiel-biton-0} und~\ref{fig:beispiel-biton-1}. Sie
479 erhält man, wenn man eine aufsteigend und eine absteigend sortierte Liste
480 aneinanderhängt. Bei den anderen beiden Formen ist wichtig zu beachten, dass
481 das letzte Element nicht größer (Abbildung~\ref{fig:beispiel-biton-2}) bzw.
482 kleiner (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge
483 sein darf.
484
485 \begin{figure}
486   \centering
487   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
488   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
489   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
490   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
491   \caption{Beispiele bitoner Folgen.}
492   \label{fig:beispiel-biton}
493 \end{figure}
494
495 \begin{figure}
496   \centering
497   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
498   \qquad
499   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
500   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
501   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
502   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
503   resultierenden Teilfolgen sind wiederum biton.}
504   \label{fig:bitonic-merge-schema}
505 \end{figure}
506
507 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
508 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
509 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
510 sortiert, die Folge $V$ sei absteigend sortiert:
511 \begin{eqnarray}
512  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
513  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
514 \end{eqnarray}
515 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
516 Positionen verglichen und ggf. vertauscht:
517 \begin{equation}
518 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
519 \end{equation}
520 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
521 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
522 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
523 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
524 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
525 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
526 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
527 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
528 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
529 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
530 zeigt die Situationen vor und nach diesem Schritt des Mischers.
531
532 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
533 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
534 mithilfe des bitonen Mischers, mit zwei Instanzen von
535 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
536 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
537 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
538 definiert ist.
539
540 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
541 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
542 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
543 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
544 Schema des bitonen Mischers für zwei aufsteigend sortierte Folgen. Durch das
545 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
546 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
547
548 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
549 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
550 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
551 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
552 besteht, die in $\log(n)$~Schichten angeordnet werden können.
553
554 \subsubsection{Das bitone Mergesort-Netzwerk}
555
556 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
557 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
558 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
559 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
560 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
561 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
562 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
563 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
564 $\operatorname{BS}(2)$ identisch.
565
566 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
567 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
568 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
569 alle Komparatoren in die gleiche Richtung zeigen.
570
571 \begin{figure}
572   \begin{center}
573   \input{images/batcher-8.tex}
574   \end{center}
575   \caption{\bs{8}, Batchers \emph{bitones Mergesort}-Netzwerk für acht
576   Eingänge. Markiert sind die beiden Instanzen von \bs{4} (rot), die beiden
577   bitonen Mischer~\bm{4} (blau) und die Komparatoren, die im letzten
578   rekursiven Schritt hinzugefügt wurden (grün).}
579   \label{fig:bitonic-08}
580 \end{figure}
581
582 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
583 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
584 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
585 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
586 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
587 grün hinterlegt.
588
589 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
590 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
591 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
592 Schichten angeordnet sind.
593
594 \subsection{Das Odd-Even-Mergesort-Netzwerk}
595
596 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
597 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
598 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
599 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
600 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
601 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
602 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
603 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
604
605 \subsubsection{Der \emph{Odd-Even}-Mischer}\label{sect:der_odd_even_mischer}
606
607 Der \emph{Odd-Even}-Mischer $\operatorname{OEM}(n,m)$ ist ein
608 Komparatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
609 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
610 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
611 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
612 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even}-Mischer unter
613 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
614
615 Der \emph{Odd-Even}-Mischer selbst ist ebenfalls rekursiv aufgebaut: Die
616 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
617 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
618 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
619 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
620 \begin{equation}
621 w_i = \left\{ \begin{array}{ll}
622         u_i,     & i < n \\
623         v_{i-n}, & i \geqq n
624       \end{array} \right.,
625       \quad 0 \leqq i < N
626 \end{equation}
627
628 \begin{figure}
629   \begin{center}
630   \input{images/oe-merge.tex}
631   \end{center}
632   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
633   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
634   aus. Der Effekt wird durch den rekursiven Aufbau noch verstärkt.}
635   \label{fig:oe-merge}
636 \end{figure}
637
638 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
639 geraden Indizes und je eine Liste der ungeraden Indizes.
640 \begin{eqnarray}
641   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
642   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
643   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
644   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
645 \end{eqnarray}
646
647 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
648 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
649 rekursiv von kleineren \emph{Odd-Even}-Mischern zusammengefügt, so dass sich am
650 Ausgang der Mischer die Folgen
651 \begin{eqnarray}
652   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
653   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
654 \end{eqnarray}
655 ergeben.
656
657 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
658 hinzugefügt,
659 \begin{equation}
660   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
661 \end{equation}
662 die die Folge~$W$ sortieren. Den schematischen Aufbau des
663 \emph{Odd-Even}-Mischers zeigt Abbildung~\ref{fig:oe-merge}.
664
665 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
666 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
667 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
668 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
669 Aufbau lauten:
670 \begin{itemize}
671   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
672   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
673   einzelnen Komparator.
674 \end{itemize}
675
676 Dass die resultierende Folge sortiert ist, lässt sich mit dem
677 {\em 0-1-Prinzip} zeigen:
678 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
679 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
680 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
681 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
682 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
683 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
684 \begin{eqnarray}
685   \left|W_{\textrm{gerade}}\right|_0
686   &=& \left|U_{\textrm{gerade}}\right|_0
687     + \left|V_{\textrm{gerade}}\right|_0
688    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
689    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
690   \left|W_{\textrm{ungerade}}\right|_0
691   &=& \left|U_{\textrm{ungerade}}\right|_0
692     + \left|V_{\textrm{ungerade}}\right|_0
693    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
694    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
695 \end{eqnarray}
696 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
697 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
698 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
699 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthält als
700 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
701 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
702 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
703 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
704
705 \begin{figure}
706   \centering
707   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
708   \qquad
709   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
710   \qquad
711   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
712   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
713   kleineren \emph{Odd-Even}-Mischer entstehen können. Ist die Differenz der
714   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
715   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
716   sortiert ist.}
717   \label{fig:oe-post-recursive}
718 \end{figure}
719
720 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
721 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
722 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
723 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
724 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
725
726 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
727 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
728 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
729 \begin{displaymath}
730   K(n,m) = \left\{ \begin{array}{ll}
731     nm, & \mathrm{falls} \quad nm \leqq 1 \\
732     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
733     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
734     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
735   \end{array} \right.
736 \end{displaymath}
737 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
738 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
739 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
740
741 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
742 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
743 Rekursionsschritt der OEM-Konstruktion fügt
744 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
745 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
746 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
747 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
748 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
749 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
750 \begin{displaymath}
751   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
752 \end{displaymath}
753 Komparatoren eingespart. Damit ergibt sich
754 \begin{displaymath}
755   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
756 \end{displaymath}
757 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
758 benötigt werden.
759
760 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
761
762 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
763 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
764 sich selbst und einem abschließenden \emph{Odd-Even}-Mischer. Die
765 effizientesten Sortiernetzwerke in Bezug auf Komparator- und Schichtzahl
766 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
767 $\operatorname{OES}(n)$ aus
768 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
769 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
770 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
771 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
772 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
773 Komparatornetzwerke definiert sind.
774
775 \begin{figure}
776   \begin{center}
777   \input{images/oe-mergesort-8.tex}
778   \end{center}
779   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
780   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
781   \emph{Odd-Even}-Mischer $\operatorname{OEM}(4)$ für gerade und ungerade
782   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
783   Komparatoren zwischen benachbarten Leitungen (grün).}
784   \label{fig:odd-even-mergesort-08}
785 \end{figure}
786
787 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
788 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
789 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
790 \emph{Odd-Even}-Mischer für acht Leitungen dar: Die beiden blauen Blöcke sind
791 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
792 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
793
794 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
795 \emph{Odd-Even-Mergesort-Netz\-werk} verwendet wird, $k(n)$, direkt aus der
796 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
797 \begin{displaymath}
798   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
799        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
800        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
801 \end{displaymath}
802 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
803 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
804 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
805
806 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
807 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
808 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
809 \begin{displaymath}
810   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
811 \end{displaymath}
812 gilt.
813
814 % gnuplot:
815 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
816 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
817 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
818
819 %\begin{itemize}
820 %\item Pairwise sorting-network
821 %\end{itemize}
822
823 \newpage
824 \section{Transformation von Sortiernetzwerken}
825 \label{sect:tranformation}
826
827 \subsection{Komprimieren}
828
829 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
830 gleichzeitig ausgewertet werden, wie bereits in
831 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
832 Transformationen, insbesondere das Entfernen einer Leitung, das in
833 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
834 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
835 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
836 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
837 die jeden Komparator so früh wie möglich ausführt. So entsteht die
838 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
839 unterteilen lässt.
840
841 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
842 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
843 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
844 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
845 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
846 Komprimierung durchgeführt werden.
847
848 \subsection{Normalisieren}
849 \label{sect:normalisieren}
850
851 \begin{figure}
852   \centering
853   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
854   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
855   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
856   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
857   intuitiven Konstruktion und die normalisierte Variante.}
858   \label{fig:beispiel_normalisieren}
859 \end{figure}
860
861 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
862 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
863 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
864 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
865 in~\cite{KNUTH} einen Algorithmus an.
866
867 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
868 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
869 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
870 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
871 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
872 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
873 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
874 Definition.
875
876 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
877 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
878 Richtung. Statt dem typischen „Treppenmuster“ sind abwechselnd das Treppen-
879 und das Trichtermuster zu sehen.
880
881 \subsection{Zwei Netzwerke kombinieren}
882
883 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
884 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
885 Sortiernetzwerk zusammenzufassen.
886
887 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
888 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
889 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
890 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
891 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
892 und Weise rekursiv aufgebaut.
893
894 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
895 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
896 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
897 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
898 zusammenfügen.
899
900 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
901 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
902 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
903 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
904 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
905 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
906
907 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
908 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
909 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
910 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
911 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
912 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
913 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
914 \emph{Odd-Even}-Mischer erhält man ein Sortiernetzwerk mit 18~Eingängen, das
915 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
916 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
917 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
918 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
919 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
920 6~Komparatoren weniger.
921
922 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
923 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
924 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
925 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
926 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
927 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
928 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
929 nur mit exponentiellem Aufwand möglich ist.
930
931 \subsection{Leitungen entfernen}
932 \label{sect:leitungen_entfernen}
933
934 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
935 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
936 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
937 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
938 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
939 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
940
941 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
942 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
943 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
944 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das
945 Maximum durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an
946 einem der „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten
947 Index. Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und
948 welche dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum
949 jeden Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
950 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
951 das {\em Odd-Even-Transpositionsort-Netzwerk}.
952
953 \begin{figure}
954   \centering
955   \subfigure[Auf der Leitung~4 wird $-\infty$ angelegt. Dadurch ist der Pfad
956   durch das Sortiernetzwerk eindeutig festgelegt.]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
957   \subfigure[Komparatoren, die einen Wechsel der Leitungen bewirken, werden
958   durch sich kreuzende Leitungen ersetzt.]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
959   \subfigure[Leitung~4 wurde entfernt. Übrig bleibt ein Sortiernetzwerk mit
960   7~Leitungen.]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
961   \subfigure[Die Leitungen wurden wieder gerade eingezeichnet und die
962   Komparatoren regelmäßig angeordnet. Blau eingezeichnet ist \oet{7}.]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
963   \caption{Eine Leitung wird aus dem
964   \emph{Odd-Even-Transpositionsort}-Netzwerk \oet{8} entfernt: Auf der rot
965   markierten Leitung wird $-\infty$ angelegt. Da der Wert bei jedem Komparator
966   am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die restlichen
967   Werte trotzdem noch richtig sortiert werden müssen, kann dieser Pfad
968   heraus getrennt werden. In der letzten Abbildung ist \oet{7} markiert.}
969   \label{fig:oe-transposition-cut}
970 \end{figure}
971
972 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
973 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
974 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
975 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
976 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
977 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
978 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
979 auf die keine Komparatoren mehr berührt
980 (Abbildung~\ref{fig:oe-transposition-cut1}).
981
982 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
983 Komparatornetzwerk immer noch sortiert werden: Wir haben lediglich die
984 Position des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss
985 die Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum
986 liegt. Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
987 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
988 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
989 mit $(n-1)$~Elementen darstellen.
990
991 Wenn man die Minimum- beziehungsweise Maximum-Leitung entfernt, wie in
992 Abbildung~\ref{fig:oe-transposition-cut2} dargestellt, bleibt das
993 Sortiernetzwerk für $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung
994 ein Minimum oder ein Maximum angenommen wird, bezeichnen wir das eliminieren
995 einer Leitung als \emph{Minimum-Schnitt} beziehungsweise
996 \emph{Maximum-Schnitt}.
997
998 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
999 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
1000 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
1001 Darstellung ergibt. Außerdem ist das
1002 \emph{Odd-Even-Transpositionsort}-Netzwerk für sieben Werte markiert. Der
1003 zusätzliche Komparator vor dem \oet{7} hat keinen Einfluss auf die Ausgabe und
1004 kann entfernt werden.
1005
1006 Durch das Ersetzen von Komparatoren durch gekreuzte Leitungen werden häufig
1007 \emph{Nicht-Standard-Sortiernetzwerke} erzeugt. Im Anschluss an einen
1008 \emph{Schnitt} empfiehlt es sich deshalb, das Sortiernetzwerk zu
1009 \emph{normalisieren}, wie in Abschnitt~\ref{sect:normalisieren} beschrieben.
1010
1011 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
1012 \label{sect:anzahl_schnittmuster}
1013
1014 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
1015 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
1016 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
1017 Weise Sortiernetzwerke mit $2n$~Eingängen auf Sortiernetzwerke mit
1018 $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
1019 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
1020 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
1021 \emph{$k$-Schnittmuster}.
1022
1023 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
1024 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
1025 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
1026
1027 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
1028 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
1029 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
1030 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
1031 ergeben sich insgesamt
1032 \begin{equation}\label{eqn:anzahl_schnittmuster}
1033   \prod_{i=n}^{1+n-k} 2i = 2^k \cdot \frac{n!}{(n-k)!}
1034   \quad (n > m)
1035 \end{equation}
1036 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
1037 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
1038 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
1039 führen beide Reihenfolgen zum selben Ergebnis.
1040
1041 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit~\cite{M2009}, dass es
1042 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
1043 vorzubelegen, ohne die Menge der erreichbaren Sortiernetzwerke einzuschränken.
1044 Dadurch wird die Anzahl der möglichen Schnittmuster reduziert, die Menge der
1045 so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die Anzahl der
1046 möglichen Schnittmuster setzt sich zusammen aus der Anzahl von Möglichkeiten,
1047 $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen Minimum-~/
1048 Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl der möglichen
1049 Schnittmuster:
1050 \begin{displaymath}
1051   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
1052   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
1053   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
1054   \quad (1 \leqq k < n)
1055 \end{displaymath}
1056
1057 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
1058 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
1059 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schnittmuster mit
1060 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
1061 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
1062 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
1063
1064 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
1065 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
1066 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
1067 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
1068 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1069 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1070 Werte unterscheiden.
1071
1072 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1073 Ausgangsmuster abgebildet, weil die Position des Minimums beziehungsweise des
1074 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1075 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1076 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1077 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1078 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1079 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1080
1081 \begin{figure}
1082   \begin{center}
1083     \includegraphics[viewport=0 0 425 262,width=15cm]{images/count-cuts-16.pdf}
1084   \end{center}
1085   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1086   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1087   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1088   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1089   \emph{Odd-Even-Mergesort}-Netzwerk, 4973 für das \emph{bitone
1090   Mergesort}-Netzwerk und 18764 für das \emph{Pairwise-Sorting}-Netzwerk.}
1091   \label{fig:count-cuts-16}
1092 \end{figure}
1093
1094 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1095 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1096 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1097 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1098 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke \oes{16},
1099 \bs{16} und \ps{16} angewandt. Anschließend wurde mithilfe einer Hashtabelle
1100 überprüft, ob das resultierende Sortiernetzwerk schon von einem
1101 \emph{äquivalenten} Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk
1102 noch nicht in der Hashtabelle enthalten war, wurde der Zähler für
1103 unterschiedliche Schnittmuster erhöht und das Sortiernetzwerk eingefügt.
1104
1105 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1106 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1107 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1108 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1109 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1110 nahe ist.
1111
1112 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1113 Formel~\eqref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen
1114 Schnittmuster führen aber nur zu wenigen \emph{unterschiedlichen}
1115 Sortiernetzwerken: 3519 ($\approx 0,1\%$) im Fall des
1116 \emph{Odd-Even-Mergesort}-Netzwerks, 4973 ($\approx 0,15\%$) beim
1117 \emph{bitonen Mergesort}-Netzwerk und 18764 ($\approx 0,57\%$) beim
1118 \emph{Pairwise-Sorting}-Netzwerk. Zwar ist es möglich, dass mehr Iterationen
1119 die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt. Die Graphen
1120 in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der Annahme, dass
1121 die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1122 vernachlässigbar klein ist.
1123
1124 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1125 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1126 Die Hashtabelle würde mehr Arbeitsspeicher benötigen als in derzeitigen
1127 Rechnern vorhanden ist, bevor ein entsprechender Graph den linearen Bereich
1128 für „kleine“ x-Werte verlässt.
1129
1130 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1131 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1132 \emph{Monte-Carlo-Methode}, die \textit{Rolf Wanka} in~\cite{W2006} für
1133 schwierige Zählprobleme vorstellt. Zunächst generiert man eine Menge~$S$ von
1134 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1135 zufällig erzeugt und überprüft, ob sie in der Menge~$S$ enthalten sind. Unter
1136 der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in $S$
1137 enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1138 unterschiedlichen Schnittmuster insgesamt entspricht, kann man die Anzahl der
1139 unterschiedlichen Schnittmuster abschätzen.
1140
1141 \begin{figure}
1142   \begin{center}
1143     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1144   \end{center}
1145   \caption{Abschätzung der unterschiedlichen Schnittmuster mit der
1146   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1147   $\operatorname{BS}(32)$.}
1148   \label{fig:collisions-10000-1000000-32}
1149 \end{figure}
1150
1151 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1152 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1153 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1154 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1155 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1156 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1157 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1158 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1159 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1160 \cdot 10^6$ unterschiedlichen 16-Schnittmustern für $\operatorname{OES}(32)$
1161 und $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1162
1163 \begin{figure}
1164   \begin{center}
1165     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1166   \end{center}
1167   \caption{Abschätzung der unterschiedlichen Schnittmuster mit der
1168   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1169   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1170   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1171   unterschiedlichen Schnittmustern.}
1172   \label{fig:collisions-100000-1000000-32-ps}
1173 \end{figure}
1174
1175 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1176 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1177 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1178 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1179 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1180 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1181 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1182 ist dieser Umstand wenig verwunderlich. Entsprechend hätte man in einem
1183 kombinierten Graphen keine Details mehr erkennen können. Aufgrund der hohen
1184 Anzahl unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1185 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedlichen
1186 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1187 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1188 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1189 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1190 vorherigen Sortiernetzwerken, aber immer noch fünf Zehnerpotenzen kleiner als
1191 die Anzahl der \emph{möglichen} Schnittmuster.
1192
1193 \newpage
1194 \section{Der \textsc{SN-Evolution}-Algorithmus}
1195 \label{sect:sn-evolution}
1196
1197 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1198 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1199 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1200 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1201 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1202 in Abschnitt~\ref{sect:bewertung} behandelt.
1203
1204 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1205
1206 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1207 {\em Güte} eines Netzwerks definiert werden. Prinzipiell gibt es zwei Ziele,
1208 die bei Sortiernetzwerken verfolgt werden können:
1209 \begin{itemize}
1210   \item Möglichst wenige Komparatoren („effizient“)
1211   \item Möglichst wenige Schichten („schnell“)
1212 \end{itemize}
1213
1214 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1215 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1216 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1217 61~Komparatoren in nur 9~Schichten.
1218
1219 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1220 berücksichtigen kann, hat die folgende allgemeine Form:
1221 \begin{equation}
1222   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1223                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1224                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1225 \end{equation}
1226 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1227 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1228 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1229 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1230 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1231 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1232 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1233
1234 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1235 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1236 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1237 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1238
1239 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1240 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1241 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1242 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1243 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1244 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1245 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1246
1247 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1248 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1249 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1250 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1251 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1252
1253 \subsection{Selektion}
1254
1255 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1256 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1257 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1258 Streben des Algorithmus nach besseren Lösungen.
1259
1260 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1261 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1262 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1263
1264 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1265 Pseudocode wie folgt beschreiben:
1266 \begin{verbatim}
1267   Gütesumme := 0
1268   Auswahl := (leer)
1269   
1270   für jedes Individuum in Population
1271   {
1272     reziproke Güte := 1.0 / Guete(Individuum)
1273     Wahrscheinlichkeit P := reziproke Güte / (Gütesumme + reziproke Güte)
1274     Gütesumme := Gütesumme + reziproke Güte
1275   
1276     mit Wahrscheinlichkeit P
1277     {
1278       Auswahl := Individuum
1279     }
1280   }
1281   gib Auswahl zurück
1282 \end{verbatim}
1283
1284 \subsection{Rekombination}
1285
1286 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1287 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1288 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1289 \emph{Odd-Even}-Mischer (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1290 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1291 Anschließend werden zufällig $n$~Leitungen mit einem $n$-Schnittmuster wie in
1292 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben entfernt.
1293
1294 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1295 erhält. Entsprechend muss nicht aufwendig überprüft werden, ob das
1296 Komparatornetzwerk die Sortiereigenschaft besitzt. Der Nachteil ist, dass
1297 nicht alle Sortiernetzwerke auf diese Art und Weise erzeugt werden können.
1298
1299 \subsection{Mutation}
1300
1301 Zu einem vollständigen evolutionären Algorithmus gehört außerdem die Mutation
1302 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1303 Sortiernetzwerk zufällig zu verändern und dabei die Sortiereigenschaft zu
1304 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1305 Eigenschaft zerstören.
1306
1307 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1308 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1309 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1310 Ausprobieren aller $2^n$~Bitmuster, wie in Abschnitt~\ref{sect:0-1-prinzip}
1311 beschrieben.
1312
1313 Um das Potenzial einer Mutation abzuschätzen wurde in \textsc{SN-Evolution}
1314 eine Überprüfung eingebaut: Unmittelbar vor dem Einfügen in die Population
1315 überprüft eine Funktion die Notwendigkeit jedes einzelnen Komparators. Dazu
1316 wird nacheinander jeder Komparator entfernt und überprüft, ob das verbleibende
1317 Netzwerk die Sortiereigenschaft noch besitzt.
1318
1319 Trotz des hohen Rechenaufwands -- bei 16-Sortiernetzwerken sind gut
1320 4~Millionen Tests notwendig, um alle Komparatoren zu überprüfen -- waren die
1321 Ergebnisse ernüchternd: Nach circa 1~Million Iterationen mit
1322 16-Sortiernetzwerken fand der so modifizierte Algorithmus keinen einzigen
1323 Komparator, den er hätte entfernen können.
1324
1325 \subsection{Güte}
1326
1327 Die Qualität der erreichten Sortiernetzwerke wurde mit eine Gütefunktion
1328 beurteilt, die entsprechend dem im Abschnitt~\ref{sect:bewertung}
1329 vorgestellten Muster definiert ist. Wie beschrieben müssen die Faktoren häufig
1330 an die aktuelle Problemgröße angepasst werden, damit \textsc{SN-Evolution}
1331 schnell gute Ergebnisse liefert. Als guter Standardansatz haben sich die
1332 folgenden Werte herausgestellt:
1333 \begin{eqnarray*}
1334 w_{\mathrm{Basis}} &=& 0 \\
1335 w_{\mathrm{Komparatoren}} &=& 1 \\
1336 w_{\mathrm{Schichten}} &=& \left|S\right|_\mathrm{Leitungen}
1337 \end{eqnarray*}
1338
1339 \subsection{Versuche mit dem bitonen Mischer}
1340
1341 \begin{figure}
1342   \begin{center}
1343     \input{images/16-e1-bitonic-1296542566.tex}
1344   \end{center}
1345   \caption{Sortiernetzwerk mit 16~Leitungen und 67~Komparatoren in
1346     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1347     \textsc{SN-Evolution} unter Verwendung des \emph{bitonen Mischers}
1348     erzeugt.}
1349   \label{fig:16-e1-bitonic-1296542566}
1350 \end{figure}
1351
1352 Verwendet man den \emph{bitonen Mischer} in der Rekombinationsphase von
1353 \textsc{SN-Evolution}, so erhält man Netzwerke wie das in
1354 Abbildung~\ref{fig:16-e1-bitonic-1296542566} dargestellte: Der Algorithmus
1355 wurde mit dem \emph{Odd-Even-Transpositionsort}-Netzwerk als triviale
1356 Initiallösung gestartet. Das Ergebnis ist ein Netzwerk, das effizienter ist
1357 als das \emph{bitone Mergesort}-Netzwerk: \bs{16} benötigt 80~Komparatoren,
1358 das Sortiernetzwerk in Abbildung~\ref{fig:16-e1-bitonic-1296542566} benötigt
1359 lediglich~67.
1360
1361 \subsection{Versuche mit dem \emph{Odd-Even}-Mischer}
1362
1363 \begin{figure}
1364   \begin{center}
1365     \input{images/16-e1-oddeven-1296543330.tex}
1366   \end{center}
1367   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1368     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1369     \textsc{SN-Evolution} unter Verwendung des \emph{Odd-Even}-Mischers
1370     erzeugt.}
1371   \label{fig:16-e1-oddeven-1296543330}
1372 \end{figure}
1373
1374 Leider lies sich das Ergebnis des bitonen Mischers -- das von
1375 \textsc{SN-Evolution} ausgegebene Netzwerk war effizienter als das rekursiv
1376 aus dem verwendeten Mischer aufgebaute Sortiernetzwerk -- mit dem
1377 \emph{Odd-Even}-Mischer nicht wiederholen. Zwar erreichen die
1378 Sortiernetzwerke, die \textsc{SN-Evolution} unter Verwendung des
1379 \emph{Odd-Even}-Mischers findet, das \emph{Odd-Even-Mergesort}-Netzwerk
1380 bezüglich Schnelligkeit und Effizienz, ein Beispiel hierfür ist in
1381 Abbildung~\ref{fig:16-e1-oddeven-1296543330} zu sehen. Ein Netzwerk, das
1382 $\operatorname{OES}(n)$ in mindestens einem Merkmal übertrifft, konnte jedoch
1383 nicht beobachtet werden.
1384
1385 \todo{Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.}
1386
1387 %\begin{figure}
1388 %\begin{center}
1389 %\input{images/08-e2-1237993371.tex}
1390 %\end{center}
1391 %\caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1392 %\label{fig:08-e2-1237993371}
1393 %\end{figure}
1394 %
1395 %\begin{figure}
1396 %\begin{center}
1397 %\input{images/09-e2-1237997073.tex}
1398 %\end{center}
1399 %\caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1400 %\label{fig:09-e2-1237997073}
1401 %\end{figure}
1402 %
1403 %\begin{figure}
1404 %\begin{center}
1405 %\input{images/09-e2-1237999719.tex}
1406 %\end{center}
1407 %\caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1408 %\label{fig:09-e2-1237999719}
1409 %\end{figure}
1410 %
1411 %\begin{figure}
1412 %\begin{center}
1413 %\input{images/10-e2-1239014566.tex}
1414 %\end{center}
1415 %\caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1416 %\label{fig:10-e2-1239014566}
1417 %\end{figure}
1418
1419 %\input{shmoo-aequivalenz.tex}
1420
1421 \newpage
1422 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1423 \label{sect:sn-evolution-cut}
1424
1425 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1426 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1427 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1428 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1429 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1430 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1431 gute Schnittmuster gesucht.
1432
1433 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet \emph{Schnittmuster}, die
1434 in Abschnitt~\ref{sect:anzahl_schnittmuster} definiert wurden, als Individuen.
1435 Um zwei Individuen zu rekombinieren werden die ersten $r$~Schnitte des einen
1436 Schnittmusters verwendet und die letzten ${c-r}$~Schnitte des zweiten
1437 Schmittmusters. $r$ ist eine Zufallsvariable mit $0 \leqq r \leqq c$.
1438
1439 Die Mutation setzt entweder die Leitungsnummer eines Schnitts~$i$ zufällig auf
1440 einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1441 Schnitt-Richtung.
1442
1443 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1444
1445 \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka} zeigen in~\cite{MW2010},
1446 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1447 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1448 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1449 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1450 werden, Komparatoren ein.
1451
1452 Beispielsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1453 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1454 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1455 als das \emph{bitone Mergesort}-Netzwerk nach Batchers Methode. Gegenüber
1456 Batchers Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n
1457 - 1)}$ Komparatoren ein.
1458
1459 \begin{figure}
1460   \begin{center}
1461     \input{images/16-ec-from-bs32.tex}
1462   \end{center}
1463   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1464     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1465     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1466     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1467   \label{fig:16-ec-from-bs32}
1468 \end{figure}
1469
1470 \begin{figure}
1471   \begin{center}
1472     \input{images/16-ec-from-bs32-normalized.tex}
1473   \end{center}
1474   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1475     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1476     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1477     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1478   \label{fig:16-ec-from-bs32-normalized}
1479 \end{figure}
1480
1481 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1482 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1483 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1484 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1485 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1486 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1487 und das
1488 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1489 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1490 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1491 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1492 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1493 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1494 Netzwerks scheinen rein zufällig zu sein.
1495
1496 \begin{figure}
1497   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1498   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1499   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1500   % 63:MAX
1501   \begin{center}
1502     \input{images/32-ec-from-bs64.tex}
1503   \end{center}
1504   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1505     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1506     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1507     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1508     Schnittmuster ist
1509     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1510     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1511     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1512   \label{fig:32-ec-from-bs64}
1513 \end{figure}
1514
1515 Das Ergebnis von \textit{Mühlenthaler} und \textit{Wanka}, die den bitonen
1516 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1517 konstruiert haben, kann demnach auch erreicht werden, wenn
1518 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1519 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1520 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1521 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1522 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1523 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1524 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1525 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1526 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1527 Verzögerung dieser Sortiernetzwerke gleich ist.
1528
1529 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1530 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1531 gute Schnittmuster anzugeben.
1532
1533 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1534 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1535 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1536 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1537 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1538 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1539 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1540 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1541 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1542
1543 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1544 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1545 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1546 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1547 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1548 $\operatorname{OET}(n-m)$-Netzwerk. 
1549
1550 \begin{figure}
1551   \begin{center}
1552     \input{images/16-ec-from-ps32.tex}
1553   \end{center}
1554   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1555     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1556     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1557     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1558   \label{fig:16-ec-from-ps32}
1559 \end{figure}
1560
1561 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1562
1563 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1564 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1565 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1566 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1567 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1568 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1569 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1570 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1571
1572 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even}-Mischer nicht
1573 einsetzt und auch nicht auf einem Mischer basiert, ist der
1574 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1575 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1576 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzwerke, die
1577 strukturell sehr ähnlich zu $\operatorname{PS}(8)$ sind -- lediglich die
1578 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1579
1580 \begin{figure}
1581   \begin{center}
1582     \input{images/32-pairwise-cut-16-pairwise.tex}
1583   \end{center}
1584   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1585   \label{fig:ps16-from-ps32}
1586 \end{figure}
1587
1588 Für das \emph{Pairwise-Sorting-Netzwerk} ist es vergleichsweise einfach
1589 regelmäßige Schnittmuster anzugeben, die aus dem Netzwerk einen kleineres
1590 schnelles und effizientes Sortiernetzwerk erzeugen. Beispielsweise führt das
1591 einfache Schnittmuster
1592 \begin{displaymath}
1593 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1594   -\infty & \quad \textrm{falls } i < \frac{1}{4} n \\
1595    \infty & \quad \textrm{falls } i \geqq \frac{3}{4} n \\
1596         ? & \quad \mathrm{sonst}
1597   \end{array} \right.
1598 \end{displaymath}
1599 für $\operatorname{PS}\left(n = 2^d\right)$ zum Sortiernetzwerk
1600 $\operatorname{PS}\left(\frac{1}{2}n\right)$. Die Art und Weise, mit der
1601 dieses Schnittmuster Komparatoren eliminiert und welche Komparatoren das
1602 verbleibende Netzwerk ausmachen, ist in Abbildung~\ref{fig:ps16-from-ps32}
1603 dargestellt. Die matt blauen und roten Leitungen und Komparatoren sind
1604 diejenigen, die Aufgrund eines Minimums oder eines Maximums im resultierenden
1605 Netzwerk nicht mehr enthalten sind. Da die Minima und Maxima bereits auf den
1606 „richtigen“ Leitungen angelegt werden, müssen keine Leitungen vertauscht
1607 werden und das Ergebnis ist bereits normalisiert. Daher ist das resultierende
1608 Netzwerk in schwarz gut zu erkennen.
1609
1610 \begin{figure}
1611   \begin{center}
1612     \input{images/16-pairwise.tex}
1613   \end{center}
1614   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1615   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1616   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1617   \label{fig:16-pairwise}
1618 \end{figure}
1619
1620 Ein Spezialfall ergibt sich, wenn man \textsc{SN-Evolution-Cut} auf
1621 $\operatorname{PS}(16)$ anwendet: In diesem Fall kann man durch ein
1622 8-Schnittmuster das \emph{Odd-Even-Mergesort}-Netzwerk \oes{8} erhalten. Für
1623 größere Sortiernetzwerke ist dies hingegen nicht mehr möglich, beispielsweise
1624 kann $\operatorname{PS}(32)$ nicht durch ein 16-Schnittmuster in \oes{16}
1625 konvertiert werden. Die Verwandtschaft von $\operatorname{PS}(n)$ und \oes{n}
1626 untersucht \textit{Moritz Mühlenthaler} ausführlich in~\cite{M2009}.
1627
1628 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1629
1630 In Abschnitt~\ref{sect:anzahl_schnittmuster} wurde bereits untersucht, wie
1631 viele \emph{unterschiedliche} Schnittmuster die konstruktiven Sortiernetzwerke
1632 $\operatorname{OES}(32)$, $\operatorname{BS}(32)$ und $\operatorname{PS}(32)$
1633 besitzen. Eines der Ergebnisse war, dass von diesen Sortiernetzwerken das
1634 \emph{Odd-Even-Mergesort}-Netzwerk die wenigsten unterschiedlichen
1635 16-Schnittmuster besitzt -- nur etwa $5,2$~Millionen. Entsprechend ist es
1636 wenig verwunderlich, dass \textsc{SN-Evolution-Cut} gestartet mit
1637 $\operatorname{OES}(32)$ sehr schnell ein gutes 16-Schnittmuster findet.
1638
1639 Eines der eher zufälligen Schnittmuster ist $\operatorname{MIN}(1, 6, 11, 14,
1640 17, 23, 26, 29)$, $\operatorname{MAX}(2, 7, 8,$ $13, 18, 21, 27, 31)$. Das
1641 Schnittmuster ist in Abbildung~\ref{fig:16-ec-from-oes32-cut} veranschaulicht,
1642 das resultierende Netzwerk ist in Abbildung~\ref{fig:16-ec-from-oes32} zu sehen.
1643
1644 \begin{figure}
1645   \begin{center}
1646     \input{images/16-ec-from-oes32-cut.tex}
1647   \end{center}
1648   \caption{Visualisierung eines 16-Schnittmusters, das auf
1649   $\operatorname{OES}(32)$ angewendet wieder ein schnelles und effizientes
1650   Sortiernetzwerk ergibt.}
1651   \label{fig:16-ec-from-oes32-cut}
1652 \end{figure}
1653
1654 \begin{figure}
1655   \begin{center}
1656     \input{images/16-ec-from-oes32.tex}
1657   \end{center}
1658   \caption{16-Sortiernetzwerk mit 63~Komparatoren in 10~Schichten. 
1659     Das Netzwerk wurde von dem Algorithmus \textsc{SN-Evolution-Cut} aus dem
1660     \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(32)$ durch
1661     16~Schnitte erzeugt.}
1662   \label{fig:16-ec-from-oes32}
1663 \end{figure}
1664
1665 \newpage
1666 \section{Der \textsc{SN-Markov}-Algorithmus}
1667 \label{sect:markov}
1668
1669 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1670 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1671 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1672 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1673 verwendet und mit sich selbst kombiniert wird.
1674
1675 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1676 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1677 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1678 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1679 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1680 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1681
1682 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1683 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1684 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1685 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1686 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1687 selbst erzeugen kann.
1688
1689 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben, ist die Anzahl
1690 der \emph{unterschiedlichen} Schnittmuster und damit die Anzahl der Nachfolger
1691 sehr groß. Bei den untersuchten 16-Sortiernetzwerken lag die Anzahl der
1692 Nachfolger zwar noch unter 20.000, bei den untersuchten
1693 32-Sortier\-netz\-werken wurden jedoch bereits bis zu $2,6 \cdot 10^8$
1694 unterschiedliche Schnittmuster geschätzt.
1695
1696 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1697 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1698 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1699 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1700 selbst und erhält so einen zufälligen Nachfolger. In Pseudocode lässt dich der
1701 Algorithmus wie folgt beschreiben:
1702
1703 \begin{verbatim}
1704   Netzwerk := Eingabe
1705   
1706   für n Iterationen
1707   {
1708     Nachfolger := kombiniere (Netzwerk, Netzwerk)
1709     Netzwerk   := Nachfolger
1710   }
1711   
1712   gib Netzwerk zurück
1713 \end{verbatim}
1714
1715 Die Graphen in Abbildung~\ref{fig:markov-comparators} zeigen die Anzahl der
1716 Komparatoren der Sortiernetzwerke, die \textsc{SN-Markov} auf seinem
1717 zufälligen Pfad durchläuft (rot). Für jeden Graphen wurde der
1718 \textsc{SN-Markov}-Algorithmus auf einem entsprechenden
1719 \emph{Odd-Even-Transpositionsort}-Netzwerk gestartet hat mindestens
1720 1.000.000~Iterationen durchlaufen. In jedem Schritt wurde die Anzahl der
1721 Komparatoren des Sortiernetzwerks bestimmt und ein entsprechender Zähler
1722 erhöht. In Abbildung~\ref{fig:markov-comparators} ist die resultierende
1723 prozentuale Verteilung zu sehen.
1724
1725 Ebenfalls in die Graphen in Abbildung~\ref{fig:markov-comparators}
1726 eingezeichnet ist eine \emph{Gamma-Verteilung} (grün), die die gemessenen
1727 Daten gut annähert. Die Gamma-Verteilung verwendet einen Offset~$\delta$, der
1728 um Eins kleiner als die kleinste erreichte Komparatorzahl gewählt wurde.
1729 Beispielsweise war die kleinste erreichte Komparatorzahl bei
1730 16-Sortiernetzwerken~63, entsprechend wurde der Offset $\delta = 63 - 1$
1731 gesetzt und die Gamma-Verteilung $g(x - 62)$ eingezeichnet. Die Parameter $k$
1732 und $\theta$, die eine Gamma-Verteilung charakterisieren, wurden mit einem
1733 Fitting-Algorithmus bestimmt. Der konkrete Offset ist als Parameter~$\delta$
1734 unter den Graphen angegeben.
1735
1736 \begin{figure}
1737   \centering
1738   \subfigure[12 Leitungen, $k = 8,267$, $\theta = 0,962$, $\delta = 40$]{\includegraphics[viewport=0 0 425 262,width=7cm]{images/markov-comparators-12-pct.pdf}}
1739   \subfigure[14 Leitungen, $k = 9,522$, $\theta = 0,867$, $\delta = 52$]{\includegraphics[viewport=0 0 425 262,width=7cm]{images/markov-comparators-14-pct.pdf}}
1740   \subfigure[16 Leitungen, $k = 17,939$, $\theta = 1,091$, $\delta = 62$]{\includegraphics[viewport=0 0 425 262,width=7cm]{images/markov-comparators-16-pct.pdf}}
1741   \subfigure[18 Leitungen, $k = 10,724$, $\theta = 0,766$, $\delta = 81$]{\includegraphics[viewport=0 0 425 262,width=7cm]{images/markov-comparators-18-pct.pdf}}
1742   \caption{Anzahl der Komparatoren von Sortiernetzwerken,
1743   die von {\sc SN-Markov} durchlaufen wurden (rot). Ebenfalls eingezeichnet
1744   ist jeweils eine \emph{Gamma-Verteilung} (grün), die eine gute Näherung der
1745   gemessenen Daten darstellt.}
1746   \label{fig:markov-comparators}
1747 \end{figure}
1748
1749 \begin{figure}
1750   \begin{center}
1751     \includegraphics[viewport=0 0 425 262,width=15cm]{images/comparison-comparators-16.pdf}
1752   \end{center}
1753   \caption{Anzahl der Komparatoren, die 16-Sortiernetzwerke von
1754   \textsc{SN-Markov} und \textsc{SN-Evolution} (mit dem
1755   \emph{Odd-Even}-Mischer und dem \emph{bitonen Mischer}) besaßen.}
1756   \label{fig:comparison-comparators}
1757 \end{figure}
1758
1759 Dass der \textsc{SN-Markov}-Algorithmus nicht schlechter ist als der
1760 \textsc{SN-Evolution}-Algo\-rithmus, ist aus dem Graphen in
1761 Abbildung~\ref{fig:comparison-comparators} ersichtlich. Analog zu dem Versuch
1762 mit \textsc{SN-Markov}, wurde beim \textsc{SN-Evolution}-Algorithmus die
1763 Anzahl der Komparatoren jedes neuen Individuums ermittelt und gespeichert. Als
1764 Startnetzwerk diente bei beiden Algorithmen das
1765 \emph{Odd-Even-Transpositionsort}-Netzwerk \oet{16}. Der Graph zeigt auf der
1766 x-Achse die Anzahl der Komparatoren, auf der y-Achse die Häufigkeit, mit der
1767 ein Sortiernetzwerk mit dieser Komparatorzahl durch die Rekombination erzeugt
1768 wurde. Die Ergebnisse von \textsc{SN-Evolution} unterscheiden außerdem nach
1769 dem verwendeten Mischer-Netzwerk -- \oem{32} beziehungsweise \bm{32}.
1770
1771 Sowohl der \textsc{SN-Markov}-Algorithmus, der das
1772 \emph{Odd-Even-Merge}-Netzwerk verwendet, als auch \textsc{SN-Evolution} mit
1773 \oem{32} erreichen eine Komparatorzahl von~63 und finden Sortiernetzwerke, die
1774 bezüglich Effizienz und Geschwindigkeit identisch zu \oes{16} sind.
1775 Interessanterweise erzeugt \textsc{SN-Markov} derartige Netzwerke häufiger:
1776 Während nur $0,000017 \%$ der Individuen von \textsc{SN-Evolution} mit
1777 63~Komparatoren auskamen, ist die Rate bei \textsc{SN-Markov} mit $0,000335
1778 \%$ rund 20~mal höher.
1779
1780 Erwartungsgemäß sind die besten Netzwerke, die \textsc{SN-Evolution} mit dem
1781 \emph{bitonen Mischer} findet, aus 67~Komparatoren aufgebaut. Überraschend ist
1782 jedoch, dass in dieser Konfiguration Sortiernetzwerke auftreten können, die
1783 mehr Komparatoren besitzen als \emph{Odd-Even-Transpositionsort} -- \oet{16}
1784 ist aus 120~Komparatoren aufgebaut, bei dem Lauf, der die Daten für
1785 Abbildung~\ref{fig:comparison-comparators} lieferte, traten auch jeweils ein
1786 Sortiernetzwerk mit 121 und 124~Komparatoren auf. Da Sortiernetzwerke mit so
1787 vielen Komparatoren im Verlauf des Experiments selbst nach über 100~Millionen
1788 Iterationen nicht noch einmal erzeugt wurden, handelt es sich vermutlich um
1789 ein Phänomen, das mit der Initialisierung mit dem
1790 \emph{Odd-Even-Transpositionsort}-Netzwerk zusammenhängt.
1791
1792 %\begin{figure}
1793 %  \begin{center}
1794 %  \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-14-pct.pdf}
1795 %  \end{center}
1796 %  \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1797 %  die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1798 %  \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1799 %  \label{fig:markov-comparators-14}
1800 %\end{figure}
1801 %
1802 %\begin{figure}
1803 %  \begin{center}
1804 %  \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-16-pct.pdf}
1805 %  \end{center}
1806 %  \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1807 %  die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1808 %  \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1809 %  \label{fig:markov-comparators-16}
1810 %\end{figure}
1811 %
1812 %\begin{figure}
1813 %  \begin{center}
1814 %  \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-18-pct.pdf}
1815 %  \end{center}
1816 %  \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 18~Leitungen),
1817 %  die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1818 %  \emph{Gamma-Verteilung} $f(x - 81)$ mit $k = 10,724$ und $\theta = 0,766$.}
1819 %  \label{fig:markov-comparators-18}
1820 %\end{figure}
1821
1822 %\begin{figure}
1823 %  \begin{center}
1824 %  \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-cycles-16.pdf}
1825 %  \end{center}
1826 %  \caption{Zyklen, die beim \textit{Random Walk} des
1827 %  \textsc{SN-Markov}-Algorithmus detektiert wurden. Auf der x-Achse sind die
1828 %  Anzahl der Schritte, die \textsc{SN-Markov} zurückgelegt hat, auf der
1829 %  y-Achse die Längen der gefundenen Zyklen aufgetragen. Das initiale
1830 %  Start-Sortiernetzwerk war $\operatorname{OET}(16)$.}
1831 %  \label{fig:markov-cycles-16}
1832 %\end{figure}
1833
1834
1835 \todo{Schreibe noch etwas zu …}
1836 \begin{itemize}
1837   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1838   \item Anzahl der erreichbaren Sortiernetzwerke.
1839   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1840     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1841   \item \textsc{SN-Count-Markov} (ggf)
1842 \end{itemize}
1843
1844 \newpage
1845 \section{Fazit und Ausblick}
1846
1847 \todo{Ausformulieren}
1848 \begin{itemize}
1849 \item Mit \textsc{SN-Evolution} und \oem{n} kann man nicht besser werden als
1850   \oes{n}.
1851 \item Mit \textsc{SN-Evolution} und \bm{n} kann man besser werden als \bs{n}.
1852 \item Vermutlich kann man mit \textsc{SN-Evolution} und \bm{n} so gut werden
1853 wie \textsc{SN-Evolution-Cut}, wenn er mit \bs{2n} gestartet wird.
1854 \item Leider sind keine konstruktiven Methoden erkannt worden.
1855 \end{itemize}
1856
1857 Die Möglichkeiten, die Evolutionäre Algorithmen bei der Optimierung von
1858 Sortiernetzwerken bieten, sind durch die in dieser Arbeit vorgestellten
1859 Herangehensweisen bei weitem nicht erschöpft.
1860
1861 Im Folgenden werden Ansätze umrissen, mit denen an die Untersuchungen in
1862 dieser Arbeit nahtlos angeknöpft werden könnte.
1863
1864 \subsection{Ausblick: Das \textit{Pairwise-Sorting}-Netzwerk und \textsc{SN-Evolution}}
1865
1866 Die aktuelle Implementierung von \textsc{SN-Evolution}
1867 (Abschnitt~\ref{sect:sn-evolution}) kann sowohl den \emph{bitonen Mischer} als
1868 auch den \emph{Odd-Even}-Mischer verwenden, um zwei Individuen zu
1869 rekombinieren. Das \emph{Pairwise-Sorting}-Netzwerk verwendet zwar keinen
1870 Mischer, es ist aber ebenfalls rekursiv über kleinere Versionen von sich
1871 selbst definiert. Das heißt, dass \ps{n} aus zwei Instanzen von
1872 $\ps{\frac{n}{2}}$ und zusätzlichen Komparatoren besteht, die die Eingabe für
1873 die kleineren Sortiernetzwerke vorbereiten und anschließend für eine sortierte
1874 Ausgaben sorgen. Anstelle von $\ps{\frac{n}{2}}$ kann man natürlich beliebige
1875 Sortiernetzwerke mit $\frac{n}{2}$~Leitungen verwenden.
1876
1877 Dies ließe sich für \textsc{SN-Evolution} nutzen, um zwei Individuen zu
1878 rekombinieren. Da es für das \emph{Pairwise-Sorting}-Netzwerk sehr viele
1879 \emph{unterschiedliche} Schnittmuster gibt
1880 (Abschnitt~\ref{sect:anzahl_schnittmuster}), ist es möglich, dass die
1881 Verwendung dieser Rekombinationsmethode neue Ergebnisse ermöglicht. Leider
1882 wird die Aussicht auf Erfolg durch die Tatsache geschmälert, dass keine
1883 $n$-Schnittmuster für \ps{2n} gefunden werden konnten, die zu besseren
1884 $n$-Sortiernetzwerken als \ps{n} führen.
1885
1886 \subsection{Ausblick: Kooperation von \textsc{SN-Evolution} und \textsc{SN-Evolution-Cut}}
1887
1888 Ähnlich zu der parasitären \emph{Co-Evolution}, die \textit{W.~Daniel Hillis}
1889 in~\cite{H1992} beschreibt, könnte man die Algorithmen \textsc{SN-Evolution}
1890 und \textsc{SN-Evolution-Cut} versuchen zu kombinieren. Nach dem Zusammenfügen
1891 von zwei $n$-Sortiernetzwerken könnte der Algorithmus
1892 \textsc{SN-Evolution-Cut} beispielsweise einen möglichst guten Schnitt für
1893 \emph{dieses} Netzwerk ermitteln. Da sich die Lösungen, die Evolutionäre
1894 Algorithmen in ihre Population aufnehmen, in den ersten Schritten rasch
1895 verbessern, könnten selbst weniger Iterationen von \textsc{SN-Evolution-Cut}
1896 die Zwischenlösungen von \textsc{SN-Evolution} deutlich verbessern.
1897
1898 Alternativ könnte man -- analog zur Herangehensweise von \textit{Hillis} --
1899 eine zweite Population von Schnittmustern evolvieren, die für die
1900 Sortiernetzwerke in der Population von \textsc{SN-Evolution} besonders gut
1901 funktionieren. In jeder Iteration wendet man alle oder eine zufällige Menge
1902 Schnittmuster auf das zusammengeführte Netzwerk an und gibt dem besten
1903 Ergebnis den Zuschlag. Anschließend erfährt das entsprechende Schnittmuster
1904 eine Aufwertung, so dass es wahrscheinlicher wird, dass \emph{dieses}
1905 Schnittmuster zur nächsten Generation beiträgt. Im Gegensatz zum Ansatz der
1906 parasitären Eingaben entsteht eine \emph{Synergie} zweier Populationen, die
1907 das Gesamtergebnis oder zumindest die Konvergenzgeschwindigkeit verbessern
1908 könnte.
1909
1910 \newpage
1911 \section{Implementierung}
1912
1913 Alle in dieser Arbeit beschriebenen Versuche wurden mit einer eigens
1914 entwickelten C-Bibliothek, \textit{libsortnetwork}, und zugehörigen
1915 Kommandozeilen-Programmen durchgeführt. Die Bibliothek wurde unter der
1916 \textit{GNU Lesser General Public License} (LGPL) in der Version~2.1
1917 veröffentlicht; die Kommandozeilen-Programme, die in vielen Fällen lediglich
1918 Funktionalität der Bibliothek auf der Kommandozeile zur Verfügung stellen,
1919 stehen unter der \textit{GNU General Public License}, Version~2. Diese
1920 Lizenzen räumen einem Benutzer weitreichende Rechte ein, unter anderem das
1921 Programm beliebig zu verwenden, zu studieren, zu verändern sowie veränderte
1922 und unveränderte Kopien zu veröffentlichen.
1923
1924 Die Programmierschnittstelle (API) der Bibliothek orientiert sich an
1925 Paradigmen der \textit{objektorientierten Programmierung}. Beispielsweise kann
1926 mit der Funktion \texttt{sn\_network\_ create()} ein neues Zustands-Objekt
1927 erzeugt werden, für das mehrere Manipulations-Methoden, zum Beispiel
1928 \texttt{sn\_network\_comparator\_add()}, zur Verfügung stehen. Auf diese Art
1929 und Weise kann die Bibliothek leicht erweitert werden, ohne dass bestehende
1930 Programme angepasst werden müssen.
1931
1932 Die meisten Kommandozeilen-Programmen lesen ein Komparatornetzwerk von der
1933 Standard-Eingabe und schreiben ihr Ergebnis auf die Standard-Ausgabe. Um
1934 Beispielsweise eine \emph{normalisierte} Variante des \emph{bitonen
1935 Mergesort}-Netzwerks \bs{18} zu erzeugen, kann folgendes Kommando verwendet
1936 werden:
1937 \begin{verbatim}
1938   $ sn-bitonicsort 18 | sn-normalize >sn-18
1939 \end{verbatim}
1940 Dieses Prinzip, kleine Programme \emph{eine} Aufgabe erledigen zu lassen und
1941 es einfach zu ermöglichen, Programme zu verketten, ist eines der
1942 Grundprinzipien des UNIX-Be\-triebs\-sys\-tems. Es hat sich in den letzten
1943 Jahrzehnten und beim Verfassen dieser Arbeit als sehr flexibel und mächtig
1944 erwiesen.
1945
1946 Funktionen, die von Kommandozeilen-Programmen zur Verfügung gestellt werden,
1947 sind unter anderem das Erzeugen von Odd-Even-Mergesort-, bitonic Mergesort-
1948 und Pairwise-Sorting-Netzwerken, das Normalisieren von Sortiernetzwerken,
1949 Anwendung von Schnittmustern auf Sortiernetzwerke und Anwendung eines
1950 Komparatornetzwerks auf eine Eingabe-Permutation.
1951
1952 \textit{libsortnetwork} kann unter der Web-Adresse
1953 \url{http://octo.it/libsortnetwork/} unentgeltlich heruntergeladen werden.
1954
1955 \newpage
1956 \bibliography{references}
1957 \bibliographystyle{plain}
1958
1959 %\listoffigures
1960
1961 \end{document}
1962
1963 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :