+Referenz zu 0-1-Prinzip.
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{edge minimum} = [edge,color=blue!20]
56 \tikzstyle{edge maximum} = [edge,color=red!20]
57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
63 \tikzstyle{comp active minimum} = [comp]
64 \tikzstyle{comp active maximum} = [comp]
65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
69
70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
74
75 \maketitle
76 \begin{abstract}
77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
78 vorgestellt (Odd-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
84 das hinbekomme bzw. Recht behalte.}
85 \end{abstract}
86 \newpage
87
88 \tableofcontents
89
90 \newpage
91 \section{Motivation und Einleitung}
92
93 \subsection{Motivation}\label{sect:motivation}
94
95 \begin{itemize}
96 \item Sortiernetzwerke sind toll, weil $\ldots$
97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
100 \end{itemize}
101
102 \subsection{Einleitung}\label{sect:einleitung}
103
104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
105
106 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
107 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
108 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
109 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
110 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
111 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
112
113 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
114 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
115 erhält man ein {\em Komparatornetzwerk}.
116
117 \begin{figure}
118 \begin{center}
119 \input{images/einfaches_komparatornetzwerk.tex}
120 \end{center}
121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
122 aus 5~Komparatoren.}
123 \label{fig:einfaches_komparatornetzwerk}
124 \end{figure}
125
126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
127 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
128 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
129 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
130 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
131 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
132 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
133 durch schwarze Punkte symbolisiert.
134
135 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
136 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
137 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
138 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
139 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
140
141 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
142 gleichzeitig angewandt werden. Das Beispiel in
143 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
144 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
145 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
146 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
147 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
148 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
149 benötigten parallelen Schritte darstellt.
150
151 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
152 erzeugen, die der Sortierung der Eingabe entspricht, heißen
153 \emph{Sortiernetzwerke}. Das in
154 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
155 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
156 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
157 zerstört.
158
159 \begin{figure}
160   \begin{center}
161     \input{images/09-e2-c24-allbut1.tex}
162   \end{center}
163   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
164   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
165   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
166   \label{fig:09-e2-c24-allbut1}
167 \end{figure}
168 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
169 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
170 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
171 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
172 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
173 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
174 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
175 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
176 nicht \emph{effizient} möglich.
177
178 Beispielsweise sortiert das Komparatornetzwerk in
179 Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880 möglichen
180 Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4, 8, 6)$
181 lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
182 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge
183 $(1, 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
184
185 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
186 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
187 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
188 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
189 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
190 ist.\footnote{1.307.674.368.000 Permutationen}
191
192 \label{sect:0-1-prinzip}
193 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
194 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
195 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
196 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
197 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
198 in der Ausgabe, die die Sortierbedingung verletzt:
199 \begin{displaymath}
200   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
201 \end{displaymath}
202 Die Eingabe kann mittels
203 \begin{displaymath}
204   \hat{e}_j = \left\{
205     \begin{array}{cl}
206       0 & e_j \leqq a_i \\
207       1 & e_j > a_i
208     \end{array} \right.
209 \end{displaymath}
210 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme vom
211 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
212 Verhalten jedes einzelnen Komparators nicht, so dass die Annahme auf einen
213 Widerspruch geführt wird.
214
215 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
216 Komplexitätsklasse
217 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
218 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
219 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
220 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
221 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
222 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
223 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
224 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
225 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
226 beschäftigen.
227
228 \subsubsection{Evolutionäre Algorithmen}
229
230 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
231 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
232 \textit{NP}, das heißt das keine Verfahren bekannt sind, die das Problem
233 effizient exakt lösbar. Sollte sich herausstellen, dass diese Probleme nicht
234 in der Komplexitätsklasse~\textit{P} liegen, wäre eine Konsequenz, dass es
235 effiziente exakte Algorithmen für diese Probleme nicht geben kann. Falls sich
236 hingegen herausstellt, dass diese Probleme in der
237 Komplexitätsklasse~\textit{P} liegen, wird es mit großer Wahrscheinlichkeit
238 noch einige Zeit dauern, bis auch Algorithmen mit praktikablen Zeitkonstanten
239 gefunden werden.
240
241 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
242 die beziehungsweise eine der {\em optimalen} Lösungen als einzige Ausgabe des
243 Algorithmus zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele
244 dieser Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
245 beispielsweise imitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
246 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
247
248 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
249 ist, bekannte Lösungen zu neuen -- unter Umständen besseren -- Lösungen zu
250 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
251 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem als {\em
252 Individuen} bezeichnet.
253
254 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
255 bestehenden Lösungsmenge, der {\em Population}, werden zufällig Lösungen
256 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
257 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
258 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
259 eingefügt wird. Die verwendeten Wahrscheinlichkeiten, beispielsweise bei der
260 {\em Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
261 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
262 Gütefunktion}.
263
264 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
265 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
266 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
267 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
268 Algorithmen verwenden als einfache, initiale Lösung häufig das
269 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
270 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
271 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
272 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
273
274 Beim Aussuchen von zufälligen Lösungen aus der Population, der
275 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
276 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
277 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
278 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
279 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
280 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
281 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
282 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
283 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
284 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
285 findet er aber in der Regel bessere Lösungen.
286
287 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
288 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
289 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
290 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
291 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
292 zwischen verschiedenen Leitungszahlen stark unterscheiden.
293
294 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
295 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
296 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
297 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
298 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
299 „Ausbrechen“ und finden noch besserer Lösungen.
300
301 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
302 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
303 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
304 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
305 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
306 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
307
308 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
309 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
310 mutieren lediglich Transformationen von Sortiernetzwerken, die die
311 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
312 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
313 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
314
315 \newpage
316 \section{Bekannte konstruktive Sortiernetzwerke}
317 \label{sect:konstruktive_netzwerke}
318
319 Übersicht über bekannte konstruktive Sortiernetzwerke.
320
321 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
322 \label{sect:odd_even_transpositionsort}
323
324 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
325 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
326 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
327 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
328 ${n = 8}$ Leitungen.
329
330 \begin{figure}
331   \begin{center}
332     \input{images/oe-transposition-8.tex}
333   \end{center}
334   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
335   \label{fig:odd-even-transposition-08}
336 \end{figure}
337
338 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
339 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
340 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
341 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
342 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
343 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
344
345 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
346 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
347 Herausschneiden einer Leitung reduziert. In
348 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
349 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
350 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
351
352 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
353 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
354 Komparatoren anordnen lassen, effizient. Es benötigt
355 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
356 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
357 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
358 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
359
360 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
361 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
362 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
363 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
364 Algorithmen.
365
366 \subsection{Das bitone Mergesort-Netzwerk}
367
368 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
369 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
370 veröffentlicht wurde. Es ist deutlich effizienter als das
371 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
372 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
373 Schichten.
374
375 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
376 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
377 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
378 verleiht dem Sortiernetzwerk seinen Namen.
379
380 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
381 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
382 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
383
384 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
385
386 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
387 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
388 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
389 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
390 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
391 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
392 entstehen können. Die wichtigsten Varianten für das \emph{bitone
393 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
394 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
395 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
396 ist wichtig zu beachten, dass das letzte Element nicht größer
397 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
398 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
399 darf.
400
401 \begin{figure}
402   \centering
403   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
404   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
405   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
406   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
407   \caption{Beispiele bitoner Folgen.}
408   \label{fig:beispiel-biton}
409 \end{figure}
410
411 \begin{figure}
412   \centering
413   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
414   \qquad
415   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
416   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
417   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
418   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
419   resultierenden Teilfolgen sind wiederum biton.}
420   \label{fig:bitonic-merge-schema}
421 \end{figure}
422
423 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
424 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
425 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
426 sortiert, die Folge $V$ sei absteigend sortiert:
427 \begin{eqnarray}
428  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
429  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
430 \end{eqnarray}
431 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
432 Positionen verglichen und ggf. vertauscht:
433 \begin{equation}
434 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
435 \end{equation}
436 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
437 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
438 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
439 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
440 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
441 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
442 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
443 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
444 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
445 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
446 zeigt die Situationen vor und nach diesem Schritt des Mischers.
447
448 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
449 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
450 mithilfe des bitonen Mischers, mit zwei Instanzen von
451 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
452 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
453 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
454 definiert ist.
455
456 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
457 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
458 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
459 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
460 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
461 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
462 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
463
464 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
465 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
466 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
467 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
468 besteht, die in $\log(n)$~Schichten angeordnet werden können.
469
470 \subsubsection{Das bitone Mergesort-Netzwerk}
471
472 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
473 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
474 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
475 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
476 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
477 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
478 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
479 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
480 $\operatorname{BS}(2)$ identisch.
481
482 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
483 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
484 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
485 alle Komparatoren in die gleiche Richtung zeigen.
486
487 \begin{figure}
488   \begin{center}
489   \input{images/batcher-8.tex}
490   \end{center}
491   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
492   für acht Eingänge. Markiert sind die beiden Instanzen von
493   $\operatorname{BS}(4)$ (rot), die beiden bitonen
494   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
495   rekursiven Schritt hinzugefügt wurden (grün).}
496   \label{fig:bitonic-08}
497 \end{figure}
498
499 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
500 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
501 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
502 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
503 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
504 grün hinterlegt.
505
506 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
507 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
508 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
509 Schichten angeordnet sind.
510
511 %\begin{figure}
512 %\begin{center}
513 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
514 %\end{center}
515 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
516 %$S(n/2)$ und dem Mischer $M(n)$.}
517 %\label{fig:bms_rekursiver_aufbau}
518 %\end{figure}
519
520 \subsection{Das Odd-Even-Mergesort-Netzwerk}
521
522 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
523 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
524 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
525 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
526 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
527 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
528 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
529 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
530
531 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
532
533 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
534 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
535 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
536 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
537 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
538 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
539 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
540
541 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
542 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
543 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
544 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
545 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
546 \begin{equation}
547 w_i = \left\{ \begin{array}{ll}
548         u_i,     & i < n \\
549         v_{i-n}, & i \geqq n
550       \end{array} \right.,
551       \quad 0 \leqq i < N
552 \end{equation}
553
554 \begin{figure}
555   \begin{center}
556   \input{images/oe-merge.tex}
557   \end{center}
558   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
559   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
560   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
561   \label{fig:oe-merge}
562 \end{figure}
563
564 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
565 geraden Indizes und je eine Liste der ungeraden Indizes.
566 \begin{eqnarray}
567   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
568   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
569   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
570   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
571 \end{eqnarray}
572
573 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
574 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
575 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
576 Ausgang der Mischer die Folgen
577 \begin{eqnarray}
578   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
579   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
580 \end{eqnarray}
581 ergeben.
582
583 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
584 hinzugefügt,
585 \begin{equation}
586   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
587 \end{equation}
588 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
589 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
590
591 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
592 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
593 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
594 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
595 Aufbau lauten:
596 \begin{itemize}
597   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
598   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
599   einzelnen Komparator.
600 \end{itemize}
601
602 Dass die resultierende Folge sortiert ist, lässt sich mit dem
603 {\em 0-1-Prinzip} zeigen:
604 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
605 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
606 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
607 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
608 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
609 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
610 \begin{eqnarray}
611   \left|W_{\textrm{gerade}}\right|_0
612   &=& \left|U_{\textrm{gerade}}\right|_0
613     + \left|V_{\textrm{gerade}}\right|_0
614    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
615    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
616   \left|W_{\textrm{ungerade}}\right|_0
617   &=& \left|U_{\textrm{ungerade}}\right|_0
618     + \left|V_{\textrm{ungerade}}\right|_0
619    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
620    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
621 \end{eqnarray}
622 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
623 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
624 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
625 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
626 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
627 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
628 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
629 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
630
631 \begin{figure}
632   \centering
633   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
634   \qquad
635   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
636   \qquad
637   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
638   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
639   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
640   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
641   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
642   sortiert ist.}
643   \label{fig:oe-post-recursive}
644 \end{figure}
645
646 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
647 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
648 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
649 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
650 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
651
652 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
653 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
654 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
655 \begin{displaymath}
656   K(n,m) = \left\{ \begin{array}{ll}
657     nm, & \mathrm{falls} \quad nm \leqq 1 \\
658     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
659     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
660     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
661   \end{array} \right.
662 \end{displaymath}
663 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
664 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
665 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
666
667 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
668 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
669 Rekursionsschritt der OEM-Konstruktion fügt
670 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
671 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
672 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
673 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
674 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
675 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
676 \begin{displaymath}
677   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
678 \end{displaymath}
679 Komparatoren eingespart. Damit ergibt sich
680 \begin{displaymath}
681   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
682 \end{displaymath}
683 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
684 benötigt werden.
685
686 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
687
688 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
689 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
690 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
691 effizientesten Sortiernetzwerke in Bezug auf Komparator- und Schichtzahl
692 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
693 $\operatorname{OES}(n)$ aus
694 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
695 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
696 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
697 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
698 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
699 Komparatornetzwerke definiert sind.
700
701 \begin{figure}
702   \begin{center}
703   \input{images/oe-mergesort-8.tex}
704   \end{center}
705   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
706   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
707   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
708   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
709   Komparatoren zwischen benachbarten Leitungen (grün).}
710   \label{fig:odd-even-mergesort-08}
711 \end{figure}
712
713 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
714 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
715 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
716 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
717 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
718 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
719
720 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
721 \emph{Odd-Even-Mergesort-Netz\-werk} verwendet wird, $k(n)$, direkt aus der
722 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
723 \begin{displaymath}
724   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
725        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
726        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
727 \end{displaymath}
728 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
729 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
730 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
731
732 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
733 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
734 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
735 \begin{displaymath}
736   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
737 \end{displaymath}
738 gilt.
739
740 % gnuplot:
741 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
742 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
743 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
744
745 %\begin{itemize}
746 %\item Pairwise sorting-network
747 %\end{itemize}
748
749 \newpage
750 \section{Transformation von Sortiernetzwerken}
751 \label{sect:tranformation}
752
753 \subsection{Komprimieren}
754
755 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
756 gleichzeitig ausgewertet werden, wie bereits in
757 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
758 Transformationen, insbesondere das Entfernen einer Leitung, das in
759 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
760 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
761 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
762 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
763 die jeden Komparator so früh wie möglich ausführt. So entsteht die
764 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
765 unterteilen lässt.
766
767 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
768 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
769 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
770 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
771 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
772 Komprimierung durchgeführt werden.
773
774 \subsection{Normalisieren}
775
776 \begin{figure}
777   \centering
778   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
779   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
780   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
781   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
782   intuitiven Konstruktion und die normalisierte Variante.}
783   \label{fig:beispiel_normalisieren}
784 \end{figure}
785
786 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
787 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
788 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
789 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
790 in~\cite{KNUTH} einen Algorithmus an.
791
792 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
793 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
794 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
795 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
796 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
797 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
798 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
799 Definition.
800
801 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
802 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
803 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
804 und das Trichtermuster zu sehen.
805
806 \subsection{Zwei Netzwerke kombinieren}
807
808 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
809 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
810 Sortiernetzwerk zusammenzufassen.
811
812 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
813 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
814 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
815 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
816 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
817 und Weise rekursiv aufgebaut.
818
819 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
820 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
821 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
822 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
823 zusammenfügen.
824
825 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
826 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
827 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
828 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
829 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
830 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
831
832 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
833 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
834 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
835 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
836 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
837 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
838 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
839 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
840 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
841 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
842 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
843 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
844 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
845 6~Komparatoren weniger.
846
847 % 9   9
848 % 9  18
849 % 9  27
850 % 9  36
851 % 9  45
852 % 8  53
853 % 8  61
854 % 7  68
855 % 7  75
856 % 6  81
857 % 5  86
858
859 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
860 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
861 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
862 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
863 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
864 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
865 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
866 nur mit exponentiellem Aufwand möglich ist.
867
868 %\begin{itemize}
869 %\item Mit dem Bitonic-Merge
870 %\item Mit dem Odd-Even-Merge
871 %\item Nach dem Pairwise sorting-network Schema.
872 %\end{itemize}
873
874 \subsection{Leitungen entfernen}
875 \label{sect:leitungen_entfernen}
876
877 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
878 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
879 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
880 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
881 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
882 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
883
884 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
885 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
886 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
887 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
888 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
889 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
890 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
891 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
892 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
893 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
894 das {\em Odd-Even-Transpositionsort-Netzwerk}.
895
896 \begin{figure}
897   \centering
898   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
899   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
900   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
901   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
902   \caption{Eine Leitung wird aus dem
903   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
904   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
905   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
906   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
907   Pfad herausgetrennt werden. In der letzten Abbildung ist
908   $\operatorname{OET}(7)$ markiert.}
909   \label{fig:oe-transposition-cut}
910 \end{figure}
911
912 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
913 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
914 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
915 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
916 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
917 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
918 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
919 auf die keine Komparatoren mehr berührt
920 (Abbildung~\ref{fig:oe-transposition-cut1}).
921
922 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
923 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
924 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
925 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
926 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
927 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
928 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
929 mit $(n-1)$~Elementen darstellen.
930
931 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
932 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
933 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
934 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
935 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
936
937 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
938 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
939 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
940 Darstellung ergibt. Ausserdem ist das
941 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
942 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
943 Ausgabe und kann entfernt werden.
944
945 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
946 \label{sect:anzahl_schnittmuster}
947
948 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
949 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
950 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
951 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
952 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
953 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
954 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
955 \emph{$k$-Schnittmuster}.
956
957 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
958 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
959 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
960
961 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
962 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
963 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
964 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
965 ergeben sich insgesamt
966 \begin{equation}\label{eqn:anzahl_schnittmuster}
967   \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
968   \quad (n > m)
969 \end{equation}
970 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
971 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
972 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
973 führen beide Reihenfolgen zum selben Ergebnis.
974
975 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass es
976 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
977 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
978 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
979 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
980 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
981 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
982 der möglichen Schnittmuster:
983 \begin{displaymath}
984   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
985   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
986   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
987   \quad (1 \leqq k < n)
988 \end{displaymath}
989
990 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
991 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
992 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
993 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
994 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
995 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
996
997 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
998 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
999 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
1000 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
1001 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1002 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1003 Werte unterscheiden.
1004
1005 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1006 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
1007 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1008 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1009 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1010 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1011 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1012 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1013
1014 \begin{figure}
1015   \begin{center}
1016     \includegraphics[viewport=0 0 425 262,width=15cm]{images/count-cuts-16.pdf}
1017   \end{center}
1018   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1019   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1020   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1021   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1022   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1023   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1024   \label{fig:count-cuts-16}
1025 \end{figure}
1026
1027 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1028 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1029 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1030 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1031 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
1032 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
1033 angewandt. Anschließend wurde mithilfe einer Hashtabelle überprüft, ob das
1034 resultierende Sortiernetzwerk schon von einem \emph{äquivalenten}
1035 Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk noch nicht in der
1036 Hashtabelle enthalten war, wurde der Zähler für unterschiedliche Schnittmuster
1037 erhöht und das Sortiernetzwerk eingefügt.
1038
1039 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1040 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1041 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1042 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1043 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1044 nahe ist.
1045
1046 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1047 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
1048 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
1049 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
1050 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
1051 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
1052 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
1053 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
1054 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1055 vernachlässigbar klein ist.
1056
1057 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1058 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1059 Die Hashtabelle benötigt mehr Arbeitsspeicher als in derzeitigen Rechnern
1060 vorhanden ist, bevor ein entsprechender Graph den linearen Bereich für
1061 „kleine“ x-Werte verlässt.
1062
1063 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1064 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1065 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1066 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1067 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
1068 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in
1069 $S$ enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1070 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1071 unterschiedlichen Schnittmuster abschätzen.
1072
1073 \begin{figure}
1074   \begin{center}
1075     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1076   \end{center}
1077   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1078   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1079   $\operatorname{BS}(32)$.}
1080   \label{fig:collisions-10000-1000000-32}
1081 \end{figure}
1082
1083 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1084 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1085 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1086 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1087 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1088 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1089 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1090 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1091 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1092 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1093 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1094
1095 \begin{figure}
1096   \begin{center}
1097     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1098   \end{center}
1099   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1100   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1101   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1102   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1103   unterschiedlichen Schnittmustern.}
1104   \label{fig:collisions-100000-1000000-32-ps}
1105 \end{figure}
1106
1107 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1108 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1109 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1110 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1111 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1112 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1113 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1114 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1115 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1116 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1117 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1118 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1119 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1120 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1121 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1122 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1123 die Anzahl der \emph{möglichen} Schnittmuster.
1124
1125 \newpage
1126 \section{Der \textsc{SN-Evolution}-Algorithmus}
1127
1128 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1129 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1130 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1131 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1132 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1133 in Abschnitt~\ref{sect:bewertung} behandelt.
1134
1135 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1136
1137 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1138 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1139 die bei Sortiernetzwerken verfolgt werden können:
1140 \begin{itemize}
1141   \item Möglichst wenige Komparatoren („effizient“)
1142   \item Möglichst wenige Schichten („schnell“)
1143 \end{itemize}
1144
1145 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1146 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1147 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1148 61~Komparatoren in nur 9~Schichten.
1149
1150 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1151 berücksichtigen kann, hat die folgende allgemeine Form:
1152 \begin{equation}
1153   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1154                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1155                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1156 \end{equation}
1157 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1158 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1159 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1160 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1161 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1162 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1163 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1164
1165 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1166 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1167 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1168 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1169
1170 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1171 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1172 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1173 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1174 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1175 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1176 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1177
1178 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1179 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1180 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1181 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1182 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1183
1184 \subsection{Selektion}
1185
1186 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1187 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1188 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1189 Streben des Algorithmus nach besseren Lösungen.
1190
1191 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1192 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1193 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1194
1195 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1196 Pseudocode wie folgt beschreiben:
1197 \begin{verbatim}
1198 Gütesumme := 0
1199 Auswahl := (leer)
1200
1201 für jedes Individuum in Population
1202 {
1203   reziproke Güte := 1.0 / Guete(Individuum)
1204   Wahrscheinlichkeit P := reziproke Güte / (reziproke Güte + Gütesumme)
1205   Gütesumme := Gütesumme + reziproke Güte
1206
1207   mit Wahrscheinlichkeit P
1208   {
1209     Auswahl := Individuum
1210   }
1211 }
1212 gib Auswahl zurück
1213 \end{verbatim}
1214
1215 \subsection{Rekombination}
1216
1217 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1218 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1219 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1220 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1221 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1222 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1223 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1224
1225 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1226 erhält.
1227
1228 \subsection{Mutation}
1229
1230 Zu einem vollständigen evolutionären Algorithmus gehört außerdem die Mutation
1231 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1232 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1233 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1234 Eigenschaft zerstören.
1235
1236 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1237 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1238 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1239 Ausprobieren aller $2^n$~Bitmuster, wie in Abschnitt~\ref{sect:0-1-prinzip}
1240 beschrieben.
1241
1242 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1243 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1244 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1245 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1246 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1247
1248 \begin{itemize}
1249 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1250 Schichten, kobiniert)
1251 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1252 \end{itemize}
1253
1254 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1255 Abbildung~\ref{fig:evolutionary_08}.
1256
1257 \begin{figure}
1258 \begin{center}
1259 \input{images/evolutionary-08.tex}
1260 \end{center}
1261 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1262 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1263 \label{fig:evolutionary_08}
1264 \end{figure}
1265
1266 \begin{figure}
1267 \begin{center}
1268 \input{images/08-e2-1237993371.tex}
1269 \end{center}
1270 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1271 \label{fig:08-e2-1237993371}
1272 \end{figure}
1273
1274 \begin{figure}
1275 \begin{center}
1276 \input{images/09-e2-1237997073.tex}
1277 \end{center}
1278 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1279 \label{fig:09-e2-1237997073}
1280 \end{figure}
1281
1282 \begin{figure}
1283 \begin{center}
1284 \input{images/09-e2-1237999719.tex}
1285 \end{center}
1286 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1287 \label{fig:09-e2-1237999719}
1288 \end{figure}
1289
1290 \begin{figure}
1291 \begin{center}
1292 \input{images/10-e2-1239014566.tex}
1293 \end{center}
1294 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1295 \label{fig:10-e2-1239014566}
1296 \end{figure}
1297
1298 \subsection{Güte}
1299
1300 \begin{itemize}
1301 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1302 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1303 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1304 \end{itemize}
1305
1306 %\input{shmoo-aequivalenz.tex}
1307
1308 \newpage
1309 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1310 \label{sect:sn-evolution-cut}
1311
1312 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1313 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1314 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1315 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1316 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1317 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1318 gute Schnittmuster gesucht.
1319
1320 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1321 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1322 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1323 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1324 $0 \leqq r \leqq c$.
1325
1326 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1327 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1328 Schnitt-Richtung.
1329
1330 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1331
1332 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1333 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1334 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1335 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1336 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1337 werden, Komparatoren ein.
1338
1339 Beispielsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1340 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1341 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1342 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1343 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1344 Komparatoren ein.
1345
1346 \begin{figure}
1347   \begin{center}
1348     \input{images/16-ec-from-bs32.tex}
1349   \end{center}
1350   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1351     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1352     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1353     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1354   \label{fig:16-ec-from-bs32}
1355 \end{figure}
1356
1357 \begin{figure}
1358   \begin{center}
1359     \input{images/16-ec-from-bs32-normalized.tex}
1360   \end{center}
1361   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1362     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1363     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1364     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1365   \label{fig:16-ec-from-bs32-normalized}
1366 \end{figure}
1367
1368 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1369 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1370 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1371 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1372 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1373 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1374 und das
1375 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1376 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1377 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1378 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1379 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1380 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1381 Netzwerks scheinen rein zufällig zu sein.
1382
1383 \begin{figure}
1384   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1385   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1386   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1387   % 63:MAX
1388   \begin{center}
1389     \input{images/32-ec-from-bs64.tex}
1390   \end{center}
1391   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1392     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1393     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1394     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1395     Schnittmuster ist
1396     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1397     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1398     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1399   \label{fig:32-ec-from-bs64}
1400 \end{figure}
1401
1402 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1403 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1404 konstruiert haben, kann demnach auch erreicht werden, wenn
1405 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1406 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1407 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1408 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1409 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1410 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1411 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1412 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1413 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1414 Verzögerung dieser Sortiernetzwerke gleich ist.
1415
1416 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1417 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1418 gute Schnittmuster anzugeben.
1419
1420 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1421 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1422 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1423 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1424 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1425 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1426 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1427 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1428 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1429
1430 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1431 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1432 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1433 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1434 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1435 $\operatorname{OET}(n-m)$-Netzwerk. 
1436
1437 \begin{figure}
1438   \begin{center}
1439     \input{images/16-ec-from-ps32.tex}
1440   \end{center}
1441   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1442     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1443     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1444     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1445   \label{fig:16-ec-from-ps32}
1446 \end{figure}
1447
1448 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1449
1450 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1451 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1452 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1453 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1454 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1455 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1456 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1457 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1458
1459 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1460 einsetzt und auch nicht auf einem Mischer basiert, ist der
1461 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1462 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1463 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1464 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1465 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1466
1467 \begin{displaymath}
1468 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1469   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1470    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1471         ? & \quad \mathrm{sonst}
1472   \end{array} \right.
1473 \end{displaymath}
1474
1475 \begin{figure}
1476   \begin{center}
1477     \input{images/32-pairwise-cut-16-pairwise.tex}
1478   \end{center}
1479   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1480   \label{fig:ps16-from-ps32}
1481 \end{figure}
1482
1483 \begin{figure}
1484   \begin{center}
1485     \input{images/16-pairwise.tex}
1486   \end{center}
1487   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1488   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1489   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1490   \label{fig:16-pairwise}
1491 \end{figure}
1492
1493 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1494 man $\operatorname{OES}(8)$ erhalten.
1495
1496 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1497
1498 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1499
1500 \begin{itemize}
1501   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1502   \item Wie gut kann man durch wegschneiden werden?
1503   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1504   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1505   Netzwerk / Knoten in der Markov-Kette?
1506   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1507 \end{itemize}
1508
1509 \newpage
1510 \section{Der \textsc{SN-Markov}-Algorithmus}
1511 \label{sect:markov}
1512
1513 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1514 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1515 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1516 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1517 verwendet und mit sich selbst kombiniert wird.
1518
1519 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1520 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1521 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1522 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1523 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1524 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1525
1526 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1527 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1528 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1529 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1530 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1531 selbst erzeugen kann.
1532
1533 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben, ist die Anzahl
1534 der \emph{unterschiedlichen} Schnittmuster und damit die Anzahl der Nachfolger
1535 sehr groß. Bei den untersuchten 16-Sortiernetzwerken lag die Anzahl der
1536 Nachfolger zwar noch unter 20000, bei den untersuchten 32-Sortiernetzwerken
1537 wurden jedoch bereits bis zu $2,6 \cdot 10^8$ unterschiedliche Schnittmuster
1538 geschätzt.
1539
1540 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1541 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1542 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1543 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1544 selbst und erhält so einen zufälligen Nachfolger. In Pseudocode lässt dich der
1545 Algorithmus wie folgt beschreiben:
1546
1547 \begin{verbatim}
1548 Netzwerk := Eingabe
1549
1550 für n Iterationen
1551 {
1552   Nachfolger := kombiniere (Netzwerk, Netzwerk)
1553   Netzwerk   := Nachfolger
1554 }
1555
1556 gib Netzwerk zurück
1557 \end{verbatim}
1558
1559 \begin{figure}
1560   \begin{center}
1561   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-cycles-16.pdf}
1562   \end{center}
1563   \caption{Zyklen, die beim \textit{Random Walk} des
1564   \textsc{SN-Markov}-Algorithmus detektiert wurden. Auf der x-Achse sind die
1565   Anzahl der Schritte, die \textsc{SN-Markov} zurückgelegt hat, auf der
1566   y-Achse die Längen der gefundenen Zyklen aufgetragen. Das initiale
1567   Start-Sortiernetzwerk war $\operatorname{OET}(16)$.}
1568   \label{fig:markov-cycles-16}
1569 \end{figure}
1570
1571
1572 \begin{itemize}
1573   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1574   \item Anzahl der erreichbaren Sortiernetzwerke.
1575   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1576     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1577 \end{itemize}
1578
1579 \begin{figure}
1580   \begin{center}
1581   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-12-pct.pdf}
1582   \end{center}
1583   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1584   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1585   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1586   \label{fig:markov-comparators-12}
1587 \end{figure}
1588
1589 \begin{figure}
1590   \begin{center}
1591   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-14-pct.pdf}
1592   \end{center}
1593   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1594   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1595   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1596   \label{fig:markov-comparators-14}
1597 \end{figure}
1598
1599 \begin{figure}
1600   \begin{center}
1601   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-16-pct.pdf}
1602   \end{center}
1603   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1604   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1605   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1606   \label{fig:markov-comparators-16}
1607 \end{figure}
1608
1609 \begin{figure}
1610   \begin{center}
1611   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-18-pct.pdf}
1612   \end{center}
1613   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 18~Leitungen),
1614   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1615   \emph{Gamma-Verteilung} $f(x - 81)$ mit $k = 10,724$ und $\theta = 0,766$.}
1616   \label{fig:markov-comparators-18}
1617 \end{figure}
1618
1619 \newpage
1620 \section{Empirische Beobachtungen}
1621
1622 \begin{itemize}
1623 \item So schnell konvergiert der Algorithmus.
1624 \item $\ldots$
1625 \end{itemize}
1626
1627 \newpage
1628 \section{Ausblick}
1629
1630 Das würde mir noch einfallen$\ldots$
1631
1632 \newpage
1633 \section{Implementierung}
1634
1635 So habe ich die ganzen Versuche durchgeführt.
1636
1637 \newpage
1638 \bibliography{references}
1639 \bibliographystyle{plain}
1640
1641 %\listoffigures
1642
1643 \end{document}
1644
1645 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :