Evolutionäre Algorithmen: Etwas zur Mutation geschrieben.
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{edge minimum} = [edge,color=blue!20]
56 \tikzstyle{edge maximum} = [edge,color=red!20]
57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
63 \tikzstyle{comp active minimum} = [comp]
64 \tikzstyle{comp active maximum} = [comp]
65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
69
70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
74
75 \maketitle
76 \begin{abstract}
77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
84 das hinbekomme bzw. Recht behalte.}
85 \end{abstract}
86 \newpage
87
88 \tableofcontents
89
90 \newpage
91 \section{Motivation und Einleitung}
92
93 \subsection{Motivation}\label{sect:motivation}
94
95 \begin{itemize}
96 \item Sortiernetzwerke sind toll, weil $\ldots$
97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
100 \end{itemize}
101
102 \subsection{Einleitung}\label{sect:einleitung}
103
104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
105
106 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
107 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
108 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
109 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
110 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
111 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
112
113 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
114 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
115 erhält man ein {\em Komparatornetzwerk}.
116
117 \begin{figure}
118 \begin{center}
119 \input{images/einfaches_komparatornetzwerk.tex}
120 \end{center}
121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
122 aus 5~Komparatoren.}
123 \label{fig:einfaches_komparatornetzwerk}
124 \end{figure}
125
126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
127 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
128 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
129 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
130 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
131 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
132 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
133 durch schwarze Punkte symbolisiert.
134
135 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
136 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
137 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
138 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
139 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
140
141 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
142 gleichzeitig angewandt werden. Das Beispiel in
143 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
144 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
145 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
146 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
147 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
148 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
149 benötigten parallelen Schritte darstellt.
150
151 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
152 erzeugen, die der Sortierung der Eingabe entspricht, heißen
153 \emph{Sortiernetzwerke}. Das in
154 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
155 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
156 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
157 zerstört.
158
159 \begin{figure}
160   \begin{center}
161     \input{images/09-e2-c24-allbut1.tex}
162   \end{center}
163   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
164   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
165   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
166   \label{fig:09-e2-c24-allbut1}
167 \end{figure}
168 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
169 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
170 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
171 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
172 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
173 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
174 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
175 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
176 nicht \emph{effizient} möglich.
177
178 Beispielsweise sortiert das Komparatornetzwerk in
179 Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880 möglichen
180 Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4, 8, 6)$
181 lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
182 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge
183 $(1, 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
184
185 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
186 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
187 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
188 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
189 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
190 ist.\footnote{1.307.674.368.000 Permutationen}
191
192 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
193 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
194 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
195 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
196 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
197 in der Ausgabe, die die Sortierbedingung verletzt:
198 \begin{displaymath}
199   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
200 \end{displaymath}
201 Die Eingabe kann mittels
202 \begin{displaymath}
203   \hat{e}_j = \left\{
204     \begin{array}{cl}
205       0 & e_j \leqq a_i \\
206       1 & e_j > a_i
207     \end{array} \right.
208 \end{displaymath}
209 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme von
210 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
211 Verhalten jedes einzelnen Komparators nicht, so dass die Annahme auf einen
212 Widerspruch geführt wird.
213
214 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
215 Komplexitätsklasse
216 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
217 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
218 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
219 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
220 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
221 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
222 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
223 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
224 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
225 beschäftigen.
226
227 \subsubsection{Evolutionäre Algorithmen}
228
229 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
230 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
231 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
232 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
233 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
234 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
235 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
236 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
237 praktikablen Zeitkonstanten gefunden werden.
238
239 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
240 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
241 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
242 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
243 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
244 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
245
246 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
247 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
248 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
249 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
250 als {\em Individuum} bezeichnet.
251
252 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
253 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
254 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
255 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
256 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
257 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
258 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
259 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
260 Gütefunktion}.
261
262 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
263 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
264 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
265 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
266 Algorithmen verwenden als einfache, initiale Lösung häufig das
267 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
268 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
269 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
270 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
271
272 Beim Aussuchen von zufälligen Lösungen aus der Population, der
273 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
274 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
275 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
276 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
277 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
278 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
279 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
280 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
281 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
282 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
283 findet er aber in der Regel bessere Lösungen.
284
285 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
286 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
287 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
288 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
289 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
290 zwischen verschiedenen Leitungszahlen stark unterscheiden.
291
292 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
293 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
294 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
295 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
296 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
297 „Ausbrechen“ und finden noch besserer Lösungen.
298
299 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
300 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
301 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
302 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
303 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
304 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
305
306 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
307 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
308 mutieren lediglich Transformationen von Sortiernetzwerken, die die
309 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
310 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
311 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
312
313 \newpage
314 \section{Bekannte konstruktive Sortiernetzwerke}
315 \label{sect:konstruktive_netzwerke}
316
317 Übersicht über bekannte konstruktive Sortiernetzwerke.
318
319 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
320 \label{sect:odd_even_transpositionsort}
321
322 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
323 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
324 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
325 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
326 ${n = 8}$ Leitungen.
327
328 \begin{figure}
329   \begin{center}
330     \input{images/oe-transposition-8.tex}
331   \end{center}
332   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
333   \label{fig:odd-even-transposition-08}
334 \end{figure}
335
336 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
337 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
338 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
339 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
340 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
341 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
342
343 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
344 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
345 Herausschneiden einer Leitung reduziert. In
346 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
347 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
348 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
349
350 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
351 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
352 Komparatoren anordnen lassen, effizient. Es benötigt
353 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
354 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
355 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
356 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
357
358 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
359 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
360 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
361 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
362 Algorithmen.
363
364 \subsection{Das bitone Mergesort-Netzwerk}
365
366 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
367 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
368 veröffentlicht wurde. Es ist deutlich effizienter als das
369 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
370 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
371 Schichten.
372
373 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
374 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
375 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
376 verleiht dem Sortiernetzwerk seinen Namen.
377
378 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
379 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
380 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
381
382 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
383
384 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
385 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
386 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
387 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
388 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
389 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
390 entstehen können. Die wichtigsten Varianten für das \emph{bitone
391 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
392 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
393 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
394 ist wichtig zu beachten, dass das letzte Element nicht größer
395 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
396 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
397 darf.
398
399 \begin{figure}
400   \centering
401   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
402   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
403   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
404   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
405   \caption{Beispiele bitoner Folgen.}
406   \label{fig:beispiel-biton}
407 \end{figure}
408
409 \begin{figure}
410   \centering
411   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
412   \qquad
413   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
414   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
415   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
416   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
417   resultierenden Teilfolgen sind wiederum biton.}
418   \label{fig:bitonic-merge-schema}
419 \end{figure}
420
421 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
422 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
423 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
424 sortiert, die Folge $V$ sei absteigend sortiert:
425 \begin{eqnarray}
426  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
427  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
428 \end{eqnarray}
429 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
430 Positionen verglichen und ggf. vertauscht:
431 \begin{equation}
432 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
433 \end{equation}
434 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
435 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
436 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
437 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
438 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
439 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
440 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
441 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
442 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
443 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
444 zeigt die Situationen vor und nach diesem Schritt des Mischers.
445
446 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
447 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
448 mithilfe des bitonen Mischers, mit zwei Instanzen von
449 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
450 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
451 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
452 definiert ist.
453
454 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
455 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
456 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
457 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
458 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
459 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
460 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
461
462 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
463 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
464 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
465 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
466 besteht, die in $\log(n)$~Schichten angeordnet werden können.
467
468 \subsubsection{Das bitone Mergesort-Netzwerk}
469
470 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
471 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
472 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
473 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
474 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
475 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
476 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
477 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
478 $\operatorname{BS}(2)$ identisch.
479
480 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
481 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
482 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
483 alle Komparatoren in die gleiche Richtung zeigen.
484
485 \begin{figure}
486   \begin{center}
487   \input{images/batcher-8.tex}
488   \end{center}
489   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
490   für acht Eingänge. Markiert sind die beiden Instanzen von
491   $\operatorname{BS}(4)$ (rot), die beiden bitonen
492   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
493   rekursiven Schritt hinzugefügt wurden (grün).}
494   \label{fig:bitonic-08}
495 \end{figure}
496
497 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
498 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
499 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
500 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
501 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
502 grün hinterlegt.
503
504 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
505 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
506 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
507 Schichten angeordnet sind.
508
509 %\begin{figure}
510 %\begin{center}
511 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
512 %\end{center}
513 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
514 %$S(n/2)$ und dem Mischer $M(n)$.}
515 %\label{fig:bms_rekursiver_aufbau}
516 %\end{figure}
517
518 \subsection{Das Odd-Even-Mergesort-Netzwerk}
519
520 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
521 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
522 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
523 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
524 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
525 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
526 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
527 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
528
529 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
530
531 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
532 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
533 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
534 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
535 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
536 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
537 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
538
539 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
540 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
541 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
542 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
543 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
544 \begin{equation}
545 w_i = \left\{ \begin{array}{ll}
546         u_i,     & i < n \\
547         v_{i-n}, & i \geqq n
548       \end{array} \right.,
549       \quad 0 \leqq i < N
550 \end{equation}
551
552 \begin{figure}
553   \begin{center}
554   \input{images/oe-merge.tex}
555   \end{center}
556   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
557   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
558   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
559   \label{fig:oe-merge}
560 \end{figure}
561
562 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
563 geraden Indizes und je eine Liste der ungeraden Indizes.
564 \begin{eqnarray}
565   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
566   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
567   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
568   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
569 \end{eqnarray}
570
571 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
572 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
573 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
574 Ausgang der Mischer die Folgen
575 \begin{eqnarray}
576   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
577   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
578 \end{eqnarray}
579 ergeben.
580
581 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
582 hinzugefügt,
583 \begin{equation}
584   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
585 \end{equation}
586 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
587 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
588
589 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
590 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
591 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
592 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
593 Aufbau lauten:
594 \begin{itemize}
595   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
596   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
597   einzelnen Komparator.
598 \end{itemize}
599
600 Dass die resultierende Folge sortiert ist, lässt sich mit dem
601 {\em 0-1-Prinzip} zeigen:
602 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
603 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
604 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
605 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
606 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
607 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
608 \begin{eqnarray}
609   \left|W_{\textrm{gerade}}\right|_0
610   &=& \left|U_{\textrm{gerade}}\right|_0
611     + \left|V_{\textrm{gerade}}\right|_0
612    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
613    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
614   \left|W_{\textrm{ungerade}}\right|_0
615   &=& \left|U_{\textrm{ungerade}}\right|_0
616     + \left|V_{\textrm{ungerade}}\right|_0
617    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
618    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
619 \end{eqnarray}
620 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
621 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
622 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
623 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
624 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
625 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
626 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
627 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
628
629 \begin{figure}
630   \centering
631   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
632   \qquad
633   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
634   \qquad
635   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
636   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
637   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
638   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
639   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
640   sortiert ist.}
641   \label{fig:oe-post-recursive}
642 \end{figure}
643
644 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
645 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
646 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
647 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
648 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
649
650 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
651 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
652 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
653 \begin{displaymath}
654   K(n,m) = \left\{ \begin{array}{ll}
655     nm, & \mathrm{falls} \quad nm \leqq 1 \\
656     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
657     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
658     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
659   \end{array} \right.
660 \end{displaymath}
661 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
662 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
663 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
664
665 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
666 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
667 Rekursionsschritt der OEM-Konstruktion fügt
668 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
669 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
670 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
671 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
672 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
673 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
674 \begin{displaymath}
675   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
676 \end{displaymath}
677 Komparatoren eingespart. Damit ergibt sich
678 \begin{displaymath}
679   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
680 \end{displaymath}
681 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
682 benötigt werden.
683
684 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
685
686 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
687 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
688 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
689 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
690 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
691 $\operatorname{OES}(n)$ aus
692 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
693 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
694 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
695 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
696 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
697 Komparatornetzwerke definiert sind.
698
699 \begin{figure}
700   \begin{center}
701   \input{images/oe-mergesort-8.tex}
702   \end{center}
703   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
704   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
705   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
706   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
707   Komparatoren zwischen benachbarten Leitungen (grün).}
708   \label{fig:odd-even-mergesort-08}
709 \end{figure}
710
711 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
712 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
713 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
714 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
715 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
716 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
717
718 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
719 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
720 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
721 \begin{displaymath}
722   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
723        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
724        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
725 \end{displaymath}
726 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
727 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
728 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
729
730 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
731 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
732 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
733 \begin{displaymath}
734   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
735 \end{displaymath}
736 gilt.
737
738 % gnuplot:
739 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
740 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
741 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
742
743 %\begin{itemize}
744 %\item Pairwise sorting-network
745 %\end{itemize}
746
747 \newpage
748 \section{Transformation von Sortiernetzwerken}
749 \label{sect:tranformation}
750
751 \subsection{Komprimieren}
752
753 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
754
755 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
756 gleichzeitig ausgewertet werden, wie bereits in
757 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
758 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
759 von \emph{Schichten} verstanden.
760
761 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
762 Komparatornetzwerken interessant. \dots
763
764 \subsection{Normalisieren}
765
766 \begin{figure}
767   \centering
768   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
769   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
770   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
771   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
772   intuitiven Konstruktion und die normalisierte Variante.}
773   \label{fig:beispiel_normalisieren}
774 \end{figure}
775
776 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
777 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
778 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
779 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
780 einen Algorithmus an.
781
782 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
783 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
784 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
785 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
786 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
787 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
788 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
789 Definition.
790
791 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
792 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
793 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
794 und das Trichtermuster zu sehen.
795
796 \subsection{Zwei Netzwerke kombinieren}
797
798 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
799 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
800 Sortiernetzwerk zusammenzufassen.
801
802 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
803 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
804 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
805 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
806 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
807 und Weise rekursiv aufgebaut.
808
809 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
810 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
811 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
812 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
813 zusammenfügen.
814
815 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
816 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
817 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
818 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
819 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
820 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
821
822 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
823 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
824 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
825 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
826 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
827 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
828 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
829 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
830 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
831 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
832 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
833 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
834 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
835 6~Komparatoren weniger.
836
837 % 9   9
838 % 9  18
839 % 9  27
840 % 9  36
841 % 9  45
842 % 8  53
843 % 8  61
844 % 7  68
845 % 7  75
846 % 6  81
847 % 5  86
848
849 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
850 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
851 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
852 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
853 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
854 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
855 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
856 nur mit exponentiellem Aufwand möglich ist.
857
858 %\begin{itemize}
859 %\item Mit dem Bitonic-Merge
860 %\item Mit dem Odd-Even-Merge
861 %\item Nach dem Pairwise sorting-network Schema.
862 %\end{itemize}
863
864 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
865
866 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
867 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
868 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
869 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
870 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
871 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
872
873 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
874 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
875 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
876 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
877 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
878 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
879 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
880 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
881 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
882 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
883 das {\em Odd-Even-Transpositionsort-Netzwerk}.
884
885 \begin{figure}
886   \centering
887   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
888   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
889   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
890   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
891   \caption{Eine Leitung wird aus dem
892   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
893   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
894   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
895   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
896   Pfad herausgetrennt werden. In der letzten Abbildung ist
897   $\operatorname{OET}(7)$ markiert.}
898   \label{fig:oe-transposition-cut}
899 \end{figure}
900
901 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
902 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
903 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
904 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
905 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
906 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
907 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
908 auf die keine Komparatoren mehr berührt
909 (Abbildung~\ref{fig:oe-transposition-cut1}).
910
911 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
912 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
913 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
914 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
915 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
916 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
917 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
918 mit $(n-1)$~Elementen darstellen.
919
920 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
921 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
922 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
923 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
924 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
925
926 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
927 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
928 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
929 Darstellung ergibt. Ausserdem ist das
930 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
931 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
932 Ausgabe und kann entfernt werden.
933
934 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
935 \label{sect:anzahl_schnittmuster}
936
937 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
938 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
939 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
940 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
941 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
942 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
943 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
944 \emph{$k$-Schnittmuster}.
945
946 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
947 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
948 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
949
950 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
951 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
952 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
953 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
954 ergeben sich insgesamt
955 \begin{equation}\label{eqn:anzahl_schnittmuster}
956   \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
957   \quad (n > m)
958 \end{equation}
959 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
960 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
961 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
962 führen beide Reihenfolgen zum selben Ergebnis.
963
964 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass es
965 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
966 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
967 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
968 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
969 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
970 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
971 der möglichen Schnittmuster:
972 \begin{displaymath}
973   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
974   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
975   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
976   \quad (1 \leqq k < n)
977 \end{displaymath}
978
979 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
980 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
981 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
982 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
983 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
984 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
985
986 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
987 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
988 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
989 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
990 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
991 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
992 Werte unterscheiden.
993
994 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
995 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
996 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
997 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
998 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
999 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1000 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1001 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1002
1003 \begin{figure}
1004   \begin{center}
1005     \includegraphics[viewport=0 0 360 216,width=15cm]{images/count-cuts-16.pdf}
1006   \end{center}
1007   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1008   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1009   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1010   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1011   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1012   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1013   \label{fig:count-cuts-16}
1014 \end{figure}
1015
1016 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1017 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1018 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1019 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1020 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
1021 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
1022 angewandt. Anschließend wurde mithilfe einer Hashtabelle überprüft, ob das
1023 resultierende Sortiernetzwerk schon von einem \emph{äquivalenten}
1024 Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk noch nicht in der
1025 Hashtabelle enthalten war, wurde der Zähler für unterschiedliche Schnittmuster
1026 erhöht und das Sortiernetzwerk eingefügt.
1027
1028 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1029 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1030 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1031 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1032 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1033 nahe ist.
1034
1035 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1036 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
1037 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
1038 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
1039 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
1040 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
1041 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
1042 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
1043 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1044 vernachlässigbar klein ist.
1045
1046 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1047 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1048 Die Hashtabelle benötigt mehr Arbeitsspeicher als in derzeitigen Rechnern
1049 vorhanden ist, bevor ein entsprechender Graph den linearen Bereich für
1050 „kleine“ x-Werte verlässt.
1051
1052 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1053 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1054 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1055 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1056 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
1057 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in
1058 $S$ enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1059 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1060 unterschiedlichen Schnittmuster abschätzen.
1061
1062 \begin{figure}
1063   \begin{center}
1064     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1065   \end{center}
1066   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1067   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1068   $\operatorname{BS}(32)$.}
1069   \label{fig:collisions-10000-1000000-32}
1070 \end{figure}
1071
1072 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1073 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1074 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1075 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1076 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1077 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1078 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1079 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1080 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1081 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1082 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1083
1084 \begin{figure}
1085   \begin{center}
1086     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1087   \end{center}
1088   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1089   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1090   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1091   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1092   unterschiedlichen Schnittmustern.}
1093   \label{fig:collisions-100000-1000000-32-ps}
1094 \end{figure}
1095
1096 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1097 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1098 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1099 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1100 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1101 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1102 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1103 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1104 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1105 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1106 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1107 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1108 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1109 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1110 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1111 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1112 die Anzahl der \emph{möglichen} Schnittmuster.
1113
1114 \newpage
1115 \section{Der \textsc{SN-Evolution}-Algorithmus}
1116
1117 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1118 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1119 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1120 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1121 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1122 in Abschnitt~\ref{sect:bewertung} behandelt.
1123
1124 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1125
1126 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1127 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1128 die bei Sortiernetzwerken verfolgt werden können:
1129 \begin{itemize}
1130   \item Möglichst wenige Komparatoren („billig“)
1131   \item Möglichst wenige Schichten („schnell“)
1132 \end{itemize}
1133
1134 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1135 billigste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
1136 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
1137 9~Schichten.
1138
1139 Eine Gütefunktion, die die beiden Ziele "`billig"' und "`schnell"'
1140 berücksichtigen kann, hat die folgende allgemeine Form:
1141 \begin{equation}
1142   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1143                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1144                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1145 \end{equation}
1146 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1147 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1148 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1149 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1150 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1151 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1152 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1153
1154 Da möglichst billige und schnelle Sortiernetzwerke gefunden werden sollen, ist
1155 ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert. Das
1156 heißt, dass das Ziel von \textsc{SN-Evolution} ist, $\operatorname{Guete}(S)$
1157 zu \emph{minimieren}.
1158
1159 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1160 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1161 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1162 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1163 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1164 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1165 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1166
1167 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1168 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1169 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1170 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1171 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1172
1173 \subsection{Selektion}
1174
1175 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1176 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1177 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1178 Streben des Algorithmus nach besseren Lösungen.
1179
1180 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1181 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1182 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1183
1184 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1185 Pseudocode wie folgt beschreiben:
1186 \begin{verbatim}
1187 Guetesumme := 0
1188 Auswahl := (leer)
1189
1190 fuer jedes Individuum in Population
1191 {
1192   reziproke Guete := 1.0 / Guete(Individuum)
1193   Wahrscheinlichkeit P := reziproke Guete / (reziproke Guete + Guetesumme)
1194   Guetesumme := Guetesumme + reziproke Guete
1195
1196   mit Wahrscheinlichkeit P
1197   {
1198     Auswahl := Individuum
1199   }
1200 }
1201 gebe Auswahl zurueck
1202 \end{verbatim}
1203
1204 \subsection{Rekombination}
1205
1206 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1207 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1208 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1209 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1210 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1211 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1212 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1213
1214 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1215 erhält.
1216
1217 \subsection{Mutation}
1218
1219 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1220 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1221 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1222 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1223 Eigenschaft zerstören.
1224
1225 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1226 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1227 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1228 Ausprobieren aller $2^n$~Bitmuster.
1229
1230 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1231 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1232 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1233 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1234 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1235
1236 \begin{itemize}
1237 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1238 Schichten, kobiniert)
1239 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1240 \end{itemize}
1241
1242 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1243 Abbildung~\ref{fig:evolutionary_08}.
1244
1245 \begin{figure}
1246 \begin{center}
1247 \input{images/evolutionary-08.tex}
1248 \end{center}
1249 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1250 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1251 \label{fig:evolutionary_08}
1252 \end{figure}
1253
1254 \begin{figure}
1255 \begin{center}
1256 \input{images/08-e2-1237993371.tex}
1257 \end{center}
1258 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1259 \label{fig:08-e2-1237993371}
1260 \end{figure}
1261
1262 \begin{figure}
1263 \begin{center}
1264 \input{images/09-e2-1237997073.tex}
1265 \end{center}
1266 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1267 \label{fig:09-e2-1237997073}
1268 \end{figure}
1269
1270 \begin{figure}
1271 \begin{center}
1272 \input{images/09-e2-1237999719.tex}
1273 \end{center}
1274 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1275 \label{fig:09-e2-1237999719}
1276 \end{figure}
1277
1278 \begin{figure}
1279 \begin{center}
1280 \input{images/10-e2-1239014566.tex}
1281 \end{center}
1282 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1283 \label{fig:10-e2-1239014566}
1284 \end{figure}
1285
1286 \subsection{Güte}
1287
1288 \begin{itemize}
1289 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1290 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1291 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1292 \end{itemize}
1293
1294 %\input{shmoo-aequivalenz.tex}
1295
1296 \newpage
1297 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1298 \label{sect:sn-evolution-cut}
1299
1300 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1301 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1302 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1303 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1304 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1305 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1306 gute Schnittmuster gesucht.
1307
1308 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1309 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1310 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1311 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1312 $0 \leqq r \leqq c$.
1313
1314 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1315 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1316 Schnitt-Richtung.
1317
1318 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1319
1320 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1321 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1322 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1323 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1324 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1325 werden, Komparatoren ein.
1326
1327 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1328 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1329 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1330 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1331 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1332 Komparatoren ein.
1333
1334 \begin{figure}
1335   \begin{center}
1336     \input{images/16-ec-from-bs32.tex}
1337   \end{center}
1338   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1339     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1340     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1341     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1342   \label{fig:16-ec-from-bs32}
1343 \end{figure}
1344
1345 \begin{figure}
1346   \begin{center}
1347     \input{images/16-ec-from-bs32-normalized.tex}
1348   \end{center}
1349   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1350     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1351     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1352     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1353   \label{fig:16-ec-from-bs32-normalized}
1354 \end{figure}
1355
1356 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1357 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1358 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1359 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1360 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1361 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1362 und das
1363 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1364 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1365 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1366 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1367 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1368 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1369 Netzwerks scheinen rein zufällig zu sein.
1370
1371 \begin{figure}
1372   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1373   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1374   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1375   % 63:MAX
1376   \begin{center}
1377     \input{images/32-ec-from-bs64.tex}
1378   \end{center}
1379   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1380     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1381     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1382     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1383     Schnittmuster ist
1384     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1385     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1386     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1387   \label{fig:32-ec-from-bs64}
1388 \end{figure}
1389
1390 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1391 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1392 konstruiert haben, kann demnach auch erreicht werden, wenn
1393 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1394 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1395 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1396 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1397 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1398 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1399 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1400 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1401 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1402 Verzögerung dieser Sortiernetzwerke gleich ist.
1403
1404 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1405 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1406 gute Schnittmuster anzugeben.
1407
1408 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1409 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1410 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1411 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1412 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1413 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1414 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1415 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1416 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1417
1418 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1419 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1420 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1421 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1422 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1423 $\operatorname{OET}(n-m)$-Netzwerk. 
1424
1425 \begin{figure}
1426   \begin{center}
1427     \input{images/16-ec-from-ps32.tex}
1428   \end{center}
1429   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1430     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1431     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1432     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1433   \label{fig:16-ec-from-ps32}
1434 \end{figure}
1435
1436 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1437
1438 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1439 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1440 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1441 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1442 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1443 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1444 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1445 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1446
1447 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1448 einsetzt und auch nicht auf einem Mischer basiert, ist der
1449 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1450 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1451 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1452 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1453 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1454
1455 \begin{displaymath}
1456 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1457   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1458    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1459         ? & \quad \mathrm{sonst}
1460   \end{array} \right.
1461 \end{displaymath}
1462
1463 \begin{figure}
1464   \begin{center}
1465     \input{images/32-pairwise-cut-16-pairwise.tex}
1466   \end{center}
1467   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1468   \label{fig:ps16-from-ps32}
1469 \end{figure}
1470
1471 \begin{figure}
1472   \begin{center}
1473     \input{images/16-pairwise.tex}
1474   \end{center}
1475   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1476   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1477   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1478   \label{fig:16-pairwise}
1479 \end{figure}
1480
1481 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1482 man $\operatorname{OES}(8)$ erhalten.
1483
1484 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1485
1486 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1487
1488 \begin{itemize}
1489   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1490   \item Wie gut kann man durch wegschneiden werden?
1491   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1492   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1493   Netzwerk / Knoten in der Markov-Kette?
1494   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1495 \end{itemize}
1496
1497 \newpage
1498 \section{Der \textsc{SN-Markov}-Algorithmus}
1499 \label{sect:markov}
1500
1501 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1502 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1503 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1504 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1505 verwendet und mit sich selbst kombiniert wird.
1506
1507 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1508 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1509 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1510 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1511 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1512 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1513
1514 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1515 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1516 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1517 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1518 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1519 selbst erzeugen kann.
1520
1521 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1522 (unterschiedlicher) Schnittmuster und damit die Anzahl der Nachfolger sehr
1523 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1524 zu
1525 \begin{displaymath}
1526   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1527 \end{displaymath}
1528 Nachfolger.
1529
1530 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1531 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1532 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1533 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1534 selbst und erhält so einen zufälligen Nachfolger.
1535
1536 \begin{itemize}
1537   \item $n \leftarrow \mathrm{Input}$
1538   \item \texttt{while} \textit{true}
1539   \begin{itemize}
1540     \item $n \leftarrow \operatorname{recombine} (n, n)$
1541   \end{itemize}
1542 \end{itemize}
1543
1544 \begin{itemize}
1545   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1546   \item Anzahl der erreichbaren Sortiernetzwerke.
1547   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1548     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1549 \end{itemize}
1550
1551 \begin{figure}
1552   \begin{center}
1553   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1554   \end{center}
1555   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1556   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1557   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1558   \label{fig:markov-comparators-12}
1559 \end{figure}
1560
1561 \begin{figure}
1562   \begin{center}
1563   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1564   \end{center}
1565   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1566   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1567   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1568   \label{fig:markov-comparators-14}
1569 \end{figure}
1570
1571 \begin{figure}
1572   \begin{center}
1573   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1574   \end{center}
1575   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1576   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1577   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1578   \label{fig:markov-comparators-16}
1579 \end{figure}
1580
1581 \newpage
1582 \section{Empirische Beobachtungen}
1583
1584 \begin{itemize}
1585 \item So schnell konvergiert der Algorithmus.
1586 \item $\ldots$
1587 \end{itemize}
1588
1589 \newpage
1590 \section{Ausblick}
1591
1592 Das würde mir noch einfallen$\ldots$
1593
1594 \newpage
1595 \section{Implementierung}
1596
1597 So habe ich die ganzen Versuche durchgeführt.
1598
1599 \newpage
1600 \bibliography{references}
1601 \bibliographystyle{plain}
1602
1603 %\listoffigures
1604
1605 \end{document}
1606
1607 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :