sn-evolution-cut ausgebaut.
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{edge minimum} = [edge,color=blue!20]
56 \tikzstyle{edge maximum} = [edge,color=red!20]
57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
63 \tikzstyle{comp active minimum} = [comp]
64 \tikzstyle{comp active maximum} = [comp]
65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
69
70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
74
75 \maketitle
76 \begin{abstract}
77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
84 das hinbekomme bzw. Recht behalte.}
85 \end{abstract}
86 \newpage
87
88 \tableofcontents
89 \newpage
90
91 \section{Motivation und Einleitung}
92
93 \subsection{Motivation}\label{sect:motivation}
94
95 \begin{itemize}
96 \item Sortiernetzwerke sind toll, weil $\ldots$
97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
100 \end{itemize}
101
102 \subsection{Einleitung}\label{sect:einleitung}
103
104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
105
106 {\em Komparatoren} sind die Bausteine, die {\em Sortiernetzwerken} zugrunde
107 liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten können.
108 Ausserdem besitzt ein {\em Komparator} zwei Ausgänge, die im Gegensatz zu den
109 Eingängen unterscheidbar sind: Die grö"sere der beiden Zahlen wird immer auf
110 dem einen, die kleinere der beiden Zahlen immer auf dem anderen Ausgang
111 ausgegeben.
112
113 Wenn man nun mehrere {\em Komparatoren} miteinander kombiniert, also die
114 Ausgänge von Komparatoren mit dem Eingängen anderer Komparatoren verbindet,
115 erhält man ein {\em Komparatornetzwerk}.
116
117 \begin{figure}
118 \begin{center}
119 \input{images/einfaches_komparatornetzwerk.tex}
120 \end{center}
121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
122 aus 5~Komparatoren.}
123 \label{fig:einfaches_komparatornetzwerk}
124 \end{figure}
125
126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
127 Komparatornetzwerk aus fünf Komparatoren in der üblichen Darstellungsweise:
128 Die horizontalen Linien stellen Leitungen von den Eingängen auf der linken
129 Seite zu den Ausgängen auf er rechten Seite dar. Die vertikalen Pfeile
130 symbolisieren die Komparatoren, die die Werte "`auf den Leitungen"'
131 vergleichen und ggf. vertauschen. Nach einem Komparator befindet sich die
132 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
133 befindet sich auf der Leitung auf der der Pfeil seinen Ursprung hat.
134
135 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
136 gleichzeitig angewandt werden. Das Beispiel in
137 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
138 vergleicht in einem ersten Schritt die zwei oberen und die zwei unteren
139 Leitungen gleichzeitig. Eine Gruppe von Komparatoren, die gleichzeitig
140 angewendet werden können, nennt man eine \emph{Schicht} des
141 Komparatornetwerks. Die \emph{Verzögerung} eines Komparatornetzwerks ist
142 gleichbedeutend mit der Anzahl der Schichten, in die sich die Komparatoren
143 mindestens gruppieren lassen, da sie die Anzahl der benötigten parallelen
144 Schritte darstellt.
145
146 Komparatornetzwerke, die für jede beliebige Eingabepermutation eine
147 Ausgabe erzeugen, die der Sortierung der Eingabe entspricht, heißen 
148 {\em Sortiernetzwerke}. Das in
149 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
150 ist kein Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ würde zur Ausgabe
151 ${(2, 1, 3, 4)}$ führen -- die bestehenden Sortierung wird also sogar
152 zerstört.
153
154 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft
155 {\em nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich.
156 Dieses Gegenbeispiel zu finden ist allerdings aufwendig.
157
158 \todo{Wie findet man die Gegenbeispiele? Die {\em Entscheidung}, ob ein
159 Netzwerk sortiert, ist doch NP-vollständig, also müsste doch das Finden eines
160 Gegenbeispiels im Allgemeinen auch exponentialle Laufzeit haben..?}
161 \todo{Wenn die {\em Entscheidung}, ob ein Netzwerk sortiert, NP-vollständig
162 ist, müsse man dann nicht einen Zeugen für die Sortiereigenschaft angeben
163 können?}
164
165 \todo{$0-1$-Prinzip}
166
167 Um zu überprüfen, ob ein gegebenes Komparatornetzwerk die Sortiereigenschaft
168 besetzt, müssen nicht alle $n!$ Permutationen von $n$~unterschiedlichen Zahlen
169 ausprobieren. Stattdessen reicht es zu überprüfen, dass das Netzwerk alle
170 $2^n$~0-1-Folgen sortiert.
171
172 Sortiernetzwerke:
173 \begin{itemize}
174 \item Ein Komparator-Netzwerk ist $\ldots$
175 \item Ein Komparator-Netzwerk ist ein Sortiernetzwerk, wenn $\ldots$
176 \item Die Frage nach der Sortiereigenschaft ist NP-vollständig.
177 \end{itemize}
178
179 \subsubsection{Evolutionäre Algorithmen}
180
181 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
182 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
183 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
184 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
185 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
186 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
187 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
188 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
189 praktikablen Zeitkonstanten gefunden werden.
190
191 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
192 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
193 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
194 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
195 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
196 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
197
198 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
199 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
200 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
201 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
202 als {\em Individuum} bezeichnet.
203
204 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
205 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
206 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
207 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
208 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
209 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
210 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
211 werden bessere Lösungen bevorzugt. Zur Bewertung die die sogenannte {\em
212 Gütefunktion}.
213
214 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
215 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
216 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
217 es oft einfach ist {\em irgendeine} Lösung anzugeben. Zum anderen muss eine
218 Methode für die Rekombination existieren. Das insbesondere dann problematisch
219 wenn {\em Nebenbedingungen} eingehalten werden müssen.
220
221 \begin{itemize}
222 \item Unter einem "`Evolutionären Algorithmus"' versteht man $\ldots$
223 \item Da die Sortiereigenschaft zu überprüfen NP-schwer ist, ist die
224 Mutation \textit{(vermutlich)} nicht (effizient) möglich.
225 \end{itemize}
226
227 \section{Bekannte konstruktive Sortiernetzwerke}
228
229 Übersicht über bekannte konstruktive Sortiernetzwerke.
230
231 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
232 \label{sect:odd_even_transpositionsort}
233
234 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
235 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
236 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
237 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
238 ${n = 8}$ Leitungen.
239
240 \begin{figure}
241   \begin{center}
242     \input{images/oe-transposition-8.tex}
243   \end{center}
244   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
245   \label{fig:odd-even-transposition-08}
246 \end{figure}
247
248 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
249 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
250 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
251 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
252 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
253 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
254
255 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
256 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
257 Herausschneiden einer Leitung reduziert. In
258 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
259 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
260 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
261
262 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
263 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
264 Komparatoren anordnen lassen, effizient. Es benötigt
265 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
266 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
267 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
268 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
269
270 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
271 folgenden Algorithmen benötigen ein (einfaches) Sortiernetzwerk als
272 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
273 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
274 Algorithmen.
275
276 \subsection{Das bitone Mergesort-Netzwerk}
277
278 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
279 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
280 veröffentlicht wurde. Es ist deutlich effizienter als das
281 Odd-Even-Transporitionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
282 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
283 Schichten.
284
285 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
286 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
287 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
288 verleiht dem Sortiernetzwerk seinen Namen.
289
290 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
291 Instanzen des Netzwerks, deren Leitungszahl eine Zweierpotenz ist,
292 $\operatorname{BS}(n = 2^t)$.
293
294 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
295
296 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
297 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
298 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
299 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
300 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
301 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
302 entstehen können. Die wichtigsten Varianten für das \emph{bitone
303 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
304 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
305 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
306 ist wichtig zu beachten, dass das letzte Element nicht größer
307 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
308 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
309 darf.
310
311 \begin{figure}
312   \centering
313   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
314   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
315   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
316   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
317   \caption{Beispiele bitoner Folgen.}
318   \label{fig:beispiel-biton}
319 \end{figure}
320
321 \begin{figure}
322   \centering
323   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
324   \qquad
325   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
326   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
327   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
328   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
329   resultierenden Teilfolgen sind wiederum biton.}
330   \label{fig:bitonic-merge-schema}
331 \end{figure}
332
333 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
334 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
335 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
336 sortiert, die Folge $V$ sei absteigend sortiert:
337 \begin{eqnarray}
338  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
339  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
340 \end{eqnarray}
341 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
342 Positionen verglichen und ggf. vertauscht:
343 \begin{equation}
344 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
345 \end{equation}
346 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
347 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
348 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
349 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
350 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
351 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
352 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
353 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
354 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
355 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
356 zeigt die Situationen vor und nach diesem Schritt des Mischers.
357
358 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
359 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
360 mithilfe des bitonen Mischers, mit zwei Instanzen von
361 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
362 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
363 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
364 definiert ist.
365
366 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
367 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
368 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
369 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
370 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
371 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
372 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
373
374 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
375 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
376 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
377 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
378 besteht, die in $\log(n)$~Schichten angeordnet werden können.
379
380 \subsubsection{Das bitone Mergesort-Netzwerk}
381
382 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
383 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
384 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
385 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
386 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
387 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
388 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
389 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
390 $\operatorname{BS}(2)$ identisch.
391
392 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
393 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
394 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
395 alle Komparatoren in die gleiche Richtung zeigen.
396
397 \begin{figure}
398   \begin{center}
399   \input{images/batcher-8.tex}
400   \end{center}
401   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
402   für acht Eingänge. Markiert sind die beiden Instanzen von
403   $\operatorname{BS}(4)$ (rot), die beiden bitonen
404   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
405   rekursiven Schritt hinzugefügt wurden (grün).}
406   \label{fig:bitonic-08}
407 \end{figure}
408
409 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
410 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
411 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
412 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
413 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
414 grün hinterlegt.
415
416 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
417 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
418 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
419 Schichten angeordnet sind.
420
421 %\begin{figure}
422 %\begin{center}
423 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
424 %\end{center}
425 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
426 %$S(n/2)$ und dem Mischer $M(n)$.}
427 %\label{fig:bms_rekursiver_aufbau}
428 %\end{figure}
429
430 \subsection{Das Odd-Even-Mergesort-Netzwerk}
431
432 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
433 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
434 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
435 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
436 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
437 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
438 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
439 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
440
441 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
442
443 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
444 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
445 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
446 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
447 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
448 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
449 Umständen mehr Schichten als der \emph{bitone Mischer}.\footnote{Knuth,
450 “Bitonic Sorting”, Seite~230}
451
452 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
453 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
454 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
455 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
456 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
457 \begin{equation}
458 w_i = \left\{ \begin{array}{ll}
459         u_i,     & i < n \\
460         v_{i-n}, & i \geqq n
461       \end{array} \right.,
462       \quad 0 \leqq i < N
463 \end{equation}
464
465 \begin{figure}
466   \begin{center}
467   \input{images/oe-merge.tex}
468   \end{center}
469   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
470   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
471   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
472   \label{fig:oe-merge}
473 \end{figure}
474
475 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
476 geraden Indizes und je eine Liste der ungeraden Indizes.
477 \begin{eqnarray}
478   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
479   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
480   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
481   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
482 \end{eqnarray}
483
484 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
485 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
486 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
487 Ausgang der Mischer die Folgen
488 \begin{eqnarray}
489   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
490   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
491 \end{eqnarray}
492 ergeben.
493
494 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
495 hinzugefügt,
496 \begin{equation}
497   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
498 \end{equation}
499 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
500 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
501
502 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
503 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
504 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
505 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
506 Aufbau lauten:
507 \begin{itemize}
508   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
509   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
510   einzelnen Komparator.
511 \end{itemize}
512
513 Dass die resultierende Folge sortiert ist, lässt sich mit dem
514 {\em 0-1-Prinzip} zeigen:
515 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
516 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
517 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
518 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
519 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
520 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
521 \begin{eqnarray}
522   \left|W_{\textrm{gerade}}\right|_0
523   &=& \left|U_{\textrm{gerade}}\right|_0
524     + \left|V_{\textrm{gerade}}\right|_0
525    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
526    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
527   \left|W_{\textrm{ungerade}}\right|_0
528   &=& \left|U_{\textrm{ungerade}}\right|_0
529     + \left|V_{\textrm{ungerade}}\right|_0
530    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
531    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
532 \end{eqnarray}
533 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
534 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
535 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
536 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
537 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
538 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
539 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
540 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
541
542 \begin{figure}
543   \centering
544   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
545   \qquad
546   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
547   \qquad
548   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
549   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
550   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
551   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
552   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
553   sortiert ist.}
554   \label{fig:oe-post-recursive}
555 \end{figure}
556
557 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
558 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
559 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
560 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
561 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
562
563 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
564 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
565 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
566 \begin{displaymath}
567   K(n,m) = \left\{ \begin{array}{ll}
568     nm, & \mathrm{falls} \quad nm \leqq 1 \\
569     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
570     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
571     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
572   \end{array} \right.
573 \end{displaymath}
574 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
575 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
576 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
577
578 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
579 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
580 Rekursionsschritt der OEM-Konstruktion fügt
581 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
582 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
583 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
584 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
585 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
586 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
587 \begin{displaymath}
588   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
589 \end{displaymath}
590 Komparatoren eingespart. Damit ergibt sich
591 \begin{displaymath}
592   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
593 \end{displaymath}
594 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
595 benötigt werden.
596
597 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
598
599 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht, --~wie
600 das \emph{bitonen Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
601 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
602 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
603 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
604 $\operatorname{OES}(n)$ aus
605 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
606 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
607 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
608 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
609 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
610 Komparatornetzwerke definiert sind.
611
612 \begin{figure}
613   \begin{center}
614   \input{images/oe-mergesort-8.tex}
615   \end{center}
616   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
617   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
618   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
619   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
620   Komparatoren zwischen benachbarten Leitungen (grün).}
621   \label{fig:odd-even-mergesort-08}
622 \end{figure}
623
624 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
625 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
626 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
627 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
628 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
629 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
630
631 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
632 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
633 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
634 \begin{displaymath}
635   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
636        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
637        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
638 \end{displaymath}
639 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
640 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
641 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
642
643 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
644 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{K.~Batcher}
645 zeigt in seiner Arbeit\footnote{\todo{Referenz!}}, dass in diesem Fall
646 \begin{displaymath}
647   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
648 \end{displaymath}
649 gilt.
650
651 % gnuplot:
652 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
653 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
654 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
655
656 %\begin{itemize}
657 %\item Pairwise sorting-network
658 %\end{itemize}
659
660 \section{Transformation von Sortiernetzwerken}
661
662 \subsection{Komprimieren}
663
664 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
665
666 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
667 gleichzeitig ausgewertet werden, wie bereits in
668 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
669 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
670 von \emph{Schichten} verstanden.
671
672 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
673 Komparatornetzwerken interessant. \dots
674
675 \subsection{Normalisieren}
676
677 \begin{figure}
678   \centering
679   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
680   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
681   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
682   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
683   intuitiven Konstruktion und die normalisierte Variante.}
684   \label{fig:beispiel_normalisieren}
685 \end{figure}
686
687 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
688 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
689 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
690 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
691 einen Algorithmus an.
692
693 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
694 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
695 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
696 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
697 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
698 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
699 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
700 Definition.
701
702 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
703 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
704 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
705 und das Trichtermuster zu sehen.
706
707 \subsection{Zwei Netzwerke kombinieren}
708
709 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
710 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
711 Sortiernetzwerk zusammenzufassen.
712
713 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
714 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
715 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
716 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
717 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
718 und Weise rekursiv aufgebaut.
719
720 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
721 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
722 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
723 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
724 zusammenfügen.
725
726 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
727 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
728 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
729 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
730 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
731 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
732
733 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
734 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
735 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
736 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
737 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
738 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
739 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
740 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
741 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
742 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
743 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Baddar} und
744 \textit{Batcher} in ihrer Arbeit „An 11-Step Sorting Network for 18~Elements“
745 vorstellen, benötigt aber 6~Komparatoren weniger.
746
747 % 9   9
748 % 9  18
749 % 9  27
750 % 9  36
751 % 9  45
752 % 8  53
753 % 8  61
754 % 7  68
755 % 7  75
756 % 6  81
757 % 5  86
758
759 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
760 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
761 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
762 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
763 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
764 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
765 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
766 nur mit exponentiellem Aufwand möglich ist.
767
768 %\begin{itemize}
769 %\item Mit dem Bitonic-Merge
770 %\item Mit dem Odd-Even-Merge
771 %\item Nach dem Pairwise sorting-network Schema.
772 %\end{itemize}
773
774 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
775
776 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
777 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
778 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
779 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
780 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
781 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
782
783 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
784 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
785 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
786 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
787 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
788 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
789 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
790 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
791 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
792 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
793 das {\em Odd-Even-Transpositionsort-Netzwerk}.
794
795 \begin{figure}
796   \centering
797   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
798   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
799   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
800   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
801   \caption{Eine Leitung wird aus dem
802   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
803   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
804   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
805   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
806   Pfad herausgetrennt werden. In der letzten Abbildung ist
807   $\operatorname{OET}(7)$ markiert.}
808   \label{fig:oe-transposition-cut}
809 \end{figure}
810
811 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
812 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
813 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
814 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
815 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
816 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
817 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
818 auf die keine Komparatoren mehr berührt
819 (Abbildung~\ref{fig:oe-transposition-cut1}).
820
821 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
822 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
823 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
824 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
825 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
826 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
827 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
828 mit $(n-1)$~Elementen darstellen.
829
830 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
831 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
832 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
833 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
834 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
835
836 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
837 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
838 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
839 Darstellung ergibt. Ausserdem ist das
840 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
841 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
842 Ausgabe und kann entfernt werden.
843
844 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
845 \label{sect:anzahl_schnittmuster}
846
847 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
848 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
849 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können wir auf diese Art und
850 Weise einen Sortiernetzwerk mit $2n$~Eingängen wieder auf ein Sortiernetzwerk
851 mit $n$~Eingängen reduzieren. Das Anwenden mehrerer Minimum- und
852 Maximum-Schnitte bezeichnen wir als \emph{Schnittmuster}.
853
854 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
855 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
856 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
857
858 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
859 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
860 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
861 ein $n$-Sortiernetzwerk auf ein $m$-Sortiernetzwerk zu reduzieren, ergeben
862 sich insgesamt
863 \begin{displaymath}
864   \prod_{i=n}^{m+1} 2i = 2^{n-m} \frac{n!}{m!}
865   \quad (n > m)
866 \end{displaymath}
867 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
868 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
869 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
870 führen beide Reihenfolgen zum selben Ergebnis.
871
872 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass
873 es möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise
874 Maximum vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster
875 reduziert, die Menge der so erzeugbaren Sortiernetzwerke bleibt aber
876 unverändert. Die Anzahl der möglichen Schnittmuster setzt sich zusammen aus
877 der Anzahl von Möglichkeiten, $n-m$~Leitungen aus $n$ Leitungen auszuwählen,
878 und die möglichen Minimum-~/ Maximum-Muster. Damit ergibt sich folgende
879 Formel für die Anzahl der Schnittmuster:
880 \begin{displaymath}
881   2^{n-m} \cdot \left( \begin{array}{c} n \\ n-m \end{array} \right)
882   = 2^{n-m} \cdot \frac{n!}{(n-m)! m!}
883   = 2^{n-m} \cdot \frac{n!}{m!} \cdot \frac{1}{(n-m)!}
884   \quad (n > m)
885 \end{displaymath}
886
887 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
888 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
889 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
890 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
891 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
892 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
893
894 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
895 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
896 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
897 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
898 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
899 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
900 Werte unterscheiden.
901
902 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
903 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
904 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
905 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
906 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
907 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
908 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
909 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
910
911 \subsubsection{Der \textsc{SN-Evolution-Cut}-Algorithmus}
912 \label{sect:sn-evolution-cut}
913
914 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
915 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
916 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
917 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
918 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
919 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
920 gute Schnittmuster gesucht.
921
922 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
923 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
924 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
925 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
926 $0 \leqq r \leqq c$.
927
928 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
929 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
930 Schnitt-Richtung.
931
932 % bitones Mergesort-Netzwerk
933
934 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
935 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
936 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
937 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
938 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
939 werden, Komparatoren ein.
940
941 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
942 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
943 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
944 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
945 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
946 Komparatoren ein.
947
948 \begin{figure}
949   \begin{center}
950     \input{images/16-ec-from-bs32.tex}
951   \end{center}
952   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
953     10~Schichten. Das Netzwerk wurde von dem Algorithmus
954     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
955     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
956   \label{fig:16-ec-from-bs32}
957 \end{figure}
958
959 \begin{figure}
960   \begin{center}
961     \input{images/16-ec-from-bs32-normalized.tex}
962   \end{center}
963   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
964     10~Schichten. Das Netzwerk wurde von dem Algorithmus
965     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
966     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
967   \label{fig:16-ec-from-bs32-normalized}
968 \end{figure}
969
970 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
971 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
972 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
973 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
974 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
975 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
976 und das
977 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
978 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
979 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
980 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
981 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
982 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
983 Netzwerks scheinen rein zufällig zu sein.
984
985 \begin{figure}
986   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
987   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
988   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
989   % 63:MAX
990   \begin{center}
991     \input{images/32-ec-from-bs64.tex}
992   \end{center}
993   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
994     15~Schichten. Das Netzwerk wurde von dem Algorithmus
995     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
996     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
997     Schnittmuster ist
998     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
999     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1000     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1001   \label{fig:32-ec-from-bs64}
1002 \end{figure}
1003
1004 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1005 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1006 konstruiert haben, kann demnach auch erreicht werden, wenn
1007 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1008 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1009 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1010 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1011 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1012 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1013 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1014 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1015 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1016 Verzögerung dieser Sortiernetzwerke gleich ist.
1017
1018 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1019 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1020 gute Schnittmuster anzugeben.
1021
1022 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1023 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1024 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1025 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1026 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1027 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1028 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1029 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1030 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1031
1032
1033
1034 % Odd-Even-Transpositionsort-Netzwerk
1035
1036 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1037 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1038 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1039 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1040 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1041 $\operatorname{OET}(n-m)$-Netzwerk. 
1042
1043 \begin{figure}
1044   \begin{center}
1045     \input{images/16-ec-from-ps32.tex}
1046   \end{center}
1047   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1048     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1049     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1050     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1051   \label{fig:16-ec-from-ps32}
1052 \end{figure}
1053
1054 % Pairwise-Sorting-Netzwerk
1055
1056 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1057 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1058 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1059 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1060 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1061 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1062 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1063 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1064
1065 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1066 einsetzt und auch nicht auf einem Mischer basiert, ist der
1067 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1068 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1069 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1070 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1071 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1072
1073 \begin{displaymath}
1074 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1075   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1076    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1077         ? & \quad \mathrm{sonst}
1078   \end{array} \right.
1079 \end{displaymath}
1080
1081 \begin{figure}
1082   \begin{center}
1083     \input{images/32-pairwise-cut-16-pairwise.tex}
1084   \end{center}
1085   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1086   \label{fig:ps16-from-ps32}
1087 \end{figure}
1088
1089 \begin{figure}
1090   \begin{center}
1091     \input{images/16-pairwise.tex}
1092   \end{center}
1093   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1094   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1095   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1096   \label{fig:16-pairwise}
1097 \end{figure}
1098
1099 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1100 man $\operatorname{OES}(8)$ erhalten.
1101
1102 % Odd-Even-Mergesort-Netzwerk
1103
1104 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1105
1106 \begin{itemize}
1107   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1108   \item Wie gut kann man durch wegschneiden werden?
1109   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1110   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1111   Netzwerk / Knoten in der Markov-Kette?
1112   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1113 \end{itemize}
1114
1115 \section{Der \textsc{SN-Evolution}-Algorithmus}
1116
1117 Um einen evolutionären Algorithmus für Sortiernetzwerke zu entwickeln, werden
1118 die vorgestellten Methoden kombiniert.
1119
1120 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1121
1122 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1123 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1124 die interessant sind:
1125 \begin{itemize}
1126   \item Möglichst wenige Komparatoren ("`klein"')
1127   \item Möglichst wenige Schichten ("`schnell"')
1128 \end{itemize}
1129
1130 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1131 kleinste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
1132 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
1133 9~Schichten.
1134
1135 Eine Gütefunktion, die die beiden Ziele "`klein"' und "`schnell"'
1136 berücksichtigen kann, hat die folgende allgemeine Form:
1137 \begin{equation}
1138   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1139                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1140                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1141 \end{equation}
1142 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1143 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1144 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1145 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1146 jegliche Ergebnisse sind dann rein zufälliger Natur.
1147
1148 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1149 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1150 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1151 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1152 klein, in Abhängigkeit von den anderen beiden Parametern sind auch negative
1153 Werte möglich, werden die relativen Unterschiede groß. Dadurch wird die {\em
1154 Exploitation}, das Finden lokaler Optima, bevorzugt.
1155
1156 \subsection{Selektion}
1157
1158 ...
1159
1160 \subsection{Rekombination}
1161
1162 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1163 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1164 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1165 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1166 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1167 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1168 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1169
1170 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1171 erhält.
1172
1173 \subsection{Mutation}
1174
1175 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1176 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1177 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1178 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1179 Eigenschaft zerstören.
1180
1181 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1182 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1183 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1184 Ausprobieren aller $2^n$~Bitmuster.
1185
1186 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1187 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1188 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1189 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1190 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1191
1192 \begin{itemize}
1193 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1194 Schichten, kobiniert)
1195 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1196 \end{itemize}
1197
1198 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1199 Abbildung~\ref{fig:evolutionary_08}.
1200
1201 \begin{figure}
1202 \begin{center}
1203 \input{images/evolutionary-08.tex}
1204 \end{center}
1205 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1206 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1207 \label{fig:evolutionary_08}
1208 \end{figure}
1209
1210 \begin{figure}
1211 \begin{center}
1212 \input{images/08-e2-1237993371.tex}
1213 \end{center}
1214 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1215 \label{fig:08-e2-1237993371}
1216 \end{figure}
1217
1218 \begin{figure}
1219 \begin{center}
1220 \input{images/09-e2-1237997073.tex}
1221 \end{center}
1222 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1223 \label{fig:09-e2-1237997073}
1224 \end{figure}
1225
1226 \begin{figure}
1227 \begin{center}
1228 \input{images/09-e2-1237999719.tex}
1229 \end{center}
1230 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1231 \label{fig:09-e2-1237999719}
1232 \end{figure}
1233
1234 \begin{figure}
1235 \begin{center}
1236 \input{images/10-e2-1239014566.tex}
1237 \end{center}
1238 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1239 \label{fig:10-e2-1239014566}
1240 \end{figure}
1241
1242 \subsection{Güte}
1243
1244 \begin{itemize}
1245 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1246 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1247 \end{itemize}
1248
1249 \section{Der \textsc{SN-Markov}-Algorithmus}
1250
1251 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1252 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1253 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1254 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1255 verwendet und mit sich selbst kombiniert wird.
1256
1257 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1258 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1259 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1260 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1261 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1262 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1263
1264 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1265 gerichteten Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1266 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1267 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von $S_0$
1268 ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1269 selbst erzeugen kann.
1270
1271 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1272 (unterschiedlichen) Schnittmuster und damit die Anzahl der Nachfolger sehr
1273 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1274 zu
1275 \begin{displaymath}
1276   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1277 \end{displaymath}
1278 Nachfolger.
1279
1280 Der Algorithmus {\sc SN-Markov} legt auf diesem Graph einen zufälligen Weg
1281 (englisch: \textit{random walk}) zurück. Er startet auf einem gegebenen
1282 Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu gelangen
1283 rekombiniert er das aktuelle Sortiernetzwerk mit sich selbst und erhält so
1284 einen zufälligen Nachfolger.
1285
1286 \begin{itemize}
1287   \item $n \leftarrow \mathrm{Input}$
1288   \item \texttt{while} \textit{true}
1289   \begin{itemize}
1290     \item $n \leftarrow \operatorname{recombine} (n, n)$
1291   \end{itemize}
1292 \end{itemize}
1293
1294 \begin{itemize}
1295   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1296   \item Anzahl der erreichbaren Sortiernetzwerke.
1297   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1298     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1299 \end{itemize}
1300
1301 \begin{figure}
1302   \begin{center}
1303   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1304   \end{center}
1305   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1306   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1307   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1308   \label{fig:markov-comparators-12}
1309 \end{figure}
1310
1311 \begin{figure}
1312   \begin{center}
1313   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1314   \end{center}
1315   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1316   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1317   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1318   \label{fig:markov-comparators-14}
1319 \end{figure}
1320
1321 \begin{figure}
1322   \begin{center}
1323   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1324   \end{center}
1325   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1326   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1327   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1328   \label{fig:markov-comparators-16}
1329 \end{figure}
1330
1331 %\input{shmoo-aequivalenz.tex}
1332
1333 \section{Optimierung der Schnitte}
1334
1335 \todo{In den Abschnitt "`Leitungen entfernen"' einbauen.}
1336
1337 Abbildung~\ref{fig:32-ec-from-bs64} zeigt ein 32-Sortiernetzwerk, dass vom
1338 \textsc{SN-Evolution-Cut}-Algorithmus aus dem $BS(64)$-Netzwerk erzeugt wurde.
1339 Es besteht aus 206~Komparatoren in 15~Schichten -- 34~Komparatoren weniger als
1340 $BS(32)$ und zwei Komparatoren weniger als das Netzwerk, das nach Mühlenthaler
1341 und Wankas Methode konstruiert wird. Die Anzahl der Schichten ist bei allen
1342 Netzwerken gleich.
1343
1344 \textbf{TODO:} $BS(128) \rightarrow n=64$: 584~Komparatoren in 21~Schichten
1345 möglich (nach ca. 600k Iterationen). Moritz und Rolf: $672-80=592$
1346 Komparatoren; $BS(64)$: 672~Komparatoren.
1347
1348 Schnitt-Sequenz:
1349 MIN( 92)
1350 MAX( 80)
1351 MIN(100)
1352 MAX( 54)
1353 MAX(102)
1354 MAX( 53)
1355 MAX(105)
1356 MAX(  6)
1357 MAX( 99)
1358 MAX( 79)
1359 MAX( 26)
1360 MIN(111)
1361 MAX( 12)
1362 MIN( 22)
1363 MAX( 61)
1364 MAX( 72)
1365 MAX( 68)
1366 MIN( 80)
1367 MAX( 80)
1368 MAX( 99)
1369 MAX(105)
1370 MAX(  0)
1371 MIN(  8)
1372 MAX( 40)
1373 MAX( 74)
1374 MAX( 40)
1375 MAX( 40)
1376 MIN( 56)
1377 MAX( 27)
1378 MAX( 13)
1379 MAX(  1)
1380 MAX( 81)
1381 MAX( 17)
1382 MAX(  4)
1383 MIN( 36)
1384 MIN( 22)
1385 MAX( 13)
1386 MIN( 72)
1387 MAX( 24)
1388 MAX(  5)
1389 MIN( 10)
1390 MAX( 59)
1391 MIN( 37)
1392 MAX( 65)
1393 MAX( 46)
1394 MAX( 73)
1395 MAX( 58)
1396 MAX( 29)
1397 MAX( 65)
1398 MIN( 23)
1399 MAX( 56)
1400 MAX( 11)
1401 MIN( 75)
1402 MIN( 51)
1403 MIN( 46)
1404 MIN( 34)
1405 MAX( 32)
1406 MAX(  6)
1407 MAX( 37)
1408 MIN(  4)
1409 MIN( 28)
1410 MIN( 20)
1411 MAX( 33)
1412 MAX( 34)
1413
1414 % images/32-ec-1277190372.tex
1415
1416 \section{Empirische Beobachtungen}
1417
1418 \begin{itemize}
1419 \item So schnell konvergiert der Algorithmus.
1420 \item $\ldots$
1421 \end{itemize}
1422
1423 \section{Ausblick}
1424
1425 Das würde mir noch einfallen$\ldots$
1426
1427 \bibliography{references}
1428 \bibliographystyle{plain}
1429
1430 %\listoffigures
1431
1432 \end{document}
1433
1434 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :