76a62821ff2515253a264c40f0dbdb79d500ae75
[diplomarbeit.git] / diplomarbeit.tex
1 \documentclass[a4paper,11pt]{article}
2 \usepackage[utf8]{inputenc}
3 \usepackage{ngerman}
4 \usepackage{fancyhdr}
5 \usepackage{geometry}
6 \usepackage{amsmath, bbm}
7 \usepackage{amsfonts}
8 \usepackage{amssymb}
9 \usepackage{listings}
10 \usepackage{graphicx}
11 \usepackage{url}
12 %\usepackage{longtable}
13 \usepackage{subfigure}
14 \usepackage{icomma}
15
16 \usepackage{tikz}
17 \usetikzlibrary{arrows,shapes}
18
19 % Fuer mathtoolsset
20 \usepackage{mathtools}
21
22 \geometry{paper=a4paper,margin=30mm}
23
24 \pagestyle{fancy}
25 %\fancyhf{}
26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
27 %\fancyhead[CO,CE]{2006-05-15}
28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
29
30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
31 \author{Florian Forster}
32 \date{\today}
33
34 \newcommand{\false}{\textsc{False}}
35 \newcommand{\true}{\textsc{True}}
36 \newcommand{\todo}[1]{{\bf TODO:} #1}
37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
38
39 \newtheorem{definition}{Definition}
40 \newtheorem{satz}{Satz}
41
42 % Zeige Nummern nur bei referenzierten Gleichungen an.
43 \mathtoolsset{showonlyrefs=true}
44
45 \begin{document}
46
47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
48 \tikzstyle{comp}     = [draw,thick,-]
49 \tikzstyle{compup}   = [draw,thick,->]
50 \tikzstyle{compdown} = [draw,thick,<-]
51 \tikzstyle{edge}     = [draw,thick,-]
52 \tikzstyle{diredge}  = [draw,thick,->]
53 \tikzstyle{prob}     = [font=\tiny]
54
55 \tikzstyle{edge minimum} = [edge,color=blue!20]
56 \tikzstyle{edge maximum} = [edge,color=red!20]
57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
63 \tikzstyle{comp active minimum} = [comp]
64 \tikzstyle{comp active maximum} = [comp]
65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
69
70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
74
75 \maketitle
76 \begin{abstract}
77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
84 das hinbekomme bzw. Recht behalte.}
85 \end{abstract}
86 \newpage
87
88 \tableofcontents
89
90 \newpage
91 \section{Motivation und Einleitung}
92
93 \subsection{Motivation}\label{sect:motivation}
94
95 \begin{itemize}
96 \item Sortiernetzwerke sind toll, weil $\ldots$
97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
100 \end{itemize}
101
102 \subsection{Einleitung}\label{sect:einleitung}
103
104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
105
106 {\em Komparatoren} sind die Bausteine, die {\em Sortiernetzwerken} zugrunde
107 liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten können.
108 Ausserdem besitzt ein {\em Komparator} zwei Ausgänge, die im Gegensatz zu den
109 Eingängen unterscheidbar sind: Die grö"sere der beiden Zahlen wird immer auf
110 dem einen, die kleinere der beiden Zahlen immer auf dem anderen Ausgang
111 ausgegeben.
112
113 Wenn man nun mehrere {\em Komparatoren} miteinander kombiniert, also die
114 Ausgänge von Komparatoren mit dem Eingängen anderer Komparatoren verbindet,
115 erhält man ein {\em Komparatornetzwerk}.
116
117 \begin{figure}
118 \begin{center}
119 \input{images/einfaches_komparatornetzwerk.tex}
120 \end{center}
121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
122 aus 5~Komparatoren.}
123 \label{fig:einfaches_komparatornetzwerk}
124 \end{figure}
125
126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
127 Komparatornetzwerk aus fünf Komparatoren in der üblichen Darstellungsweise:
128 Die horizontalen Linien stellen Leitungen von den Eingängen auf der linken
129 Seite zu den Ausgängen auf er rechten Seite dar. Die vertikalen Pfeile
130 symbolisieren die Komparatoren, die die Werte "`auf den Leitungen"'
131 vergleichen und ggf. vertauschen. Nach einem Komparator befindet sich die
132 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
133 befindet sich auf der Leitung auf der der Pfeil seinen Ursprung hat.
134
135 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
136 gleichzeitig angewandt werden. Das Beispiel in
137 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
138 vergleicht in einem ersten Schritt die zwei oberen und die zwei unteren
139 Leitungen gleichzeitig. Eine Gruppe von Komparatoren, die gleichzeitig
140 angewendet werden können, nennt man eine \emph{Schicht} des
141 Komparatornetwerks. Die \emph{Verzögerung} eines Komparatornetzwerks ist
142 gleichbedeutend mit der Anzahl der Schichten, in die sich die Komparatoren
143 mindestens gruppieren lassen, da sie die Anzahl der benötigten parallelen
144 Schritte darstellt.
145
146 Komparatornetzwerke, die für jede beliebige Eingabepermutation eine
147 Ausgabe erzeugen, die der Sortierung der Eingabe entspricht, heißen 
148 {\em Sortiernetzwerke}. Das in
149 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
150 ist kein Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ würde zur Ausgabe
151 ${(2, 1, 3, 4)}$ führen -- die bestehenden Sortierung wird also sogar
152 zerstört.
153
154 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft
155 {\em nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich.
156 Dieses Gegenbeispiel zu finden ist allerdings aufwendig.
157
158 \todo{Wie findet man die Gegenbeispiele? Die {\em Entscheidung}, ob ein
159 Netzwerk sortiert, ist doch NP-vollständig, also müsste doch das Finden eines
160 Gegenbeispiels im Allgemeinen auch exponentialle Laufzeit haben..?}
161 \todo{Wenn die {\em Entscheidung}, ob ein Netzwerk sortiert, NP-vollständig
162 ist, müsse man dann nicht einen Zeugen für die Sortiereigenschaft angeben
163 können?}
164
165 \todo{$0-1$-Prinzip}
166
167 Um zu überprüfen, ob ein gegebenes Komparatornetzwerk die Sortiereigenschaft
168 besetzt, müssen nicht alle $n!$ Permutationen von $n$~unterschiedlichen Zahlen
169 ausprobieren. Stattdessen reicht es zu überprüfen, dass das Netzwerk alle
170 $2^n$~0-1-Folgen sortiert.
171
172 Sortiernetzwerke:
173 \begin{itemize}
174 \item Ein Komparator-Netzwerk ist $\ldots$
175 \item Ein Komparator-Netzwerk ist ein Sortiernetzwerk, wenn $\ldots$
176 \item Die Frage nach der Sortiereigenschaft ist NP-vollständig.
177 \end{itemize}
178
179 \subsubsection{Evolutionäre Algorithmen}
180
181 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
182 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
183 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
184 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
185 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
186 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
187 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
188 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
189 praktikablen Zeitkonstanten gefunden werden.
190
191 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
192 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
193 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
194 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
195 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
196 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
197
198 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
199 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
200 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
201 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
202 als {\em Individuum} bezeichnet.
203
204 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
205 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
206 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
207 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
208 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
209 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
210 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
211 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
212 Gütefunktion}.
213
214 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
215 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
216 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
217 es oft einfach ist {\em irgendeine} Lösung anzugeben. Zum anderen muss eine
218 Methode für die Rekombination existieren. Das insbesondere dann problematisch
219 wenn {\em Nebenbedingungen} eingehalten werden müssen.
220
221 Beim Aussuchen von zufälligen Lösungen aus der Population, der
222 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
223 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
224 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
225 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
226 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
227 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
228 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
229 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
230 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
231 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
232 findet er aber in der Regel bessere Lösungen.
233
234 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
235 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
236 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
237 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
238 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
239 zwischen verschiedenen Leitungszahlen stark unterscheiden.
240
241 \begin{itemize}
242 \item Unter einem "`Evolutionären Algorithmus"' versteht man $\ldots$
243 \item Da die Sortiereigenschaft zu überprüfen NP-schwer ist, ist die
244 Mutation \textit{(vermutlich)} nicht (effizient) möglich.
245 \end{itemize}
246
247 \newpage
248 \section{Bekannte konstruktive Sortiernetzwerke}
249 \label{sect:konstruktive_netzwerke}
250
251 Übersicht über bekannte konstruktive Sortiernetzwerke.
252
253 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
254 \label{sect:odd_even_transpositionsort}
255
256 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
257 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
258 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
259 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
260 ${n = 8}$ Leitungen.
261
262 \begin{figure}
263   \begin{center}
264     \input{images/oe-transposition-8.tex}
265   \end{center}
266   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
267   \label{fig:odd-even-transposition-08}
268 \end{figure}
269
270 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
271 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
272 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
273 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
274 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
275 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
276
277 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
278 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
279 Herausschneiden einer Leitung reduziert. In
280 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
281 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
282 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
283
284 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
285 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
286 Komparatoren anordnen lassen, effizient. Es benötigt
287 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
288 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
289 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
290 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
291
292 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
293 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
294 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
295 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
296 Algorithmen.
297
298 \subsection{Das bitone Mergesort-Netzwerk}
299
300 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
301 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
302 veröffentlicht wurde. Es ist deutlich effizienter als das
303 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
304 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
305 Schichten.
306
307 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
308 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
309 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
310 verleiht dem Sortiernetzwerk seinen Namen.
311
312 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
313 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
314 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
315
316 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
317
318 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
319 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
320 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
321 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
322 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
323 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
324 entstehen können. Die wichtigsten Varianten für das \emph{bitone
325 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
326 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
327 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
328 ist wichtig zu beachten, dass das letzte Element nicht größer
329 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
330 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
331 darf.
332
333 \begin{figure}
334   \centering
335   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
336   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
337   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
338   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
339   \caption{Beispiele bitoner Folgen.}
340   \label{fig:beispiel-biton}
341 \end{figure}
342
343 \begin{figure}
344   \centering
345   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
346   \qquad
347   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
348   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
349   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
350   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
351   resultierenden Teilfolgen sind wiederum biton.}
352   \label{fig:bitonic-merge-schema}
353 \end{figure}
354
355 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
356 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
357 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
358 sortiert, die Folge $V$ sei absteigend sortiert:
359 \begin{eqnarray}
360  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
361  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
362 \end{eqnarray}
363 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
364 Positionen verglichen und ggf. vertauscht:
365 \begin{equation}
366 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
367 \end{equation}
368 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
369 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
370 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
371 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
372 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
373 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
374 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
375 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
376 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
377 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
378 zeigt die Situationen vor und nach diesem Schritt des Mischers.
379
380 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
381 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
382 mithilfe des bitonen Mischers, mit zwei Instanzen von
383 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
384 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
385 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
386 definiert ist.
387
388 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
389 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
390 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
391 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
392 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
393 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
394 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
395
396 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
397 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
398 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
399 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
400 besteht, die in $\log(n)$~Schichten angeordnet werden können.
401
402 \subsubsection{Das bitone Mergesort-Netzwerk}
403
404 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
405 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
406 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
407 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
408 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
409 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
410 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist. 
411 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
412 $\operatorname{BS}(2)$ identisch.
413
414 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
415 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
416 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
417 alle Komparatoren in die gleiche Richtung zeigen.
418
419 \begin{figure}
420   \begin{center}
421   \input{images/batcher-8.tex}
422   \end{center}
423   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
424   für acht Eingänge. Markiert sind die beiden Instanzen von
425   $\operatorname{BS}(4)$ (rot), die beiden bitonen
426   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
427   rekursiven Schritt hinzugefügt wurden (grün).}
428   \label{fig:bitonic-08}
429 \end{figure}
430
431 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
432 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
433 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
434 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
435 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
436 grün hinterlegt.
437
438 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
439 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
440 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
441 Schichten angeordnet sind.
442
443 %\begin{figure}
444 %\begin{center}
445 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
446 %\end{center}
447 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
448 %$S(n/2)$ und dem Mischer $M(n)$.}
449 %\label{fig:bms_rekursiver_aufbau}
450 %\end{figure}
451
452 \subsection{Das Odd-Even-Mergesort-Netzwerk}
453
454 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
455 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
456 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
457 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
458 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
459 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
460 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
461 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
462
463 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
464
465 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
466 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
467 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
468 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
469 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
470 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
471 Umständen mehr Schichten als der \emph{bitone Mischer}.\footnote{Knuth,
472 “Bitonic Sorting”, Seite~230}
473
474 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
475 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
476 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
477 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
478 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
479 \begin{equation}
480 w_i = \left\{ \begin{array}{ll}
481         u_i,     & i < n \\
482         v_{i-n}, & i \geqq n
483       \end{array} \right.,
484       \quad 0 \leqq i < N
485 \end{equation}
486
487 \begin{figure}
488   \begin{center}
489   \input{images/oe-merge.tex}
490   \end{center}
491   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
492   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
493   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
494   \label{fig:oe-merge}
495 \end{figure}
496
497 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
498 geraden Indizes und je eine Liste der ungeraden Indizes.
499 \begin{eqnarray}
500   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
501   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
502   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
503   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
504 \end{eqnarray}
505
506 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
507 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
508 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
509 Ausgang der Mischer die Folgen
510 \begin{eqnarray}
511   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
512   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
513 \end{eqnarray}
514 ergeben.
515
516 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
517 hinzugefügt,
518 \begin{equation}
519   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
520 \end{equation}
521 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
522 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
523
524 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
525 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
526 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
527 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
528 Aufbau lauten:
529 \begin{itemize}
530   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
531   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
532   einzelnen Komparator.
533 \end{itemize}
534
535 Dass die resultierende Folge sortiert ist, lässt sich mit dem
536 {\em 0-1-Prinzip} zeigen:
537 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
538 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
539 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
540 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
541 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
542 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
543 \begin{eqnarray}
544   \left|W_{\textrm{gerade}}\right|_0
545   &=& \left|U_{\textrm{gerade}}\right|_0
546     + \left|V_{\textrm{gerade}}\right|_0
547    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
548    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
549   \left|W_{\textrm{ungerade}}\right|_0
550   &=& \left|U_{\textrm{ungerade}}\right|_0
551     + \left|V_{\textrm{ungerade}}\right|_0
552    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
553    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
554 \end{eqnarray}
555 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
556 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
557 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
558 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
559 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
560 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
561 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
562 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
563
564 \begin{figure}
565   \centering
566   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
567   \qquad
568   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
569   \qquad
570   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
571   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
572   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
573   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
574   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
575   sortiert ist.}
576   \label{fig:oe-post-recursive}
577 \end{figure}
578
579 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
580 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
581 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
582 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
583 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
584
585 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
586 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
587 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
588 \begin{displaymath}
589   K(n,m) = \left\{ \begin{array}{ll}
590     nm, & \mathrm{falls} \quad nm \leqq 1 \\
591     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
592     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
593     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
594   \end{array} \right.
595 \end{displaymath}
596 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
597 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
598 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
599
600 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
601 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
602 Rekursionsschritt der OEM-Konstruktion fügt
603 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
604 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
605 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
606 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
607 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
608 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
609 \begin{displaymath}
610   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
611 \end{displaymath}
612 Komparatoren eingespart. Damit ergibt sich
613 \begin{displaymath}
614   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
615 \end{displaymath}
616 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
617 benötigt werden.
618
619 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
620
621 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
622 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
623 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
624 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
625 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
626 $\operatorname{OES}(n)$ aus
627 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
628 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
629 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
630 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
631 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
632 Komparatornetzwerke definiert sind.
633
634 \begin{figure}
635   \begin{center}
636   \input{images/oe-mergesort-8.tex}
637   \end{center}
638   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
639   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
640   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
641   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
642   Komparatoren zwischen benachbarten Leitungen (grün).}
643   \label{fig:odd-even-mergesort-08}
644 \end{figure}
645
646 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
647 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
648 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
649 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
650 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
651 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
652
653 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
654 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
655 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
656 \begin{displaymath}
657   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
658        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
659        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
660 \end{displaymath}
661 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
662 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
663 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
664
665 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
666 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
667 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
668 \begin{displaymath}
669   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
670 \end{displaymath}
671 gilt.
672
673 % gnuplot:
674 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
675 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
676 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
677
678 %\begin{itemize}
679 %\item Pairwise sorting-network
680 %\end{itemize}
681
682 \newpage
683 \section{Transformation von Sortiernetzwerken}
684
685 \subsection{Komprimieren}
686
687 \todo{Aus theoretischer Sicht eigentlich eine Trivialität. Rausschmeißen?}
688
689 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
690 gleichzeitig ausgewertet werden, wie bereits in
691 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Unter
692 \emph{Komprimieren} wird eine (Neu-)Gruppierung in die kleinstmögliche Anzahl
693 von \emph{Schichten} verstanden.
694
695 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
696 Komparatornetzwerken interessant. \dots
697
698 \subsection{Normalisieren}
699
700 \begin{figure}
701   \centering
702   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
703   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
704   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
705   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
706   intuitiven Konstruktion und die normalisierte Variante.}
707   \label{fig:beispiel_normalisieren}
708 \end{figure}
709
710 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
711 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
712 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
713 transformiert werden. Dazu gibt beispielsweise \emph{Knuth} (\todo{Verweis})
714 einen Algorithmus an.
715
716 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
717 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
718 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
719 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
720 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
721 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist. 
722 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
723 Definition.
724
725 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
726 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
727 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
728 und das Trichtermuster zu sehen.
729
730 \subsection{Zwei Netzwerke kombinieren}
731
732 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
733 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
734 Sortiernetzwerk zusammenzufassen.
735
736 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
737 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
738 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
739 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
740 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
741 und Weise rekursiv aufgebaut.
742
743 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
744 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
745 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
746 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
747 zusammenfügen.
748
749 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
750 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
751 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
752 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
753 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
754 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
755
756 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
757 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
758 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
759 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
760 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
761 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
762 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
763 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
764 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
765 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
766 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
767 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
768 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
769 6~Komparatoren weniger.
770
771 % 9   9
772 % 9  18
773 % 9  27
774 % 9  36
775 % 9  45
776 % 8  53
777 % 8  61
778 % 7  68
779 % 7  75
780 % 6  81
781 % 5  86
782
783 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
784 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
785 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
786 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
787 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
788 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
789 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
790 nur mit exponentiellem Aufwand möglich ist.
791
792 %\begin{itemize}
793 %\item Mit dem Bitonic-Merge
794 %\item Mit dem Odd-Even-Merge
795 %\item Nach dem Pairwise sorting-network Schema.
796 %\end{itemize}
797
798 \subsection{Leitungen entfernen}\label{sect:leitungen_entfernen}
799
800 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
801 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
802 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
803 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
804 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
805 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
806
807 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
808 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
809 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
810 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
811 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
812 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
813 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
814 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
815 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
816 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
817 das {\em Odd-Even-Transpositionsort-Netzwerk}.
818
819 \begin{figure}
820   \centering
821   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
822   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
823   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
824   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
825   \caption{Eine Leitung wird aus dem
826   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
827   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
828   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
829   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
830   Pfad herausgetrennt werden. In der letzten Abbildung ist
831   $\operatorname{OET}(7)$ markiert.}
832   \label{fig:oe-transposition-cut}
833 \end{figure}
834
835 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
836 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
837 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
838 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
839 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
840 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
841 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
842 auf die keine Komparatoren mehr berührt
843 (Abbildung~\ref{fig:oe-transposition-cut1}).
844
845 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
846 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
847 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
848 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
849 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
850 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
851 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
852 mit $(n-1)$~Elementen darstellen.
853
854 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
855 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
856 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
857 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
858 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
859
860 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
861 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
862 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
863 Darstellung ergibt. Ausserdem ist das
864 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
865 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
866 Ausgabe und kann entfernt werden.
867
868 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
869 \label{sect:anzahl_schnittmuster}
870
871 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
872 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
873 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
874 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
875 mit $n$~Eingängen reduziert werden. Mehrere Minimum- und Maximum-Schnitte, die
876 gleichzeitig angewendet werden, bezeichnen wir als \emph{Schnittmuster}.
877
878 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
879 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
880 Schnittmuster \emph{unterschiedlich} bezüglich~$S$. 
881
882 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
883 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
884 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
885 ein $n$-Sortiernetzwerk auf ein $m$-Sortiernetzwerk zu reduzieren, ergeben
886 sich insgesamt
887 \begin{equation}\label{eqn:anzahl_schnittmuster}
888   \prod_{i=n}^{m+1} 2i = 2^{n-m} \frac{n!}{m!}
889   \quad (n > m)
890 \end{equation}
891 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
892 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
893 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
894 führen beide Reihenfolgen zum selben Ergebnis.
895
896 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass
897 es möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise
898 Maximum vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster
899 reduziert, die Menge der so erzeugbaren Sortiernetzwerke bleibt aber
900 unverändert. Die Anzahl der möglichen Schnittmuster setzt sich zusammen aus
901 der Anzahl von Möglichkeiten, $n-m$~Leitungen aus $n$ Leitungen auszuwählen,
902 und die möglichen Minimum-~/ Maximum-Muster. Damit ergibt sich folgende
903 Formel für die Anzahl der Schnittmuster:
904 \begin{displaymath}
905   2^{n-m} \cdot \left( \begin{array}{c} n \\ n-m \end{array} \right)
906   = 2^{n-m} \cdot \frac{n!}{(n-m)! m!}
907   = 2^{n-m} \cdot \frac{n!}{m!} \cdot \frac{1}{(n-m)!}
908   \quad (n > m)
909 \end{displaymath}
910
911 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
912 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
913 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
914 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
915 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
916 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
917
918 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
919 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
920 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
921 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
922 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
923 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
924 Werte unterscheiden.
925
926 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
927 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
928 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
929 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
930 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
931 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
932 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
933 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
934
935 \begin{figure}
936   \begin{center}
937     \includegraphics[viewport=0 0 360 216,width=15cm]{images/count-cuts-16.pdf}
938   \end{center}
939   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
940   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
941   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
942   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
943   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
944   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
945   \label{fig:count-cuts-16}
946 \end{figure}
947
948 Um die Anzahl der \emph{unterschiedlichen} Schnittmuster abschätzen zu können,
949 wurden je eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
950 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
951 angewandt. Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
952 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
953 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
954 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
955 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
956 nahe ist.
957
958 Die Anzahl der 8-Schnittmuster ist entsprechend der
959 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
960 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
961 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
962 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
963 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
964 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
965 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
966 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
967 vernachlässigbar klein ist.
968
969 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
970 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar. Um
971 die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu können,
972 kann man sich einer stochastischen Methode bedienen, der sogenannten
973 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
974 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
975 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
976 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in $S$
977 enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
978 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
979 unterschiedlichen Schnittmuster abschätzen.
980
981 \begin{figure}
982   \begin{center}
983     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
984   \end{center}
985   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
986   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
987   $\operatorname{BS}(32)$.}
988   \label{fig:collisions-10000-1000000-32}
989 \end{figure}
990
991 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
992 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
993 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
994 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
995 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
996 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
997 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
998 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
999 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1000 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1001 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1002
1003 \begin{figure}
1004   \begin{center}
1005     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1006   \end{center}
1007   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1008   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1009   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1010   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1011   unterschiedlichen Schnittmustern.}
1012   \label{fig:collisions-100000-1000000-32-ps}
1013 \end{figure}
1014
1015 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1016 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1017 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1018 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1019 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1020 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1021 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1022 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1023 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1024 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1025 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1026 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1027 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1028 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1029 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1030 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1031 die Anzahl der \emph{möglichen} Schnittmuster.
1032
1033 \newpage
1034 \section{Der \textsc{SN-Evolution}-Algorithmus}
1035
1036 Um einen evolutionären Algorithmus für Sortiernetzwerke zu entwickeln, werden
1037 die vorgestellten Methoden kombiniert.
1038
1039 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1040
1041 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1042 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1043 die interessant sind:
1044 \begin{itemize}
1045   \item Möglichst wenige Komparatoren ("`klein"')
1046   \item Möglichst wenige Schichten ("`schnell"')
1047 \end{itemize}
1048
1049 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1050 kleinste bekannte Sortiernetzwerk für 16~Eingänge besteht aus 60~Komparatoren
1051 in 10~Schichten. Das schnellste Netzwerk besteht aus 61~Komparatoren in nur
1052 9~Schichten.
1053
1054 Eine Gütefunktion, die die beiden Ziele "`klein"' und "`schnell"'
1055 berücksichtigen kann, hat die folgende allgemeine Form:
1056 \begin{equation}
1057   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1058                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1059                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1060 \end{equation}
1061 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1062 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1063 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1064 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1065 jegliche Ergebnisse sind dann rein zufälliger Natur.
1066
1067 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1068 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1069 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1070 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1071 klein, in Abhängigkeit von den anderen beiden Parametern sind auch negative
1072 Werte möglich, werden die relativen Unterschiede groß. Dadurch wird die {\em
1073 Exploitation}, das Finden lokaler Optima, bevorzugt.
1074
1075 \subsection{Selektion}
1076
1077 ...
1078
1079 \subsection{Rekombination}
1080
1081 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1082 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1083 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1084 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1085 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1086 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1087 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1088
1089 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1090 erhält.
1091
1092 \subsection{Mutation}
1093
1094 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1095 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1096 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1097 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1098 Eigenschaft zerstören.
1099
1100 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1101 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1102 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1103 Ausprobieren aller $2^n$~Bitmuster.
1104
1105 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1106 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1107 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1108 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1109 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1110
1111 \begin{itemize}
1112 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1113 Schichten, kobiniert)
1114 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1115 \end{itemize}
1116
1117 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1118 Abbildung~\ref{fig:evolutionary_08}.
1119
1120 \begin{figure}
1121 \begin{center}
1122 \input{images/evolutionary-08.tex}
1123 \end{center}
1124 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1125 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1126 \label{fig:evolutionary_08}
1127 \end{figure}
1128
1129 \begin{figure}
1130 \begin{center}
1131 \input{images/08-e2-1237993371.tex}
1132 \end{center}
1133 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1134 \label{fig:08-e2-1237993371}
1135 \end{figure}
1136
1137 \begin{figure}
1138 \begin{center}
1139 \input{images/09-e2-1237997073.tex}
1140 \end{center}
1141 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1142 \label{fig:09-e2-1237997073}
1143 \end{figure}
1144
1145 \begin{figure}
1146 \begin{center}
1147 \input{images/09-e2-1237999719.tex}
1148 \end{center}
1149 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1150 \label{fig:09-e2-1237999719}
1151 \end{figure}
1152
1153 \begin{figure}
1154 \begin{center}
1155 \input{images/10-e2-1239014566.tex}
1156 \end{center}
1157 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1158 \label{fig:10-e2-1239014566}
1159 \end{figure}
1160
1161 \subsection{Güte}
1162
1163 \begin{itemize}
1164 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1165 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1166 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1167 \end{itemize}
1168
1169 %\input{shmoo-aequivalenz.tex}
1170
1171 \newpage
1172 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1173 \label{sect:sn-evolution-cut}
1174
1175 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1176 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1177 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1178 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1179 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1180 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1181 gute Schnittmuster gesucht.
1182
1183 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1184 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1185 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1186 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1187 $0 \leqq r \leqq c$.
1188
1189 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1190 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1191 Schnitt-Richtung.
1192
1193 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1194
1195 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1196 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1197 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1198 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1199 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1200 werden, Komparatoren ein.
1201
1202 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1203 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1204 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1205 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1206 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1207 Komparatoren ein.
1208
1209 \begin{figure}
1210   \begin{center}
1211     \input{images/16-ec-from-bs32.tex}
1212   \end{center}
1213   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1214     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1215     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1216     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1217   \label{fig:16-ec-from-bs32}
1218 \end{figure}
1219
1220 \begin{figure}
1221   \begin{center}
1222     \input{images/16-ec-from-bs32-normalized.tex}
1223   \end{center}
1224   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1225     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1226     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1227     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1228   \label{fig:16-ec-from-bs32-normalized}
1229 \end{figure}
1230
1231 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1232 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1233 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1234 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1235 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1236 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1237 und das
1238 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1239 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1240 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1241 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1242 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1243 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1244 Netzwerks scheinen rein zufällig zu sein.
1245
1246 \begin{figure}
1247   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1248   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1249   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1250   % 63:MAX
1251   \begin{center}
1252     \input{images/32-ec-from-bs64.tex}
1253   \end{center}
1254   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1255     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1256     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1257     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1258     Schnittmuster ist
1259     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1260     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1261     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1262   \label{fig:32-ec-from-bs64}
1263 \end{figure}
1264
1265 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1266 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1267 konstruiert haben, kann demnach auch erreicht werden, wenn
1268 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1269 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1270 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1271 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1272 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1273 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1274 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1275 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1276 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1277 Verzögerung dieser Sortiernetzwerke gleich ist.
1278
1279 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1280 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1281 gute Schnittmuster anzugeben.
1282
1283 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1284 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1285 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1286 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1287 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1288 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1289 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1290 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1291 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1292
1293 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1294 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1295 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1296 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1297 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1298 $\operatorname{OET}(n-m)$-Netzwerk. 
1299
1300 \begin{figure}
1301   \begin{center}
1302     \input{images/16-ec-from-ps32.tex}
1303   \end{center}
1304   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1305     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1306     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1307     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1308   \label{fig:16-ec-from-ps32}
1309 \end{figure}
1310
1311 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1312
1313 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1314 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1315 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1316 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1317 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1318 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1319 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1320 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1321
1322 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1323 einsetzt und auch nicht auf einem Mischer basiert, ist der
1324 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1325 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1326 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1327 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1328 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1329
1330 \begin{displaymath}
1331 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1332   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1333    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1334         ? & \quad \mathrm{sonst}
1335   \end{array} \right.
1336 \end{displaymath}
1337
1338 \begin{figure}
1339   \begin{center}
1340     \input{images/32-pairwise-cut-16-pairwise.tex}
1341   \end{center}
1342   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1343   \label{fig:ps16-from-ps32}
1344 \end{figure}
1345
1346 \begin{figure}
1347   \begin{center}
1348     \input{images/16-pairwise.tex}
1349   \end{center}
1350   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1351   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1352   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1353   \label{fig:16-pairwise}
1354 \end{figure}
1355
1356 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1357 man $\operatorname{OES}(8)$ erhalten.
1358
1359 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1360
1361 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1362
1363 \begin{itemize}
1364   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1365   \item Wie gut kann man durch wegschneiden werden?
1366   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1367   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1368   Netzwerk / Knoten in der Markov-Kette?
1369   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1370 \end{itemize}
1371
1372 \newpage
1373 \section{Der \textsc{SN-Markov}-Algorithmus}
1374
1375 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1376 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1377 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1378 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1379 verwendet und mit sich selbst kombiniert wird.
1380
1381 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1382 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1383 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1384 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1385 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1386 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1387
1388 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1389 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1390 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1391 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1392 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1393 selbst erzeugen kann.
1394
1395 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1396 (unterschiedlicher) Schnittmuster und damit die Anzahl der Nachfolger sehr
1397 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1398 zu
1399 \begin{displaymath}
1400   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1401 \end{displaymath}
1402 Nachfolger.
1403
1404 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1405 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1406 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1407 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1408 selbst und erhält so einen zufälligen Nachfolger.
1409
1410 \begin{itemize}
1411   \item $n \leftarrow \mathrm{Input}$
1412   \item \texttt{while} \textit{true}
1413   \begin{itemize}
1414     \item $n \leftarrow \operatorname{recombine} (n, n)$
1415   \end{itemize}
1416 \end{itemize}
1417
1418 \begin{itemize}
1419   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1420   \item Anzahl der erreichbaren Sortiernetzwerke.
1421   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1422     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1423 \end{itemize}
1424
1425 \begin{figure}
1426   \begin{center}
1427   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1428   \end{center}
1429   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1430   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1431   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1432   \label{fig:markov-comparators-12}
1433 \end{figure}
1434
1435 \begin{figure}
1436   \begin{center}
1437   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1438   \end{center}
1439   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1440   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1441   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1442   \label{fig:markov-comparators-14}
1443 \end{figure}
1444
1445 \begin{figure}
1446   \begin{center}
1447   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1448   \end{center}
1449   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1450   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1451   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1452   \label{fig:markov-comparators-16}
1453 \end{figure}
1454
1455 \newpage
1456 \section{Empirische Beobachtungen}
1457
1458 \begin{itemize}
1459 \item So schnell konvergiert der Algorithmus.
1460 \item $\ldots$
1461 \end{itemize}
1462
1463 \newpage
1464 \section{Ausblick}
1465
1466 Das würde mir noch einfallen$\ldots$
1467
1468 \newpage
1469 \section{Implementierung}
1470
1471 So habe ich die ganzen Versuche durchgeführt.
1472
1473 \newpage
1474 \bibliography{references}
1475 \bibliographystyle{plain}
1476
1477 %\listoffigures
1478
1479 \end{document}
1480
1481 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :