diplomarbeit.tex

   1 \documentclass[a4paper,11pt]{article}
   2 \usepackage[utf8]{inputenc}
   3 \usepackage{ngerman}
   4 \usepackage{fancyhdr}
   5 \usepackage{geometry}
   6 \usepackage{amsmath, bbm}
   7 \usepackage{amsfonts}
   8 \usepackage{amssymb}
   9 \usepackage{listings}
  10 \usepackage{graphicx}
  11 \usepackage{url}
  12 %\usepackage{longtable}
  13 \usepackage{subfigure}
  14 \usepackage{icomma}
  15
  16 \usepackage{tikz}
  17 \usetikzlibrary{arrows,shapes}
  18
  19 % Fuer mathtoolsset
  20 \usepackage{mathtools}
  21
  22 \geometry{paper=a4paper,margin=30mm}
  23
  24 \pagestyle{fancy}
  25 %\fancyhf{}
  26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
  27 %\fancyhead[CO,CE]{2006-05-15}
  28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
  29
  30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
  31 \author{Florian Forster}
  32 \date{\today}
  33
  34 \newcommand{\false}{\textsc{False}}
  35 \newcommand{\true}{\textsc{True}}
  36 \newcommand{\todo}[1]{{\bf TODO:} #1}
  37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
  38
  39 \newtheorem{definition}{Definition}
  40 \newtheorem{satz}{Satz}
  41
  42 % Zeige Nummern nur bei referenzierten Gleichungen an.
  43 \mathtoolsset{showonlyrefs=true}
  44
  45 \begin{document}
  46
  47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
  48 \tikzstyle{comp}     = [draw,thick,-]
  49 \tikzstyle{compup}   = [draw,thick,->]
  50 \tikzstyle{compdown} = [draw,thick,<-]
  51 \tikzstyle{edge}     = [draw,thick,-]
  52 \tikzstyle{diredge}  = [draw,thick,->]
  53 \tikzstyle{prob}     = [font=\tiny]
  54
  55 \tikzstyle{edge minimum} = [edge,color=blue!20]
  56 \tikzstyle{edge maximum} = [edge,color=red!20]
  57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
  58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
  59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
  60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
  61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
  62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
  63 \tikzstyle{comp active minimum} = [comp]
  64 \tikzstyle{comp active maximum} = [comp]
  65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
  66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
  67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
  68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
  69
  70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
  71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
  72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
  73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
  74
  75 \maketitle
  76 \begin{abstract}
  77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
  78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
  79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
  80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
  81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
  82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
  83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
  84 das hinbekomme bzw. Recht behalte.}
  85 \end{abstract}
  86 \newpage
  87
  88 \tableofcontents
  89
  90 \newpage
  91 \section{Motivation und Einleitung}
  92
  93 \subsection{Motivation}\label{sect:motivation}
  94
  95 \begin{itemize}
  96 \item Sortiernetzwerke sind toll, weil $\ldots$
  97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
  98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
  99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
 100 \end{itemize}
 101
 102 \subsection{Einleitung}\label{sect:einleitung}
 103
 104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
 105
 106 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
 107 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
 108 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
 109 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
 110 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
 111 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
 112
 113 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
 114 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
 115 erhält man ein {\em Komparatornetzwerk}.
 116
 117 \begin{figure}
 118 \begin{center}
 119 \input{images/einfaches_komparatornetzwerk.tex}
 120 \end{center}
 121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
 122 aus 5~Komparatoren.}
 123 \label{fig:einfaches_komparatornetzwerk}
 124 \end{figure}
 125
 126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
 127 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
 128 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
 129 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
 130 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
 131 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
 132 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
 133 durch schwarze Punkte symbolisiert.
 134
 135 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
 136 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
 137 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
 138 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
 139 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
 140
 141 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 142 gleichzeitig angewandt werden. Das Beispiel in
 143 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
 144 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
 145 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
 146 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
 147 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
 148 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
 149 benötigten parallelen Schritte darstellt.
 150
 151 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
 152 erzeugen, die der Sortierung der Eingabe entspricht, heißen
 153 \emph{Sortiernetzwerke}. Das in
 154 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
 155 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
 156 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
 157 zerstört.
 158
 159 \begin{figure}
 160   \begin{center}
 161     \input{images/09-e2-c24-allbut1.tex}
 162   \end{center}
 163   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
 164   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
 165   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
 166   \label{fig:09-e2-c24-allbut1}
 167 \end{figure}
 168 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
 169 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
 170 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
 171 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
 172 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
 173 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
 174 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
 175 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
 176 nicht \emph{effizient} möglich.
 177
 178 Beispielsweise sortiert das Komparatornetzwerk in
 179 Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880 möglichen
 180 Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4, 8, 6)$
 181 lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
 182 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge
 183 $(1, 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
 184
 185 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
 186 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
 187 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
 188 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
 189 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
 190 ist.\footnote{1.307.674.368.000 Permutationen}
 191
 192 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
 193 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
 194 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
 195 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
 196 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
 197 in der Ausgabe, die die Sortierbedingung verletzt:
 198 \begin{displaymath}
 199   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
 200 \end{displaymath}
 201 Die Eingabe kann mittels
 202 \begin{displaymath}
 203   \hat{e}_j = \left\{
 204     \begin{array}{cl}
 205       0 & e_j \leqq a_i \\
 206       1 & e_j > a_i
 207     \end{array} \right.
 208 \end{displaymath}
 209 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme von
 210 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
 211 Verhalten jedes einzelnen Komparators nicht, so dass die Annahme auf einen
 212 Widerspruch geführt wird.
 213
 214 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
 215 Komplexitätsklasse
 216 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
 217 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
 218 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
 219 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
 220 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
 221 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
 222 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
 223 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
 224 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
 225 beschäftigen.
 226
 227 \subsubsection{Evolutionäre Algorithmen}
 228
 229 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
 230 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
 231 \textit{NP}, das heißt das keine Verfahren bekannt sind, die das Problem
 232 effizient exakt lösbar. Sollte sich herausstellen, dass diese Probleme nicht
 233 in der Komplexitätsklasse~\textit{P} liegen, wäre eine Konsequenz, dass es
 234 effiziente exakte Algorithmen für diese Probleme nicht geben kann. Falls sich
 235 hingegen herausstellt, dass diese Probleme in der
 236 Komplexitätsklasse~\textit{P} liegen, wird es mit großer Wahrscheinlichkeit
 237 noch einige Zeit dauern, bis auch Algorithmen mit praktikablen Zeitkonstanten
 238 gefunden werden.
 239
 240 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
 241 die beziehungsweise eine der {\em optimalen} Lösungen als einzige Ausgabe des
 242 Algorithmus zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele
 243 dieser Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
 244 beispielsweise imitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
 245 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
 246
 247 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
 248 ist, bekannte Lösungen zu neuen -- unter Umständen besseren -- Lösungen zu
 249 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
 250 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem als {\em
 251 Individuen} bezeichnet.
 252
 253 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
 254 bestehenden Lösungsmenge, der {\em Population}, werden zufällig Lösungen
 255 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
 256 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
 257 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
 258 eingefügt wird. Die verwendeten Wahrscheinlichkeiten, beispielsweise bei der
 259 {\em Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
 260 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
 261 Gütefunktion}.
 262
 263 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
 264 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
 265 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
 266 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
 267 Algorithmen verwenden als einfache, initiale Lösung häufig das
 268 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
 269 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
 270 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
 271 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
 272
 273 Beim Aussuchen von zufälligen Lösungen aus der Population, der
 274 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
 275 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
 276 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
 277 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
 278 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
 279 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
 280 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
 281 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
 282 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
 283 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
 284 findet er aber in der Regel bessere Lösungen.
 285
 286 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
 287 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
 288 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
 289 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
 290 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
 291 zwischen verschiedenen Leitungszahlen stark unterscheiden.
 292
 293 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
 294 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
 295 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
 296 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
 297 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
 298 „Ausbrechen“ und finden noch besserer Lösungen.
 299
 300 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
 301 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
 302 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
 303 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
 304 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
 305 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
 306
 307 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
 308 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
 309 mutieren lediglich Transformationen von Sortiernetzwerken, die die
 310 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
 311 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
 312 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
 313
 314 \newpage
 315 \section{Bekannte konstruktive Sortiernetzwerke}
 316 \label{sect:konstruktive_netzwerke}
 317
 318 Übersicht über bekannte konstruktive Sortiernetzwerke.
 319
 320 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
 321 \label{sect:odd_even_transpositionsort}
 322
 323 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
 324 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
 325 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
 326 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
 327 ${n = 8}$ Leitungen.
 328
 329 \begin{figure}
 330   \begin{center}
 331     \input{images/oe-transposition-8.tex}
 332   \end{center}
 333   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
 334   \label{fig:odd-even-transposition-08}
 335 \end{figure}
 336
 337 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
 338 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
 339 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
 340 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
 341 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
 342 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
 343
 344 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
 345 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
 346 Herausschneiden einer Leitung reduziert. In
 347 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
 348 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
 349 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
 350
 351 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
 352 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
 353 Komparatoren anordnen lassen, effizient. Es benötigt
 354 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
 355 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
 356 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
 357 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
 358
 359 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
 360 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
 361 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
 362 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
 363 Algorithmen.
 364
 365 \subsection{Das bitone Mergesort-Netzwerk}
 366
 367 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
 368 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
 369 veröffentlicht wurde. Es ist deutlich effizienter als das
 370 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
 371 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
 372 Schichten.
 373
 374 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
 375 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
 376 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
 377 verleiht dem Sortiernetzwerk seinen Namen.
 378
 379 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
 380 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
 381 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
 382
 383 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
 384
 385 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
 386 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
 387 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
 388 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
 389 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
 390 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
 391 entstehen können. Die wichtigsten Varianten für das \emph{bitone
 392 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
 393 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
 394 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
 395 ist wichtig zu beachten, dass das letzte Element nicht größer
 396 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
 397 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
 398 darf.
 399
 400 \begin{figure}
 401   \centering
 402   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
 403   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
 404   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
 405   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
 406   \caption{Beispiele bitoner Folgen.}
 407   \label{fig:beispiel-biton}
 408 \end{figure}
 409
 410 \begin{figure}
 411   \centering
 412   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
 413   \qquad
 414   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
 415   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
 416   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
 417   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
 418   resultierenden Teilfolgen sind wiederum biton.}
 419   \label{fig:bitonic-merge-schema}
 420 \end{figure}
 421
 422 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
 423 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
 424 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
 425 sortiert, die Folge $V$ sei absteigend sortiert:
 426 \begin{eqnarray}
 427  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
 428  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
 429 \end{eqnarray}
 430 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
 431 Positionen verglichen und ggf. vertauscht:
 432 \begin{equation}
 433 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
 434 \end{equation}
 435 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
 436 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
 437 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
 438 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
 439 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
 440 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
 441 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
 442 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
 443 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
 444 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
 445 zeigt die Situationen vor und nach diesem Schritt des Mischers.
 446
 447 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
 448 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
 449 mithilfe des bitonen Mischers, mit zwei Instanzen von
 450 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
 451 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
 452 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
 453 definiert ist.
 454
 455 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
 456 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
 457 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
 458 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
 459 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
 460 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
 461 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
 462
 463 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
 464 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
 465 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
 466 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
 467 besteht, die in $\log(n)$~Schichten angeordnet werden können.
 468
 469 \subsubsection{Das bitone Mergesort-Netzwerk}
 470
 471 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
 472 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
 473 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
 474 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
 475 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
 476 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
 477 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist.
 478 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
 479 $\operatorname{BS}(2)$ identisch.
 480
 481 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
 482 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
 483 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
 484 alle Komparatoren in die gleiche Richtung zeigen.
 485
 486 \begin{figure}
 487   \begin{center}
 488   \input{images/batcher-8.tex}
 489   \end{center}
 490   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
 491   für acht Eingänge. Markiert sind die beiden Instanzen von
 492   $\operatorname{BS}(4)$ (rot), die beiden bitonen
 493   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
 494   rekursiven Schritt hinzugefügt wurden (grün).}
 495   \label{fig:bitonic-08}
 496 \end{figure}
 497
 498 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
 499 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
 500 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
 501 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
 502 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
 503 grün hinterlegt.
 504
 505 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
 506 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
 507 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
 508 Schichten angeordnet sind.
 509
 510 %\begin{figure}
 511 %\begin{center}
 512 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
 513 %\end{center}
 514 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
 515 %$S(n/2)$ und dem Mischer $M(n)$.}
 516 %\label{fig:bms_rekursiver_aufbau}
 517 %\end{figure}
 518
 519 \subsection{Das Odd-Even-Mergesort-Netzwerk}
 520
 521 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
 522 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
 523 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
 524 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
 525 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
 526 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
 527 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
 528 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
 529
 530 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
 531
 532 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
 533 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
 534 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
 535 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
 536 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
 537 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
 538 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
 539
 540 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
 541 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
 542 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
 543 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
 544 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
 545 \begin{equation}
 546 w_i = \left\{ \begin{array}{ll}
 547         u_i,     & i < n \\
 548         v_{i-n}, & i \geqq n
 549       \end{array} \right.,
 550       \quad 0 \leqq i < N
 551 \end{equation}
 552
 553 \begin{figure}
 554   \begin{center}
 555   \input{images/oe-merge.tex}
 556   \end{center}
 557   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
 558   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
 559   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
 560   \label{fig:oe-merge}
 561 \end{figure}
 562
 563 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
 564 geraden Indizes und je eine Liste der ungeraden Indizes.
 565 \begin{eqnarray}
 566   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
 567   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
 568   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
 569   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
 570 \end{eqnarray}
 571
 572 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
 573 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
 574 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
 575 Ausgang der Mischer die Folgen
 576 \begin{eqnarray}
 577   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
 578   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
 579 \end{eqnarray}
 580 ergeben.
 581
 582 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
 583 hinzugefügt,
 584 \begin{equation}
 585   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
 586 \end{equation}
 587 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
 588 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
 589
 590 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
 591 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
 592 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
 593 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
 594 Aufbau lauten:
 595 \begin{itemize}
 596   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
 597   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
 598   einzelnen Komparator.
 599 \end{itemize}
 600
 601 Dass die resultierende Folge sortiert ist, lässt sich mit dem
 602 {\em 0-1-Prinzip} zeigen:
 603 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
 604 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
 605 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
 606 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
 607 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
 608 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
 609 \begin{eqnarray}
 610   \left|W_{\textrm{gerade}}\right|_0
 611   &=& \left|U_{\textrm{gerade}}\right|_0
 612     + \left|V_{\textrm{gerade}}\right|_0
 613    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
 614    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
 615   \left|W_{\textrm{ungerade}}\right|_0
 616   &=& \left|U_{\textrm{ungerade}}\right|_0
 617     + \left|V_{\textrm{ungerade}}\right|_0
 618    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
 619    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
 620 \end{eqnarray}
 621 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
 622 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
 623 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
 624 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
 625 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
 626 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
 627 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
 628 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
 629
 630 \begin{figure}
 631   \centering
 632   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
 633   \qquad
 634   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
 635   \qquad
 636   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
 637   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
 638   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
 639   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
 640   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
 641   sortiert ist.}
 642   \label{fig:oe-post-recursive}
 643 \end{figure}
 644
 645 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
 646 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
 647 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
 648 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
 649 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
 650
 651 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
 652 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
 653 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
 654 \begin{displaymath}
 655   K(n,m) = \left\{ \begin{array}{ll}
 656     nm, & \mathrm{falls} \quad nm \leqq 1 \\
 657     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
 658     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
 659     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
 660   \end{array} \right.
 661 \end{displaymath}
 662 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
 663 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
 664 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
 665
 666 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
 667 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
 668 Rekursionsschritt der OEM-Konstruktion fügt
 669 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
 670 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
 671 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
 672 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
 673 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
 674 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
 675 \begin{displaymath}
 676   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
 677 \end{displaymath}
 678 Komparatoren eingespart. Damit ergibt sich
 679 \begin{displaymath}
 680   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
 681 \end{displaymath}
 682 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
 683 benötigt werden.
 684
 685 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
 686
 687 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
 688 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
 689 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
 690 effizientesten Sortiernetzwerke in Bezug auf Komparator- und Schichtzahl
 691 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
 692 $\operatorname{OES}(n)$ aus
 693 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
 694 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
 695 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
 696 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
 697 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
 698 Komparatornetzwerke definiert sind.
 699
 700 \begin{figure}
 701   \begin{center}
 702   \input{images/oe-mergesort-8.tex}
 703   \end{center}
 704   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
 705   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
 706   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
 707   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
 708   Komparatoren zwischen benachbarten Leitungen (grün).}
 709   \label{fig:odd-even-mergesort-08}
 710 \end{figure}
 711
 712 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
 713 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
 714 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
 715 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
 716 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
 717 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
 718
 719 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
 720 \emph{Odd-Even-Mergesort-Netz\-werk} verwendet wird, $k(n)$, direkt aus der
 721 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
 722 \begin{displaymath}
 723   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
 724        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
 725        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
 726 \end{displaymath}
 727 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
 728 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
 729 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
 730
 731 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
 732 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
 733 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
 734 \begin{displaymath}
 735   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
 736 \end{displaymath}
 737 gilt.
 738
 739 % gnuplot:
 740 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
 741 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
 742 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
 743
 744 %\begin{itemize}
 745 %\item Pairwise sorting-network
 746 %\end{itemize}
 747
 748 \newpage
 749 \section{Transformation von Sortiernetzwerken}
 750 \label{sect:tranformation}
 751
 752 \subsection{Komprimieren}
 753
 754 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 755 gleichzeitig ausgewertet werden, wie bereits in
 756 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
 757 Transformationen, insbesondere das Entfernen einer Leitung, das in
 758 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
 759 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
 760 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
 761 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
 762 die jeden Komparator so früh wie möglich ausführt. So entsteht die
 763 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
 764 unterteilen lässt.
 765
 766 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
 767 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
 768 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
 769 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
 770 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
 771 Komprimierung durchgeführt werden.
 772
 773 \subsection{Normalisieren}
 774
 775 \begin{figure}
 776   \centering
 777   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
 778   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
 779   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
 780   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
 781   intuitiven Konstruktion und die normalisierte Variante.}
 782   \label{fig:beispiel_normalisieren}
 783 \end{figure}
 784
 785 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
 786 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
 787 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
 788 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
 789 in~\cite{KNUTH} einen Algorithmus an.
 790
 791 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
 792 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
 793 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
 794 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
 795 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
 796 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist.
 797 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
 798 Definition.
 799
 800 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
 801 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
 802 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
 803 und das Trichtermuster zu sehen.
 804
 805 \subsection{Zwei Netzwerke kombinieren}
 806
 807 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
 808 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
 809 Sortiernetzwerk zusammenzufassen.
 810
 811 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
 812 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
 813 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
 814 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
 815 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
 816 und Weise rekursiv aufgebaut.
 817
 818 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
 819 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
 820 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
 821 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
 822 zusammenfügen.
 823
 824 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
 825 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
 826 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
 827 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
 828 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
 829 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
 830
 831 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
 832 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
 833 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
 834 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
 835 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
 836 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
 837 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
 838 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
 839 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
 840 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
 841 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
 842 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
 843 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
 844 6~Komparatoren weniger.
 845
 846 % 9   9
 847 % 9  18
 848 % 9  27
 849 % 9  36
 850 % 9  45
 851 % 8  53
 852 % 8  61
 853 % 7  68
 854 % 7  75
 855 % 6  81
 856 % 5  86
 857
 858 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
 859 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
 860 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
 861 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
 862 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
 863 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
 864 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
 865 nur mit exponentiellem Aufwand möglich ist.
 866
 867 %\begin{itemize}
 868 %\item Mit dem Bitonic-Merge
 869 %\item Mit dem Odd-Even-Merge
 870 %\item Nach dem Pairwise sorting-network Schema.
 871 %\end{itemize}
 872
 873 \subsection{Leitungen entfernen}
 874 \label{sect:leitungen_entfernen}
 875
 876 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
 877 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
 878 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
 879 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
 880 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
 881 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
 882
 883 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
 884 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
 885 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
 886 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
 887 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
 888 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
 889 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
 890 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
 891 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
 892 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
 893 das {\em Odd-Even-Transpositionsort-Netzwerk}.
 894
 895 \begin{figure}
 896   \centering
 897   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
 898   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
 899   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
 900   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
 901   \caption{Eine Leitung wird aus dem
 902   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
 903   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
 904   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
 905   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
 906   Pfad herausgetrennt werden. In der letzten Abbildung ist
 907   $\operatorname{OET}(7)$ markiert.}
 908   \label{fig:oe-transposition-cut}
 909 \end{figure}
 910
 911 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
 912 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
 913 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
 914 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
 915 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
 916 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
 917 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
 918 auf die keine Komparatoren mehr berührt
 919 (Abbildung~\ref{fig:oe-transposition-cut1}).
 920
 921 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
 922 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
 923 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
 924 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
 925 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
 926 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
 927 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
 928 mit $(n-1)$~Elementen darstellen.
 929
 930 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
 931 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
 932 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
 933 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
 934 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
 935
 936 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
 937 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
 938 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
 939 Darstellung ergibt. Ausserdem ist das
 940 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
 941 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
 942 Ausgabe und kann entfernt werden.
 943
 944 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
 945 \label{sect:anzahl_schnittmuster}
 946
 947 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
 948 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
 949 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
 950 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
 951 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
 952 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
 953 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
 954 \emph{$k$-Schnittmuster}.
 955
 956 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
 957 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
 958 Schnittmuster \emph{unterschiedlich} bezüglich~$S$.
 959
 960 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
 961 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
 962 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
 963 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
 964 ergeben sich insgesamt
 965 \begin{equation}\label{eqn:anzahl_schnittmuster}
 966   \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
 967   \quad (n > m)
 968 \end{equation}
 969 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
 970 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
 971 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
 972 führen beide Reihenfolgen zum selben Ergebnis.
 973
 974 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass es
 975 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
 976 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
 977 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
 978 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
 979 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
 980 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
 981 der möglichen Schnittmuster:
 982 \begin{displaymath}
 983   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
 984   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
 985   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
 986   \quad (1 \leqq k < n)
 987 \end{displaymath}
 988
 989 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
 990 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
 991 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
 992 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
 993 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
 994 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
 995
 996 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
 997 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
 998 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
 999 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
1000 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1001 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1002 Werte unterscheiden.
1003
1004 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1005 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
1006 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1007 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1008 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1009 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1010 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1011 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1012
1013 \begin{figure}
1014   \begin{center}
1015     \includegraphics[viewport=0 0 360 216,width=15cm]{images/count-cuts-16.pdf}
1016   \end{center}
1017   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1018   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1019   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1020   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1021   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1022   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1023   \label{fig:count-cuts-16}
1024 \end{figure}
1025
1026 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1027 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1028 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1029 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1030 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
1031 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
1032 angewandt. Anschließend wurde mithilfe einer Hashtabelle überprüft, ob das
1033 resultierende Sortiernetzwerk schon von einem \emph{äquivalenten}
1034 Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk noch nicht in der
1035 Hashtabelle enthalten war, wurde der Zähler für unterschiedliche Schnittmuster
1036 erhöht und das Sortiernetzwerk eingefügt.
1037
1038 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1039 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1040 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1041 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1042 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1043 nahe ist.
1044
1045 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1046 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
1047 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
1048 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
1049 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
1050 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
1051 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
1052 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
1053 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1054 vernachlässigbar klein ist.
1055
1056 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1057 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1058 Die Hashtabelle benötigt mehr Arbeitsspeicher als in derzeitigen Rechnern
1059 vorhanden ist, bevor ein entsprechender Graph den linearen Bereich für
1060 „kleine“ x-Werte verlässt.
1061
1062 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1063 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1064 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1065 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1066 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
1067 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in
1068 $S$ enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1069 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1070 unterschiedlichen Schnittmuster abschätzen.
1071
1072 \begin{figure}
1073   \begin{center}
1074     \includegraphics[viewport=0 0 360 216,width=15cm]{images/collisions-10000-1000000-32.pdf}
1075   \end{center}
1076   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1077   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1078   $\operatorname{BS}(32)$.}
1079   \label{fig:collisions-10000-1000000-32}
1080 \end{figure}
1081
1082 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1083 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1084 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1085 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1086 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1087 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1088 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1089 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1090 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1091 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1092 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1093
1094 \begin{figure}
1095   \begin{center}
1096     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1097   \end{center}
1098   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1099   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1100   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1101   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1102   unterschiedlichen Schnittmustern.}
1103   \label{fig:collisions-100000-1000000-32-ps}
1104 \end{figure}
1105
1106 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1107 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1108 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1109 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1110 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1111 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1112 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1113 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1114 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1115 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1116 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1117 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1118 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1119 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1120 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1121 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1122 die Anzahl der \emph{möglichen} Schnittmuster.
1123
1124 \newpage
1125 \section{Der \textsc{SN-Evolution}-Algorithmus}
1126
1127 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1128 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1129 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1130 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1131 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1132 in Abschnitt~\ref{sect:bewertung} behandelt.
1133
1134 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1135
1136 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1137 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1138 die bei Sortiernetzwerken verfolgt werden können:
1139 \begin{itemize}
1140   \item Möglichst wenige Komparatoren („effizient“)
1141   \item Möglichst wenige Schichten („schnell“)
1142 \end{itemize}
1143
1144 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1145 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1146 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1147 61~Komparatoren in nur 9~Schichten.
1148
1149 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1150 berücksichtigen kann, hat die folgende allgemeine Form:
1151 \begin{equation}
1152   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1153                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1154                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1155 \end{equation}
1156 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1157 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1158 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1159 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1160 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1161 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1162 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1163
1164 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1165 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1166 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1167 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1168
1169 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1170 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1171 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1172 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1173 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1174 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1175 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1176
1177 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1178 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1179 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1180 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1181 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1182
1183 \subsection{Selektion}
1184
1185 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1186 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1187 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1188 Streben des Algorithmus nach besseren Lösungen.
1189
1190 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1191 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1192 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1193
1194 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1195 Pseudocode wie folgt beschreiben:
1196 \begin{verbatim}
1197 Guetesumme := 0
1198 Auswahl := (leer)
1199
1200 fuer jedes Individuum in Population
1201 {
1202   reziproke Guete := 1.0 / Guete(Individuum)
1203   Wahrscheinlichkeit P := reziproke Guete / (reziproke Guete + Guetesumme)
1204   Guetesumme := Guetesumme + reziproke Guete
1205
1206   mit Wahrscheinlichkeit P
1207   {
1208     Auswahl := Individuum
1209   }
1210 }
1211 gebe Auswahl zurueck
1212 \end{verbatim}
1213
1214 \subsection{Rekombination}
1215
1216 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1217 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1218 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1219 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1220 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1221 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1222 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1223
1224 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1225 erhält.
1226
1227 \subsection{Mutation}
1228
1229 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1230 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1231 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1232 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1233 Eigenschaft zerstören.
1234
1235 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1236 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1237 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1238 Ausprobieren aller $2^n$~Bitmuster.
1239
1240 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1241 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1242 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1243 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1244 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1245
1246 \begin{itemize}
1247 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1248 Schichten, kobiniert)
1249 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1250 \end{itemize}
1251
1252 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1253 Abbildung~\ref{fig:evolutionary_08}.
1254
1255 \begin{figure}
1256 \begin{center}
1257 \input{images/evolutionary-08.tex}
1258 \end{center}
1259 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1260 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1261 \label{fig:evolutionary_08}
1262 \end{figure}
1263
1264 \begin{figure}
1265 \begin{center}
1266 \input{images/08-e2-1237993371.tex}
1267 \end{center}
1268 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1269 \label{fig:08-e2-1237993371}
1270 \end{figure}
1271
1272 \begin{figure}
1273 \begin{center}
1274 \input{images/09-e2-1237997073.tex}
1275 \end{center}
1276 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1277 \label{fig:09-e2-1237997073}
1278 \end{figure}
1279
1280 \begin{figure}
1281 \begin{center}
1282 \input{images/09-e2-1237999719.tex}
1283 \end{center}
1284 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1285 \label{fig:09-e2-1237999719}
1286 \end{figure}
1287
1288 \begin{figure}
1289 \begin{center}
1290 \input{images/10-e2-1239014566.tex}
1291 \end{center}
1292 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1293 \label{fig:10-e2-1239014566}
1294 \end{figure}
1295
1296 \subsection{Güte}
1297
1298 \begin{itemize}
1299 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1300 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1301 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1302 \end{itemize}
1303
1304 %\input{shmoo-aequivalenz.tex}
1305
1306 \newpage
1307 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1308 \label{sect:sn-evolution-cut}
1309
1310 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1311 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1312 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1313 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1314 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1315 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1316 gute Schnittmuster gesucht.
1317
1318 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1319 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1320 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1321 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1322 $0 \leqq r \leqq c$.
1323
1324 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1325 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1326 Schnitt-Richtung.
1327
1328 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1329
1330 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1331 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1332 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1333 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1334 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1335 werden, Komparatoren ein.
1336
1337 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1338 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1339 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1340 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1341 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1342 Komparatoren ein.
1343
1344 \begin{figure}
1345   \begin{center}
1346     \input{images/16-ec-from-bs32.tex}
1347   \end{center}
1348   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1349     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1350     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1351     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1352   \label{fig:16-ec-from-bs32}
1353 \end{figure}
1354
1355 \begin{figure}
1356   \begin{center}
1357     \input{images/16-ec-from-bs32-normalized.tex}
1358   \end{center}
1359   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1360     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1361     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1362     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1363   \label{fig:16-ec-from-bs32-normalized}
1364 \end{figure}
1365
1366 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1367 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1368 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1369 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1370 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1371 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1372 und das
1373 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1374 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1375 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1376 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1377 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1378 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1379 Netzwerks scheinen rein zufällig zu sein.
1380
1381 \begin{figure}
1382   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1383   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1384   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1385   % 63:MAX
1386   \begin{center}
1387     \input{images/32-ec-from-bs64.tex}
1388   \end{center}
1389   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1390     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1391     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1392     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1393     Schnittmuster ist
1394     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1395     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1396     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1397   \label{fig:32-ec-from-bs64}
1398 \end{figure}
1399
1400 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1401 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1402 konstruiert haben, kann demnach auch erreicht werden, wenn
1403 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1404 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1405 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1406 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1407 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1408 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1409 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1410 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1411 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1412 Verzögerung dieser Sortiernetzwerke gleich ist.
1413
1414 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1415 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1416 gute Schnittmuster anzugeben.
1417
1418 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1419 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1420 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1421 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1422 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1423 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1424 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1425 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1426 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1427
1428 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1429 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1430 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1431 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1432 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1433 $\operatorname{OET}(n-m)$-Netzwerk.
1434
1435 \begin{figure}
1436   \begin{center}
1437     \input{images/16-ec-from-ps32.tex}
1438   \end{center}
1439   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1440     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1441     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1442     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1443   \label{fig:16-ec-from-ps32}
1444 \end{figure}
1445
1446 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1447
1448 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1449 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1450 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1451 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1452 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1453 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1454 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1455 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1456
1457 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1458 einsetzt und auch nicht auf einem Mischer basiert, ist der
1459 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1460 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1461 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1462 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1463 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1464
1465 \begin{displaymath}
1466 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1467   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1468    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1469         ? & \quad \mathrm{sonst}
1470   \end{array} \right.
1471 \end{displaymath}
1472
1473 \begin{figure}
1474   \begin{center}
1475     \input{images/32-pairwise-cut-16-pairwise.tex}
1476   \end{center}
1477   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1478   \label{fig:ps16-from-ps32}
1479 \end{figure}
1480
1481 \begin{figure}
1482   \begin{center}
1483     \input{images/16-pairwise.tex}
1484   \end{center}
1485   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1486   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1487   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1488   \label{fig:16-pairwise}
1489 \end{figure}
1490
1491 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1492 man $\operatorname{OES}(8)$ erhalten.
1493
1494 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1495
1496 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1497
1498 \begin{itemize}
1499   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1500   \item Wie gut kann man durch wegschneiden werden?
1501   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1502   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1503   Netzwerk / Knoten in der Markov-Kette?
1504   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1505 \end{itemize}
1506
1507 \newpage
1508 \section{Der \textsc{SN-Markov}-Algorithmus}
1509 \label{sect:markov}
1510
1511 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1512 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1513 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1514 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1515 verwendet und mit sich selbst kombiniert wird.
1516
1517 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1518 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1519 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1520 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1521 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1522 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1523
1524 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1525 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1526 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1527 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1528 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1529 selbst erzeugen kann.
1530
1531 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1532 (unterschiedlicher) Schnittmuster und damit die Anzahl der Nachfolger sehr
1533 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1534 zu
1535 \begin{displaymath}
1536   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1537 \end{displaymath}
1538 Nachfolger.
1539
1540 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1541 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1542 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1543 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1544 selbst und erhält so einen zufälligen Nachfolger.
1545
1546 \begin{itemize}
1547   \item $n \leftarrow \mathrm{Input}$
1548   \item \texttt{while} \textit{true}
1549   \begin{itemize}
1550     \item $n \leftarrow \operatorname{recombine} (n, n)$
1551   \end{itemize}
1552 \end{itemize}
1553
1554 \begin{itemize}
1555   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1556   \item Anzahl der erreichbaren Sortiernetzwerke.
1557   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1558     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1559 \end{itemize}
1560
1561 \begin{figure}
1562   \begin{center}
1563   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1564   \end{center}
1565   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1566   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1567   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1568   \label{fig:markov-comparators-12}
1569 \end{figure}
1570
1571 \begin{figure}
1572   \begin{center}
1573   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1574   \end{center}
1575   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1576   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1577   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1578   \label{fig:markov-comparators-14}
1579 \end{figure}
1580
1581 \begin{figure}
1582   \begin{center}
1583   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1584   \end{center}
1585   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1586   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1587   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1588   \label{fig:markov-comparators-16}
1589 \end{figure}
1590
1591 \newpage
1592 \section{Empirische Beobachtungen}
1593
1594 \begin{itemize}
1595 \item So schnell konvergiert der Algorithmus.
1596 \item $\ldots$
1597 \end{itemize}
1598
1599 \newpage
1600 \section{Ausblick}
1601
1602 Das würde mir noch einfallen$\ldots$
1603
1604 \newpage
1605 \section{Implementierung}
1606
1607 So habe ich die ganzen Versuche durchgeführt.
1608
1609 \newpage
1610 \bibliography{references}
1611 \bibliographystyle{plain}
1612
1613 %\listoffigures
1614
1615 \end{document}
1616
1617 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :