diplomarbeit.tex

   1 \documentclass[a4paper,11pt]{article}
   2 \usepackage[utf8]{inputenc}
   3 \usepackage{ngerman}
   4 \usepackage{fancyhdr}
   5 \usepackage{geometry}
   6 \usepackage{amsmath, bbm}
   7 \usepackage{amsfonts}
   8 \usepackage{amssymb}
   9 \usepackage{listings}
  10 \usepackage{graphicx}
  11 \usepackage{url}
  12 %\usepackage{longtable}
  13 \usepackage{subfigure}
  14 \usepackage{icomma}
  15
  16 \usepackage{tikz}
  17 \usetikzlibrary{arrows,shapes}
  18
  19 % Fuer mathtoolsset
  20 \usepackage{mathtools}
  21
  22 \geometry{paper=a4paper,margin=30mm}
  23
  24 \pagestyle{fancy}
  25 %\fancyhf{}
  26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
  27 %\fancyhead[CO,CE]{2006-05-15}
  28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
  29
  30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
  31 \author{Florian Forster}
  32 \date{\today}
  33
  34 \newcommand{\false}{\textsc{False}}
  35 \newcommand{\true}{\textsc{True}}
  36 \newcommand{\todo}[1]{{\bf TODO:} #1}
  37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
  38
  39 \newtheorem{definition}{Definition}
  40 \newtheorem{satz}{Satz}
  41
  42 % Zeige Nummern nur bei referenzierten Gleichungen an.
  43 \mathtoolsset{showonlyrefs=true}
  44
  45 \begin{document}
  46
  47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
  48 \tikzstyle{comp}     = [draw,thick,-]
  49 \tikzstyle{compup}   = [draw,thick,->]
  50 \tikzstyle{compdown} = [draw,thick,<-]
  51 \tikzstyle{edge}     = [draw,thick,-]
  52 \tikzstyle{diredge}  = [draw,thick,->]
  53 \tikzstyle{prob}     = [font=\tiny]
  54
  55 \tikzstyle{edge minimum} = [edge,color=blue!20]
  56 \tikzstyle{edge maximum} = [edge,color=red!20]
  57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
  58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
  59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
  60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
  61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
  62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
  63 \tikzstyle{comp active minimum} = [comp]
  64 \tikzstyle{comp active maximum} = [comp]
  65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
  66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
  67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
  68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
  69
  70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
  71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
  72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
  73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
  74
  75 \maketitle
  76 \begin{abstract}
  77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
  78 vorgestellt (Odd-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
  79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
  80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
  81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
  82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
  83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
  84 das hinbekomme bzw. Recht behalte.}
  85 \end{abstract}
  86 \newpage
  87
  88 \tableofcontents
  89
  90 \newpage
  91 \section{Motivation und Einleitung}
  92
  93 \subsection{Motivation}\label{sect:motivation}
  94
  95 \begin{itemize}
  96 \item Sortiernetzwerke sind toll, weil $\ldots$
  97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
  98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
  99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
 100 \end{itemize}
 101
 102 \subsection{Einleitung}\label{sect:einleitung}
 103
 104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
 105
 106 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
 107 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
 108 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
 109 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
 110 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
 111 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
 112
 113 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
 114 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
 115 erhält man ein {\em Komparatornetzwerk}.
 116
 117 \begin{figure}
 118 \begin{center}
 119 \input{images/einfaches_komparatornetzwerk.tex}
 120 \end{center}
 121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
 122 aus 5~Komparatoren.}
 123 \label{fig:einfaches_komparatornetzwerk}
 124 \end{figure}
 125
 126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
 127 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
 128 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
 129 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
 130 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
 131 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
 132 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
 133 durch schwarze Punkte symbolisiert.
 134
 135 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
 136 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
 137 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
 138 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
 139 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
 140
 141 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 142 gleichzeitig angewandt werden. Das Beispiel in
 143 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
 144 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
 145 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
 146 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
 147 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
 148 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
 149 benötigten parallelen Schritte darstellt.
 150
 151 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
 152 erzeugen, die der Sortierung der Eingabe entspricht, heißen
 153 \emph{Sortiernetzwerke}. Das in
 154 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
 155 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
 156 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
 157 zerstört.
 158
 159 \begin{figure}
 160   \begin{center}
 161     \input{images/09-e2-c24-allbut1.tex}
 162   \end{center}
 163   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
 164   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
 165   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
 166   \label{fig:09-e2-c24-allbut1}
 167 \end{figure}
 168 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
 169 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
 170 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
 171 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
 172 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
 173 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
 174 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
 175 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
 176 nicht \emph{effizient} möglich.
 177
 178 Beispielsweise sortiert das im Rahmen dieser Arbeit entdeckte
 179 Komparatornetzwerk in Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880
 180 möglichen Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4,
 181 8, 6)$ lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
 182 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge $(1,
 183 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
 184
 185 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
 186 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
 187 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
 188 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
 189 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
 190 ist.\footnote{1.307.674.368.000 Permutationen}
 191
 192 \label{sect:0-1-prinzip}
 193 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
 194 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
 195 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
 196 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
 197 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
 198 in der Ausgabe, die die Sortierbedingung verletzt:
 199 \begin{displaymath}
 200   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
 201 \end{displaymath}
 202 Die Eingabe kann mittels
 203 \begin{displaymath}
 204   \hat{e}_j = \left\{
 205     \begin{array}{cl}
 206       0 & e_j \leqq a_i \\
 207       1 & e_j > a_i
 208     \end{array} \right.
 209 \end{displaymath}
 210 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme vom
 211 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
 212 Verhalten jedes einzelnen Komparators nicht: Wenn bei der Permutation eine
 213 Zahl größer als $a_i$ und eine Zahl kleiner oder gleich $a_i$ verglichen
 214 wurden, liegen jetzt entsprechend eine Null und eine Eins an, die genauso
 215 vertauscht werden oder nicht, wie das bei der Permutation der Fall war. Liegen
 216 zwei Nullen oder zwei Einsen an, entsprechen sie zwei Zahlen kleiner als $a_i$
 217 oder zwei Zahlen größer oder gleich $a_i$. Da im Fall der 0-1-Folge zwei
 218 gleiche Zahlen am Komparator anliegen, dürfen wir davon ausgehen, dass sich
 219 der Komparator so verhält, wie er sich bei der Permutation verhalten hat --
 220 ohne das Ergebnis zu beeinflussen. Entsprechend kommen an den Ausgängen $i-1$
 221 und $i$ eine Null und eine Eins in der falschen Reihenfolge an. Das steht im
 222 Widerspruch zu der Annahme, dass alle 0-1-Folgen sortiert werden.
 223
 224 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
 225 Komplexitätsklasse
 226 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
 227 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
 228 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
 229 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
 230 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
 231 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
 232 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
 233 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
 234 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
 235 beschäftigen.
 236
 237 \subsubsection{Evolutionäre Algorithmen}
 238
 239 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
 240 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
 241 \textit{NP}, das heißt das keine Verfahren bekannt sind, die das Problem
 242 effizient exakt lösbar. Sollte sich herausstellen, dass diese Probleme nicht
 243 in der Komplexitätsklasse~\textit{P} liegen, wäre eine Konsequenz, dass es
 244 effiziente exakte Algorithmen für diese Probleme nicht geben kann. Falls sich
 245 hingegen herausstellt, dass diese Probleme in der
 246 Komplexitätsklasse~\textit{P} liegen, wird es mit großer Wahrscheinlichkeit
 247 noch einige Zeit dauern, bis auch Algorithmen mit praktikablen Zeitkonstanten
 248 gefunden werden.
 249
 250 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
 251 die beziehungsweise eine der {\em optimalen} Lösungen als einzige Ausgabe des
 252 Algorithmus zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele
 253 dieser Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
 254 beispielsweise imitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
 255 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
 256
 257 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
 258 ist, bekannte Lösungen zu neuen -- unter Umständen besseren -- Lösungen zu
 259 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
 260 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem als {\em
 261 Individuen} bezeichnet.
 262
 263 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
 264 bestehenden Lösungsmenge, der {\em Population}, werden zufällig Lösungen
 265 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
 266 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
 267 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
 268 eingefügt wird. Die verwendeten Wahrscheinlichkeiten, beispielsweise bei der
 269 {\em Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
 270 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
 271 Gütefunktion}.
 272
 273 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
 274 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
 275 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
 276 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
 277 Algorithmen verwenden als einfache, initiale Lösung häufig das
 278 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
 279 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
 280 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
 281 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
 282
 283 Beim Aussuchen von zufälligen Lösungen aus der Population, der
 284 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
 285 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
 286 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
 287 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
 288 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
 289 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
 290 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
 291 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
 292 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
 293 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
 294 findet er aber in der Regel bessere Lösungen.
 295
 296 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
 297 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
 298 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
 299 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
 300 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
 301 zwischen verschiedenen Leitungszahlen stark unterscheiden.
 302
 303 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
 304 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
 305 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
 306 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
 307 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
 308 „Ausbrechen“ und finden noch besserer Lösungen.
 309
 310 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
 311 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
 312 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
 313 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
 314 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
 315 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
 316
 317 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
 318 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
 319 mutieren lediglich Transformationen von Sortiernetzwerken, die die
 320 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
 321 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
 322 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
 323
 324 \newpage
 325 \section{Bekannte konstruktive Sortiernetzwerke}
 326 \label{sect:konstruktive_netzwerke}
 327
 328 Übersicht über bekannte konstruktive Sortiernetzwerke.
 329
 330 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
 331 \label{sect:odd_even_transpositionsort}
 332
 333 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
 334 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
 335 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
 336 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
 337 ${n = 8}$ Leitungen.
 338
 339 \begin{figure}
 340   \begin{center}
 341     \input{images/oe-transposition-8.tex}
 342   \end{center}
 343   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
 344   \label{fig:odd-even-transposition-08}
 345 \end{figure}
 346
 347 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
 348 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
 349 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
 350 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
 351 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
 352 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
 353
 354 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
 355 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
 356 Herausschneiden einer Leitung reduziert. In
 357 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
 358 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
 359 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
 360
 361 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
 362 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
 363 Komparatoren anordnen lassen, effizient. Es benötigt
 364 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
 365 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
 366 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
 367 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
 368
 369 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
 370 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
 371 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
 372 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
 373 Algorithmen.
 374
 375 \subsection{Das bitone Mergesort-Netzwerk}
 376
 377 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
 378 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
 379 veröffentlicht wurde. Es ist deutlich effizienter als das
 380 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
 381 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
 382 Schichten.
 383
 384 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
 385 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
 386 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
 387 verleiht dem Sortiernetzwerk seinen Namen.
 388
 389 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
 390 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
 391 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
 392
 393 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
 394
 395 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
 396 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
 397 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
 398 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
 399 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
 400 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
 401 entstehen können. Die wichtigsten Varianten für das \emph{bitone
 402 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
 403 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
 404 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
 405 ist wichtig zu beachten, dass das letzte Element nicht größer
 406 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
 407 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
 408 darf.
 409
 410 \begin{figure}
 411   \centering
 412   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
 413   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
 414   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
 415   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
 416   \caption{Beispiele bitoner Folgen.}
 417   \label{fig:beispiel-biton}
 418 \end{figure}
 419
 420 \begin{figure}
 421   \centering
 422   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
 423   \qquad
 424   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
 425   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
 426   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
 427   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
 428   resultierenden Teilfolgen sind wiederum biton.}
 429   \label{fig:bitonic-merge-schema}
 430 \end{figure}
 431
 432 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
 433 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
 434 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
 435 sortiert, die Folge $V$ sei absteigend sortiert:
 436 \begin{eqnarray}
 437  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
 438  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
 439 \end{eqnarray}
 440 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
 441 Positionen verglichen und ggf. vertauscht:
 442 \begin{equation}
 443 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
 444 \end{equation}
 445 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
 446 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
 447 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
 448 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
 449 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
 450 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
 451 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
 452 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
 453 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
 454 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
 455 zeigt die Situationen vor und nach diesem Schritt des Mischers.
 456
 457 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
 458 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
 459 mithilfe des bitonen Mischers, mit zwei Instanzen von
 460 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
 461 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
 462 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
 463 definiert ist.
 464
 465 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
 466 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
 467 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
 468 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
 469 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
 470 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
 471 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
 472
 473 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
 474 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
 475 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
 476 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
 477 besteht, die in $\log(n)$~Schichten angeordnet werden können.
 478
 479 \subsubsection{Das bitone Mergesort-Netzwerk}
 480
 481 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
 482 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
 483 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
 484 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
 485 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
 486 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
 487 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist.
 488 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
 489 $\operatorname{BS}(2)$ identisch.
 490
 491 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
 492 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
 493 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
 494 alle Komparatoren in die gleiche Richtung zeigen.
 495
 496 \begin{figure}
 497   \begin{center}
 498   \input{images/batcher-8.tex}
 499   \end{center}
 500   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
 501   für acht Eingänge. Markiert sind die beiden Instanzen von
 502   $\operatorname{BS}(4)$ (rot), die beiden bitonen
 503   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
 504   rekursiven Schritt hinzugefügt wurden (grün).}
 505   \label{fig:bitonic-08}
 506 \end{figure}
 507
 508 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
 509 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
 510 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
 511 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
 512 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
 513 grün hinterlegt.
 514
 515 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
 516 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
 517 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
 518 Schichten angeordnet sind.
 519
 520 %\begin{figure}
 521 %\begin{center}
 522 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
 523 %\end{center}
 524 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
 525 %$S(n/2)$ und dem Mischer $M(n)$.}
 526 %\label{fig:bms_rekursiver_aufbau}
 527 %\end{figure}
 528
 529 \subsection{Das Odd-Even-Mergesort-Netzwerk}
 530
 531 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
 532 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
 533 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
 534 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
 535 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
 536 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
 537 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
 538 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
 539
 540 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
 541
 542 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
 543 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
 544 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
 545 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
 546 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
 547 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
 548 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
 549
 550 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
 551 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
 552 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
 553 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
 554 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
 555 \begin{equation}
 556 w_i = \left\{ \begin{array}{ll}
 557         u_i,     & i < n \\
 558         v_{i-n}, & i \geqq n
 559       \end{array} \right.,
 560       \quad 0 \leqq i < N
 561 \end{equation}
 562
 563 \begin{figure}
 564   \begin{center}
 565   \input{images/oe-merge.tex}
 566   \end{center}
 567   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
 568   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
 569   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
 570   \label{fig:oe-merge}
 571 \end{figure}
 572
 573 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
 574 geraden Indizes und je eine Liste der ungeraden Indizes.
 575 \begin{eqnarray}
 576   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
 577   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
 578   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
 579   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
 580 \end{eqnarray}
 581
 582 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
 583 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
 584 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
 585 Ausgang der Mischer die Folgen
 586 \begin{eqnarray}
 587   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
 588   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
 589 \end{eqnarray}
 590 ergeben.
 591
 592 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
 593 hinzugefügt,
 594 \begin{equation}
 595   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
 596 \end{equation}
 597 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
 598 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
 599
 600 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
 601 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
 602 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
 603 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
 604 Aufbau lauten:
 605 \begin{itemize}
 606   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
 607   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
 608   einzelnen Komparator.
 609 \end{itemize}
 610
 611 Dass die resultierende Folge sortiert ist, lässt sich mit dem
 612 {\em 0-1-Prinzip} zeigen:
 613 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
 614 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
 615 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
 616 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
 617 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
 618 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
 619 \begin{eqnarray}
 620   \left|W_{\textrm{gerade}}\right|_0
 621   &=& \left|U_{\textrm{gerade}}\right|_0
 622     + \left|V_{\textrm{gerade}}\right|_0
 623    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
 624    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
 625   \left|W_{\textrm{ungerade}}\right|_0
 626   &=& \left|U_{\textrm{ungerade}}\right|_0
 627     + \left|V_{\textrm{ungerade}}\right|_0
 628    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
 629    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
 630 \end{eqnarray}
 631 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
 632 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
 633 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
 634 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
 635 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
 636 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
 637 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
 638 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
 639
 640 \begin{figure}
 641   \centering
 642   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
 643   \qquad
 644   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
 645   \qquad
 646   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
 647   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
 648   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
 649   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
 650   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
 651   sortiert ist.}
 652   \label{fig:oe-post-recursive}
 653 \end{figure}
 654
 655 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
 656 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
 657 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
 658 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
 659 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
 660
 661 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
 662 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
 663 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
 664 \begin{displaymath}
 665   K(n,m) = \left\{ \begin{array}{ll}
 666     nm, & \mathrm{falls} \quad nm \leqq 1 \\
 667     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
 668     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
 669     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
 670   \end{array} \right.
 671 \end{displaymath}
 672 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
 673 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
 674 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
 675
 676 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
 677 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
 678 Rekursionsschritt der OEM-Konstruktion fügt
 679 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
 680 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
 681 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
 682 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
 683 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
 684 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
 685 \begin{displaymath}
 686   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
 687 \end{displaymath}
 688 Komparatoren eingespart. Damit ergibt sich
 689 \begin{displaymath}
 690   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
 691 \end{displaymath}
 692 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
 693 benötigt werden.
 694
 695 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
 696
 697 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
 698 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
 699 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
 700 effizientesten Sortiernetzwerke in Bezug auf Komparator- und Schichtzahl
 701 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
 702 $\operatorname{OES}(n)$ aus
 703 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
 704 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
 705 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
 706 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
 707 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
 708 Komparatornetzwerke definiert sind.
 709
 710 \begin{figure}
 711   \begin{center}
 712   \input{images/oe-mergesort-8.tex}
 713   \end{center}
 714   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
 715   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
 716   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
 717   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
 718   Komparatoren zwischen benachbarten Leitungen (grün).}
 719   \label{fig:odd-even-mergesort-08}
 720 \end{figure}
 721
 722 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
 723 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
 724 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
 725 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
 726 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
 727 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
 728
 729 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
 730 \emph{Odd-Even-Mergesort-Netz\-werk} verwendet wird, $k(n)$, direkt aus der
 731 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
 732 \begin{displaymath}
 733   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
 734        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
 735        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
 736 \end{displaymath}
 737 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
 738 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
 739 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
 740
 741 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
 742 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
 743 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
 744 \begin{displaymath}
 745   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
 746 \end{displaymath}
 747 gilt.
 748
 749 % gnuplot:
 750 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
 751 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
 752 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
 753
 754 %\begin{itemize}
 755 %\item Pairwise sorting-network
 756 %\end{itemize}
 757
 758 \newpage
 759 \section{Transformation von Sortiernetzwerken}
 760 \label{sect:tranformation}
 761
 762 \subsection{Komprimieren}
 763
 764 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 765 gleichzeitig ausgewertet werden, wie bereits in
 766 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
 767 Transformationen, insbesondere das Entfernen einer Leitung, das in
 768 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
 769 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
 770 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
 771 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
 772 die jeden Komparator so früh wie möglich ausführt. So entsteht die
 773 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
 774 unterteilen lässt.
 775
 776 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
 777 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
 778 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
 779 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
 780 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
 781 Komprimierung durchgeführt werden.
 782
 783 \subsection{Normalisieren}
 784
 785 \begin{figure}
 786   \centering
 787   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
 788   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
 789   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
 790   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
 791   intuitiven Konstruktion und die normalisierte Variante.}
 792   \label{fig:beispiel_normalisieren}
 793 \end{figure}
 794
 795 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
 796 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
 797 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
 798 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
 799 in~\cite{KNUTH} einen Algorithmus an.
 800
 801 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
 802 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
 803 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
 804 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
 805 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
 806 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist.
 807 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
 808 Definition.
 809
 810 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
 811 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
 812 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
 813 und das Trichtermuster zu sehen.
 814
 815 \subsection{Zwei Netzwerke kombinieren}
 816
 817 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
 818 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
 819 Sortiernetzwerk zusammenzufassen.
 820
 821 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
 822 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
 823 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
 824 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
 825 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
 826 und Weise rekursiv aufgebaut.
 827
 828 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
 829 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
 830 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
 831 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
 832 zusammenfügen.
 833
 834 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
 835 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
 836 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
 837 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
 838 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
 839 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
 840
 841 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
 842 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
 843 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
 844 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
 845 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
 846 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
 847 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
 848 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
 849 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
 850 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
 851 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
 852 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
 853 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
 854 6~Komparatoren weniger.
 855
 856 % 9   9
 857 % 9  18
 858 % 9  27
 859 % 9  36
 860 % 9  45
 861 % 8  53
 862 % 8  61
 863 % 7  68
 864 % 7  75
 865 % 6  81
 866 % 5  86
 867
 868 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
 869 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
 870 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
 871 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
 872 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
 873 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
 874 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
 875 nur mit exponentiellem Aufwand möglich ist.
 876
 877 %\begin{itemize}
 878 %\item Mit dem Bitonic-Merge
 879 %\item Mit dem Odd-Even-Merge
 880 %\item Nach dem Pairwise sorting-network Schema.
 881 %\end{itemize}
 882
 883 \subsection{Leitungen entfernen}
 884 \label{sect:leitungen_entfernen}
 885
 886 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
 887 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
 888 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
 889 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
 890 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
 891 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
 892
 893 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
 894 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
 895 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
 896 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
 897 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
 898 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
 899 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
 900 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
 901 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
 902 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
 903 das {\em Odd-Even-Transpositionsort-Netzwerk}.
 904
 905 \begin{figure}
 906   \centering
 907   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
 908   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
 909   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
 910   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
 911   \caption{Eine Leitung wird aus dem
 912   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
 913   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
 914   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
 915   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
 916   Pfad herausgetrennt werden. In der letzten Abbildung ist
 917   $\operatorname{OET}(7)$ markiert.}
 918   \label{fig:oe-transposition-cut}
 919 \end{figure}
 920
 921 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
 922 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
 923 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
 924 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
 925 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
 926 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
 927 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
 928 auf die keine Komparatoren mehr berührt
 929 (Abbildung~\ref{fig:oe-transposition-cut1}).
 930
 931 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
 932 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
 933 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
 934 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
 935 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
 936 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
 937 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
 938 mit $(n-1)$~Elementen darstellen.
 939
 940 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
 941 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
 942 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
 943 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
 944 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
 945
 946 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
 947 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
 948 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
 949 Darstellung ergibt. Ausserdem ist das
 950 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
 951 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
 952 Ausgabe und kann entfernt werden.
 953
 954 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
 955 \label{sect:anzahl_schnittmuster}
 956
 957 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
 958 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
 959 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
 960 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
 961 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
 962 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
 963 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
 964 \emph{$k$-Schnittmuster}.
 965
 966 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
 967 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
 968 Schnittmuster \emph{unterschiedlich} bezüglich~$S$.
 969
 970 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
 971 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
 972 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
 973 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
 974 ergeben sich insgesamt
 975 \begin{equation}\label{eqn:anzahl_schnittmuster}
 976   \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
 977   \quad (n > m)
 978 \end{equation}
 979 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
 980 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
 981 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
 982 führen beide Reihenfolgen zum selben Ergebnis.
 983
 984 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit~\cite{M2009}, dass es
 985 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
 986 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
 987 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
 988 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
 989 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
 990 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
 991 der möglichen Schnittmuster:
 992 \begin{displaymath}
 993   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
 994   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
 995   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
 996   \quad (1 \leqq k < n)
 997 \end{displaymath}
 998
 999 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
1000 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
1001 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
1002 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
1003 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
1004 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
1005
1006 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
1007 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
1008 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
1009 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
1010 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1011 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1012 Werte unterscheiden.
1013
1014 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1015 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
1016 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1017 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1018 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1019 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1020 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1021 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1022
1023 \begin{figure}
1024   \begin{center}
1025     \includegraphics[viewport=0 0 425 262,width=15cm]{images/count-cuts-16.pdf}
1026   \end{center}
1027   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1028   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1029   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1030   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1031   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1032   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1033   \label{fig:count-cuts-16}
1034 \end{figure}
1035
1036 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1037 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1038 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1039 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1040 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
1041 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
1042 angewandt. Anschließend wurde mithilfe einer Hashtabelle überprüft, ob das
1043 resultierende Sortiernetzwerk schon von einem \emph{äquivalenten}
1044 Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk noch nicht in der
1045 Hashtabelle enthalten war, wurde der Zähler für unterschiedliche Schnittmuster
1046 erhöht und das Sortiernetzwerk eingefügt.
1047
1048 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1049 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1050 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1051 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1052 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1053 nahe ist.
1054
1055 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1056 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
1057 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
1058 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
1059 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
1060 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
1061 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
1062 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
1063 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1064 vernachlässigbar klein ist.
1065
1066 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1067 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1068 Die Hashtabelle benötigt mehr Arbeitsspeicher als in derzeitigen Rechnern
1069 vorhanden ist, bevor ein entsprechender Graph den linearen Bereich für
1070 „kleine“ x-Werte verlässt.
1071
1072 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1073 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1074 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1075 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1076 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
1077 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in
1078 $S$ enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1079 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1080 unterschiedlichen Schnittmuster abschätzen.
1081
1082 \begin{figure}
1083   \begin{center}
1084     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1085   \end{center}
1086   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1087   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1088   $\operatorname{BS}(32)$.}
1089   \label{fig:collisions-10000-1000000-32}
1090 \end{figure}
1091
1092 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1093 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1094 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1095 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1096 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1097 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1098 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1099 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1100 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1101 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1102 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1103
1104 \begin{figure}
1105   \begin{center}
1106     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1107   \end{center}
1108   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1109   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1110   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1111   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1112   unterschiedlichen Schnittmustern.}
1113   \label{fig:collisions-100000-1000000-32-ps}
1114 \end{figure}
1115
1116 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1117 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1118 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1119 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1120 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1121 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1122 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1123 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1124 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1125 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1126 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1127 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1128 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1129 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1130 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1131 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1132 die Anzahl der \emph{möglichen} Schnittmuster.
1133
1134 \newpage
1135 \section{Der \textsc{SN-Evolution}-Algorithmus}
1136
1137 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1138 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1139 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1140 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1141 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1142 in Abschnitt~\ref{sect:bewertung} behandelt.
1143
1144 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1145
1146 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1147 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1148 die bei Sortiernetzwerken verfolgt werden können:
1149 \begin{itemize}
1150   \item Möglichst wenige Komparatoren („effizient“)
1151   \item Möglichst wenige Schichten („schnell“)
1152 \end{itemize}
1153
1154 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1155 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1156 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1157 61~Komparatoren in nur 9~Schichten.
1158
1159 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1160 berücksichtigen kann, hat die folgende allgemeine Form:
1161 \begin{equation}
1162   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1163                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1164                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1165 \end{equation}
1166 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1167 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1168 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1169 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1170 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1171 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1172 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1173
1174 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1175 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1176 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1177 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1178
1179 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1180 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1181 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1182 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1183 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1184 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1185 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1186
1187 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1188 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1189 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1190 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1191 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1192
1193 \subsection{Selektion}
1194
1195 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1196 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1197 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1198 Streben des Algorithmus nach besseren Lösungen.
1199
1200 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1201 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1202 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1203
1204 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1205 Pseudocode wie folgt beschreiben:
1206 \begin{verbatim}
1207 Gütesumme := 0
1208 Auswahl := (leer)
1209
1210 für jedes Individuum in Population
1211 {
1212   reziproke Güte := 1.0 / Guete(Individuum)
1213   Wahrscheinlichkeit P := reziproke Güte / (reziproke Güte + Gütesumme)
1214   Gütesumme := Gütesumme + reziproke Güte
1215
1216   mit Wahrscheinlichkeit P
1217   {
1218     Auswahl := Individuum
1219   }
1220 }
1221 gib Auswahl zurück
1222 \end{verbatim}
1223
1224 \subsection{Rekombination}
1225
1226 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1227 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1228 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1229 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1230 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1231 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1232 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1233
1234 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1235 erhält.
1236
1237 \subsection{Mutation}
1238
1239 Zu einem vollständigen evolutionären Algorithmus gehört außerdem die Mutation
1240 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1241 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1242 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1243 Eigenschaft zerstören.
1244
1245 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1246 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1247 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1248 Ausprobieren aller $2^n$~Bitmuster, wie in Abschnitt~\ref{sect:0-1-prinzip}
1249 beschrieben.
1250
1251 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1252 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1253 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1254 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1255 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1256
1257 \begin{itemize}
1258 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1259 Schichten, kobiniert)
1260 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1261 \end{itemize}
1262
1263 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1264 Abbildung~\ref{fig:evolutionary_08}.
1265
1266 \begin{figure}
1267 \begin{center}
1268 \input{images/evolutionary-08.tex}
1269 \end{center}
1270 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1271 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1272 \label{fig:evolutionary_08}
1273 \end{figure}
1274
1275 \begin{figure}
1276 \begin{center}
1277 \input{images/08-e2-1237993371.tex}
1278 \end{center}
1279 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1280 \label{fig:08-e2-1237993371}
1281 \end{figure}
1282
1283 \begin{figure}
1284 \begin{center}
1285 \input{images/09-e2-1237997073.tex}
1286 \end{center}
1287 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1288 \label{fig:09-e2-1237997073}
1289 \end{figure}
1290
1291 \begin{figure}
1292 \begin{center}
1293 \input{images/09-e2-1237999719.tex}
1294 \end{center}
1295 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1296 \label{fig:09-e2-1237999719}
1297 \end{figure}
1298
1299 \begin{figure}
1300 \begin{center}
1301 \input{images/10-e2-1239014566.tex}
1302 \end{center}
1303 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1304 \label{fig:10-e2-1239014566}
1305 \end{figure}
1306
1307 \subsection{Güte}
1308
1309 \begin{itemize}
1310 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1311 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1312 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1313 \end{itemize}
1314
1315 %\input{shmoo-aequivalenz.tex}
1316
1317 \newpage
1318 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1319 \label{sect:sn-evolution-cut}
1320
1321 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1322 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1323 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1324 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1325 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1326 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1327 gute Schnittmuster gesucht.
1328
1329 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1330 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1331 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1332 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1333 $0 \leqq r \leqq c$.
1334
1335 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1336 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1337 Schnitt-Richtung.
1338
1339 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1340
1341 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1342 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1343 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1344 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1345 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1346 werden, Komparatoren ein.
1347
1348 Beispielsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1349 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1350 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1351 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1352 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1353 Komparatoren ein.
1354
1355 \begin{figure}
1356   \begin{center}
1357     \input{images/16-ec-from-bs32.tex}
1358   \end{center}
1359   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1360     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1361     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1362     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1363   \label{fig:16-ec-from-bs32}
1364 \end{figure}
1365
1366 \begin{figure}
1367   \begin{center}
1368     \input{images/16-ec-from-bs32-normalized.tex}
1369   \end{center}
1370   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1371     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1372     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1373     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1374   \label{fig:16-ec-from-bs32-normalized}
1375 \end{figure}
1376
1377 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1378 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1379 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1380 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1381 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1382 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1383 und das
1384 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1385 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1386 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1387 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1388 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1389 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1390 Netzwerks scheinen rein zufällig zu sein.
1391
1392 \begin{figure}
1393   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1394   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1395   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1396   % 63:MAX
1397   \begin{center}
1398     \input{images/32-ec-from-bs64.tex}
1399   \end{center}
1400   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1401     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1402     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1403     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1404     Schnittmuster ist
1405     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1406     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1407     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1408   \label{fig:32-ec-from-bs64}
1409 \end{figure}
1410
1411 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1412 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1413 konstruiert haben, kann demnach auch erreicht werden, wenn
1414 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1415 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1416 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1417 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1418 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1419 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1420 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1421 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1422 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1423 Verzögerung dieser Sortiernetzwerke gleich ist.
1424
1425 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1426 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1427 gute Schnittmuster anzugeben.
1428
1429 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1430 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1431 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1432 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1433 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1434 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1435 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1436 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1437 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1438
1439 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1440 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1441 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1442 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1443 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1444 $\operatorname{OET}(n-m)$-Netzwerk.
1445
1446 \begin{figure}
1447   \begin{center}
1448     \input{images/16-ec-from-ps32.tex}
1449   \end{center}
1450   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1451     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1452     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1453     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1454   \label{fig:16-ec-from-ps32}
1455 \end{figure}
1456
1457 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1458
1459 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1460 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1461 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1462 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1463 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1464 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1465 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1466 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1467
1468 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1469 einsetzt und auch nicht auf einem Mischer basiert, ist der
1470 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1471 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1472 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1473 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1474 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1475
1476 \begin{displaymath}
1477 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1478   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1479    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1480         ? & \quad \mathrm{sonst}
1481   \end{array} \right.
1482 \end{displaymath}
1483
1484 \begin{figure}
1485   \begin{center}
1486     \input{images/32-pairwise-cut-16-pairwise.tex}
1487   \end{center}
1488   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1489   \label{fig:ps16-from-ps32}
1490 \end{figure}
1491
1492 \begin{figure}
1493   \begin{center}
1494     \input{images/16-pairwise.tex}
1495   \end{center}
1496   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1497   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1498   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1499   \label{fig:16-pairwise}
1500 \end{figure}
1501
1502 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1503 man $\operatorname{OES}(8)$ erhalten.
1504
1505 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1506
1507 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1508
1509 \begin{itemize}
1510   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1511   \item Wie gut kann man durch wegschneiden werden?
1512   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1513   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1514   Netzwerk / Knoten in der Markov-Kette?
1515   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1516 \end{itemize}
1517
1518 \newpage
1519 \section{Der \textsc{SN-Markov}-Algorithmus}
1520 \label{sect:markov}
1521
1522 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1523 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1524 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1525 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1526 verwendet und mit sich selbst kombiniert wird.
1527
1528 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1529 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1530 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1531 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1532 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1533 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1534
1535 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1536 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1537 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1538 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1539 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1540 selbst erzeugen kann.
1541
1542 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben, ist die Anzahl
1543 der \emph{unterschiedlichen} Schnittmuster und damit die Anzahl der Nachfolger
1544 sehr groß. Bei den untersuchten 16-Sortiernetzwerken lag die Anzahl der
1545 Nachfolger zwar noch unter 20000, bei den untersuchten 32-Sortiernetzwerken
1546 wurden jedoch bereits bis zu $2,6 \cdot 10^8$ unterschiedliche Schnittmuster
1547 geschätzt.
1548
1549 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1550 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1551 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1552 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1553 selbst und erhält so einen zufälligen Nachfolger. In Pseudocode lässt dich der
1554 Algorithmus wie folgt beschreiben:
1555
1556 \begin{verbatim}
1557 Netzwerk := Eingabe
1558
1559 für n Iterationen
1560 {
1561   Nachfolger := kombiniere (Netzwerk, Netzwerk)
1562   Netzwerk   := Nachfolger
1563 }
1564
1565 gib Netzwerk zurück
1566 \end{verbatim}
1567
1568 \begin{figure}
1569   \begin{center}
1570   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-cycles-16.pdf}
1571   \end{center}
1572   \caption{Zyklen, die beim \textit{Random Walk} des
1573   \textsc{SN-Markov}-Algorithmus detektiert wurden. Auf der x-Achse sind die
1574   Anzahl der Schritte, die \textsc{SN-Markov} zurückgelegt hat, auf der
1575   y-Achse die Längen der gefundenen Zyklen aufgetragen. Das initiale
1576   Start-Sortiernetzwerk war $\operatorname{OET}(16)$.}
1577   \label{fig:markov-cycles-16}
1578 \end{figure}
1579
1580
1581 \begin{itemize}
1582   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1583   \item Anzahl der erreichbaren Sortiernetzwerke.
1584   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1585     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1586 \end{itemize}
1587
1588 \begin{figure}
1589   \begin{center}
1590   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-12-pct.pdf}
1591   \end{center}
1592   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1593   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1594   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1595   \label{fig:markov-comparators-12}
1596 \end{figure}
1597
1598 \begin{figure}
1599   \begin{center}
1600   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-14-pct.pdf}
1601   \end{center}
1602   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1603   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1604   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1605   \label{fig:markov-comparators-14}
1606 \end{figure}
1607
1608 \begin{figure}
1609   \begin{center}
1610   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-16-pct.pdf}
1611   \end{center}
1612   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1613   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1614   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1615   \label{fig:markov-comparators-16}
1616 \end{figure}
1617
1618 \begin{figure}
1619   \begin{center}
1620   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-18-pct.pdf}
1621   \end{center}
1622   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 18~Leitungen),
1623   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1624   \emph{Gamma-Verteilung} $f(x - 81)$ mit $k = 10,724$ und $\theta = 0,766$.}
1625   \label{fig:markov-comparators-18}
1626 \end{figure}
1627
1628 \newpage
1629 \section{Empirische Beobachtungen}
1630
1631 \begin{itemize}
1632 \item So schnell konvergiert der Algorithmus.
1633 \item $\ldots$
1634 \end{itemize}
1635
1636 \newpage
1637 \section{Ausblick}
1638
1639 Das würde mir noch einfallen$\ldots$
1640
1641 \newpage
1642 \section{Implementierung}
1643
1644 So habe ich die ganzen Versuche durchgeführt.
1645
1646 \newpage
1647 \bibliography{references}
1648 \bibliographystyle{plain}
1649
1650 %\listoffigures
1651
1652 \end{document}
1653
1654 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :