diplomarbeit.tex

   1 \documentclass[a4paper,11pt]{article}
   2 \usepackage[utf8]{inputenc}
   3 \usepackage{ngerman}
   4 \usepackage{fancyhdr}
   5 \usepackage{geometry}
   6 \usepackage{amsmath, bbm}
   7 \usepackage{amsfonts}
   8 \usepackage{amssymb}
   9 \usepackage{listings}
  10 \usepackage{graphicx}
  11 \usepackage{url}
  12 %\usepackage{longtable}
  13 \usepackage{subfigure}
  14 \usepackage{icomma}
  15
  16 \usepackage{tikz}
  17 \usetikzlibrary{arrows,shapes}
  18
  19 % Fuer mathtoolsset
  20 \usepackage{mathtools}
  21
  22 \geometry{paper=a4paper,margin=30mm}
  23
  24 \pagestyle{fancy}
  25 %\fancyhf{}
  26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
  27 %\fancyhead[CO,CE]{2006-05-15}
  28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
  29
  30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
  31 \author{Florian Forster}
  32 \date{\today}
  33
  34 \newcommand{\false}{\textsc{False}}
  35 \newcommand{\true}{\textsc{True}}
  36 \newcommand{\todo}[1]{{\bf TODO:} #1}
  37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
  38
  39 \newcommand{\oes}[1]{\ensuremath{\operatorname{OES}(#1)}}
  40 \newcommand{\bs}[1]{\ensuremath{\operatorname{BS}(#1)}}
  41 \newcommand{\ps}[1]{\ensuremath{\operatorname{PS}(#1)}}
  42 \newcommand{\oem}[1]{\ensuremath{\operatorname{OEM}(#1)}}
  43 \newcommand{\bm}[1]{\ensuremath{\operatorname{BM}(#1)}}
  44
  45 \newtheorem{definition}{Definition}
  46 \newtheorem{satz}{Satz}
  47
  48 % Zeige Nummern nur bei referenzierten Gleichungen an.
  49 \mathtoolsset{showonlyrefs=true}
  50
  51 \begin{document}
  52
  53 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
  54 \tikzstyle{comp}     = [draw,thick,-]
  55 \tikzstyle{compup}   = [draw,thick,->]
  56 \tikzstyle{compdown} = [draw,thick,<-]
  57 \tikzstyle{edge}     = [draw,thick,-]
  58 \tikzstyle{diredge}  = [draw,thick,->]
  59 \tikzstyle{prob}     = [font=\tiny]
  60
  61 \tikzstyle{edge minimum} = [edge,color=blue!20]
  62 \tikzstyle{edge maximum} = [edge,color=red!20]
  63 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
  64 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
  65 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
  66 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
  67 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
  68 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
  69 \tikzstyle{comp active minimum} = [comp]
  70 \tikzstyle{comp active maximum} = [comp]
  71 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
  72 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
  73 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
  74 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
  75
  76 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
  77 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
  78 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
  79 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
  80
  81 \maketitle
  82 \begin{abstract}
  83 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
  84 vorgestellt (Odd-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
  85 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
  86 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
  87 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
  88 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
  89 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
  90 das hinbekomme bzw. Recht behalte.}
  91 \end{abstract}
  92 \newpage
  93
  94 \tableofcontents
  95
  96 \newpage
  97 \section{Motivation und Einleitung}
  98
  99 \subsection{Motivation}\label{sect:motivation}
 100
 101 \begin{itemize}
 102 \item Sortiernetzwerke sind toll, weil $\ldots$
 103 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
 104 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
 105   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
 106 \end{itemize}
 107
 108 \subsection{Einleitung}\label{sect:einleitung}
 109
 110 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
 111
 112 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
 113 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
 114 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
 115 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
 116 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
 117 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
 118
 119 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
 120 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
 121 erhält man ein {\em Komparatornetzwerk}.
 122
 123 \begin{figure}
 124 \begin{center}
 125 \input{images/einfaches_komparatornetzwerk.tex}
 126 \end{center}
 127 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
 128 aus 5~Komparatoren.}
 129 \label{fig:einfaches_komparatornetzwerk}
 130 \end{figure}
 131
 132 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
 133 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
 134 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
 135 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
 136 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
 137 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
 138 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
 139 durch schwarze Punkte symbolisiert.
 140
 141 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
 142 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
 143 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
 144 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
 145 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
 146
 147 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 148 gleichzeitig angewandt werden. Das Beispiel in
 149 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
 150 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
 151 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
 152 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
 153 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
 154 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
 155 benötigten parallelen Schritte darstellt.
 156
 157 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
 158 erzeugen, die der Sortierung der Eingabe entspricht, heißen
 159 \emph{Sortiernetzwerke}. Das in
 160 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
 161 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
 162 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
 163 zerstört.
 164
 165 \begin{figure}
 166   \begin{center}
 167     \input{images/09-e2-c24-allbut1.tex}
 168   \end{center}
 169   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
 170   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
 171   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
 172   \label{fig:09-e2-c24-allbut1}
 173 \end{figure}
 174 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
 175 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
 176 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
 177 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
 178 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
 179 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
 180 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
 181 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
 182 nicht \emph{effizient} möglich.
 183
 184 Beispielsweise sortiert das im Rahmen dieser Arbeit entdeckte
 185 Komparatornetzwerk in Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880
 186 möglichen Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4,
 187 8, 6)$ lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
 188 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge $(1,
 189 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
 190
 191 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
 192 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
 193 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
 194 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
 195 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
 196 ist.\footnote{1.307.674.368.000 Permutationen}
 197
 198 \label{sect:0-1-prinzip}
 199 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
 200 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
 201 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
 202 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
 203 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
 204 in der Ausgabe, die die Sortierbedingung verletzt:
 205 \begin{displaymath}
 206   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
 207 \end{displaymath}
 208 Die Eingabe kann mittels
 209 \begin{displaymath}
 210   \hat{e}_j = \left\{
 211     \begin{array}{cl}
 212       0 & e_j \leqq a_i \\
 213       1 & e_j > a_i
 214     \end{array} \right.
 215 \end{displaymath}
 216 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme vom
 217 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
 218 Verhalten jedes einzelnen Komparators nicht: Wenn bei der Permutation eine
 219 Zahl größer als $a_i$ und eine Zahl kleiner oder gleich $a_i$ verglichen
 220 wurden, liegen jetzt entsprechend eine Null und eine Eins an, die genauso
 221 vertauscht werden oder nicht, wie das bei der Permutation der Fall war. Liegen
 222 zwei Nullen oder zwei Einsen an, entsprechen sie zwei Zahlen kleiner als $a_i$
 223 oder zwei Zahlen größer oder gleich $a_i$. Da im Fall der 0-1-Folge zwei
 224 gleiche Zahlen am Komparator anliegen, dürfen wir davon ausgehen, dass sich
 225 der Komparator so verhält, wie er sich bei der Permutation verhalten hat --
 226 ohne das Ergebnis zu beeinflussen. Entsprechend kommen an den Ausgängen $i-1$
 227 und $i$ eine Null und eine Eins in der falschen Reihenfolge an. Das steht im
 228 Widerspruch zu der Annahme, dass alle 0-1-Folgen sortiert werden.
 229
 230 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
 231 Komplexitätsklasse
 232 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
 233 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
 234 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
 235 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
 236 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
 237 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
 238 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
 239 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
 240 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
 241 beschäftigen.
 242
 243 \subsubsection{Evolutionäre Algorithmen}
 244
 245 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
 246 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
 247 \textit{NP}, das heißt das keine Verfahren bekannt sind, die das Problem
 248 effizient exakt lösbar. Sollte sich herausstellen, dass diese Probleme nicht
 249 in der Komplexitätsklasse~\textit{P} liegen, wäre eine Konsequenz, dass es
 250 effiziente exakte Algorithmen für diese Probleme nicht geben kann. Falls sich
 251 hingegen herausstellt, dass diese Probleme in der
 252 Komplexitätsklasse~\textit{P} liegen, wird es mit großer Wahrscheinlichkeit
 253 noch einige Zeit dauern, bis auch Algorithmen mit praktikablen Zeitkonstanten
 254 gefunden werden.
 255
 256 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
 257 die beziehungsweise eine der {\em optimalen} Lösungen als einzige Ausgabe des
 258 Algorithmus zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele
 259 dieser Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
 260 beispielsweise imitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
 261 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
 262
 263 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
 264 ist, bekannte Lösungen zu neuen -- unter Umständen besseren -- Lösungen zu
 265 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
 266 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem als {\em
 267 Individuen} bezeichnet.
 268
 269 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
 270 bestehenden Lösungsmenge, der {\em Population}, werden zufällig Lösungen
 271 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
 272 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
 273 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
 274 eingefügt wird. Die verwendeten Wahrscheinlichkeiten, beispielsweise bei der
 275 {\em Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
 276 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
 277 Gütefunktion}.
 278
 279 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
 280 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
 281 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
 282 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
 283 Algorithmen verwenden als einfache, initiale Lösung häufig das
 284 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
 285 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
 286 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
 287 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
 288
 289 Beim Aussuchen von zufälligen Lösungen aus der Population, der
 290 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
 291 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
 292 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
 293 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
 294 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
 295 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
 296 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
 297 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
 298 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
 299 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
 300 findet er aber in der Regel bessere Lösungen.
 301
 302 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
 303 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
 304 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
 305 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
 306 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
 307 zwischen verschiedenen Leitungszahlen stark unterscheiden.
 308
 309 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
 310 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
 311 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
 312 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
 313 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
 314 „Ausbrechen“ und finden noch besserer Lösungen.
 315
 316 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
 317 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
 318 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
 319 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
 320 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
 321 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
 322
 323 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
 324 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
 325 mutieren lediglich Transformationen von Sortiernetzwerken, die die
 326 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
 327 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
 328 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
 329
 330 \newpage
 331 \section{Bekannte konstruktive Sortiernetzwerke}
 332 \label{sect:konstruktive_netzwerke}
 333
 334 Übersicht über bekannte konstruktive Sortiernetzwerke.
 335
 336 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
 337 \label{sect:odd_even_transpositionsort}
 338
 339 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
 340 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
 341 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
 342 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
 343 ${n = 8}$ Leitungen.
 344
 345 \begin{figure}
 346   \begin{center}
 347     \input{images/oe-transposition-8.tex}
 348   \end{center}
 349   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
 350   \label{fig:odd-even-transposition-08}
 351 \end{figure}
 352
 353 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
 354 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
 355 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
 356 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
 357 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
 358 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
 359
 360 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
 361 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
 362 Herausschneiden einer Leitung reduziert. In
 363 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
 364 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
 365 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
 366
 367 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
 368 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
 369 Komparatoren anordnen lassen, effizient. Es benötigt
 370 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
 371 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
 372 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
 373 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
 374
 375 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
 376 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
 377 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
 378 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
 379 Algorithmen.
 380
 381 \subsection{Das bitone Mergesort-Netzwerk}
 382
 383 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
 384 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
 385 veröffentlicht wurde. Es ist deutlich effizienter als das
 386 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
 387 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
 388 Schichten.
 389
 390 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
 391 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
 392 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
 393 verleiht dem Sortiernetzwerk seinen Namen.
 394
 395 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
 396 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
 397 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
 398
 399 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
 400
 401 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
 402 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
 403 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
 404 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
 405 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
 406 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
 407 entstehen können. Die wichtigsten Varianten für das \emph{bitone
 408 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
 409 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
 410 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
 411 ist wichtig zu beachten, dass das letzte Element nicht größer
 412 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
 413 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
 414 darf.
 415
 416 \begin{figure}
 417   \centering
 418   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
 419   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
 420   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
 421   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
 422   \caption{Beispiele bitoner Folgen.}
 423   \label{fig:beispiel-biton}
 424 \end{figure}
 425
 426 \begin{figure}
 427   \centering
 428   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
 429   \qquad
 430   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
 431   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
 432   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
 433   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
 434   resultierenden Teilfolgen sind wiederum biton.}
 435   \label{fig:bitonic-merge-schema}
 436 \end{figure}
 437
 438 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
 439 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
 440 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
 441 sortiert, die Folge $V$ sei absteigend sortiert:
 442 \begin{eqnarray}
 443  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
 444  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
 445 \end{eqnarray}
 446 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
 447 Positionen verglichen und ggf. vertauscht:
 448 \begin{equation}
 449 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
 450 \end{equation}
 451 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
 452 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
 453 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
 454 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
 455 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
 456 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
 457 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
 458 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
 459 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
 460 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
 461 zeigt die Situationen vor und nach diesem Schritt des Mischers.
 462
 463 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
 464 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
 465 mithilfe des bitonen Mischers, mit zwei Instanzen von
 466 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
 467 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
 468 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
 469 definiert ist.
 470
 471 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
 472 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
 473 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
 474 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
 475 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
 476 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
 477 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
 478
 479 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
 480 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
 481 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
 482 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
 483 besteht, die in $\log(n)$~Schichten angeordnet werden können.
 484
 485 \subsubsection{Das bitone Mergesort-Netzwerk}
 486
 487 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
 488 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
 489 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
 490 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
 491 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
 492 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
 493 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist.
 494 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
 495 $\operatorname{BS}(2)$ identisch.
 496
 497 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
 498 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
 499 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
 500 alle Komparatoren in die gleiche Richtung zeigen.
 501
 502 \begin{figure}
 503   \begin{center}
 504   \input{images/batcher-8.tex}
 505   \end{center}
 506   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
 507   für acht Eingänge. Markiert sind die beiden Instanzen von
 508   $\operatorname{BS}(4)$ (rot), die beiden bitonen
 509   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
 510   rekursiven Schritt hinzugefügt wurden (grün).}
 511   \label{fig:bitonic-08}
 512 \end{figure}
 513
 514 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
 515 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
 516 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
 517 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
 518 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
 519 grün hinterlegt.
 520
 521 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
 522 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
 523 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
 524 Schichten angeordnet sind.
 525
 526 %\begin{figure}
 527 %\begin{center}
 528 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
 529 %\end{center}
 530 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
 531 %$S(n/2)$ und dem Mischer $M(n)$.}
 532 %\label{fig:bms_rekursiver_aufbau}
 533 %\end{figure}
 534
 535 \subsection{Das Odd-Even-Mergesort-Netzwerk}
 536
 537 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
 538 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
 539 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
 540 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
 541 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
 542 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
 543 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
 544 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
 545
 546 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
 547
 548 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
 549 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
 550 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
 551 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
 552 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
 553 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
 554 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
 555
 556 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
 557 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
 558 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
 559 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
 560 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
 561 \begin{equation}
 562 w_i = \left\{ \begin{array}{ll}
 563         u_i,     & i < n \\
 564         v_{i-n}, & i \geqq n
 565       \end{array} \right.,
 566       \quad 0 \leqq i < N
 567 \end{equation}
 568
 569 \begin{figure}
 570   \begin{center}
 571   \input{images/oe-merge.tex}
 572   \end{center}
 573   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
 574   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
 575   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
 576   \label{fig:oe-merge}
 577 \end{figure}
 578
 579 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
 580 geraden Indizes und je eine Liste der ungeraden Indizes.
 581 \begin{eqnarray}
 582   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
 583   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
 584   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
 585   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
 586 \end{eqnarray}
 587
 588 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
 589 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
 590 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
 591 Ausgang der Mischer die Folgen
 592 \begin{eqnarray}
 593   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
 594   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
 595 \end{eqnarray}
 596 ergeben.
 597
 598 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
 599 hinzugefügt,
 600 \begin{equation}
 601   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
 602 \end{equation}
 603 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
 604 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
 605
 606 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
 607 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
 608 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
 609 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
 610 Aufbau lauten:
 611 \begin{itemize}
 612   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
 613   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
 614   einzelnen Komparator.
 615 \end{itemize}
 616
 617 Dass die resultierende Folge sortiert ist, lässt sich mit dem
 618 {\em 0-1-Prinzip} zeigen:
 619 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
 620 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
 621 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
 622 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
 623 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
 624 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
 625 \begin{eqnarray}
 626   \left|W_{\textrm{gerade}}\right|_0
 627   &=& \left|U_{\textrm{gerade}}\right|_0
 628     + \left|V_{\textrm{gerade}}\right|_0
 629    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
 630    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
 631   \left|W_{\textrm{ungerade}}\right|_0
 632   &=& \left|U_{\textrm{ungerade}}\right|_0
 633     + \left|V_{\textrm{ungerade}}\right|_0
 634    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
 635    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
 636 \end{eqnarray}
 637 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
 638 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
 639 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
 640 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
 641 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
 642 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
 643 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
 644 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
 645
 646 \begin{figure}
 647   \centering
 648   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
 649   \qquad
 650   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
 651   \qquad
 652   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
 653   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
 654   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
 655   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
 656   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
 657   sortiert ist.}
 658   \label{fig:oe-post-recursive}
 659 \end{figure}
 660
 661 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
 662 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
 663 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
 664 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
 665 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
 666
 667 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
 668 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
 669 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
 670 \begin{displaymath}
 671   K(n,m) = \left\{ \begin{array}{ll}
 672     nm, & \mathrm{falls} \quad nm \leqq 1 \\
 673     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
 674     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
 675     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
 676   \end{array} \right.
 677 \end{displaymath}
 678 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
 679 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
 680 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
 681
 682 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
 683 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
 684 Rekursionsschritt der OEM-Konstruktion fügt
 685 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
 686 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
 687 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
 688 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
 689 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
 690 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
 691 \begin{displaymath}
 692   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
 693 \end{displaymath}
 694 Komparatoren eingespart. Damit ergibt sich
 695 \begin{displaymath}
 696   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
 697 \end{displaymath}
 698 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
 699 benötigt werden.
 700
 701 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
 702
 703 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
 704 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
 705 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
 706 effizientesten Sortiernetzwerke in Bezug auf Komparator- und Schichtzahl
 707 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
 708 $\operatorname{OES}(n)$ aus
 709 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
 710 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
 711 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
 712 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
 713 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
 714 Komparatornetzwerke definiert sind.
 715
 716 \begin{figure}
 717   \begin{center}
 718   \input{images/oe-mergesort-8.tex}
 719   \end{center}
 720   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
 721   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
 722   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
 723   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
 724   Komparatoren zwischen benachbarten Leitungen (grün).}
 725   \label{fig:odd-even-mergesort-08}
 726 \end{figure}
 727
 728 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
 729 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
 730 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
 731 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
 732 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
 733 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
 734
 735 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
 736 \emph{Odd-Even-Mergesort-Netz\-werk} verwendet wird, $k(n)$, direkt aus der
 737 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
 738 \begin{displaymath}
 739   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
 740        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
 741        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
 742 \end{displaymath}
 743 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
 744 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
 745 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
 746
 747 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
 748 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
 749 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
 750 \begin{displaymath}
 751   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
 752 \end{displaymath}
 753 gilt.
 754
 755 % gnuplot:
 756 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
 757 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
 758 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
 759
 760 %\begin{itemize}
 761 %\item Pairwise sorting-network
 762 %\end{itemize}
 763
 764 \newpage
 765 \section{Transformation von Sortiernetzwerken}
 766 \label{sect:tranformation}
 767
 768 \subsection{Komprimieren}
 769
 770 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 771 gleichzeitig ausgewertet werden, wie bereits in
 772 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
 773 Transformationen, insbesondere das Entfernen einer Leitung, das in
 774 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
 775 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
 776 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
 777 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
 778 die jeden Komparator so früh wie möglich ausführt. So entsteht die
 779 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
 780 unterteilen lässt.
 781
 782 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
 783 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
 784 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
 785 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
 786 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
 787 Komprimierung durchgeführt werden.
 788
 789 \subsection{Normalisieren}
 790
 791 \begin{figure}
 792   \centering
 793   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
 794   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
 795   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
 796   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
 797   intuitiven Konstruktion und die normalisierte Variante.}
 798   \label{fig:beispiel_normalisieren}
 799 \end{figure}
 800
 801 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
 802 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
 803 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
 804 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
 805 in~\cite{KNUTH} einen Algorithmus an.
 806
 807 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
 808 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
 809 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
 810 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
 811 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
 812 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist.
 813 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
 814 Definition.
 815
 816 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
 817 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
 818 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
 819 und das Trichtermuster zu sehen.
 820
 821 \subsection{Zwei Netzwerke kombinieren}
 822
 823 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
 824 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
 825 Sortiernetzwerk zusammenzufassen.
 826
 827 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
 828 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
 829 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
 830 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
 831 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
 832 und Weise rekursiv aufgebaut.
 833
 834 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
 835 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
 836 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
 837 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
 838 zusammenfügen.
 839
 840 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
 841 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
 842 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
 843 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
 844 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
 845 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
 846
 847 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
 848 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
 849 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
 850 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
 851 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
 852 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
 853 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
 854 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
 855 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
 856 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
 857 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
 858 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
 859 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
 860 6~Komparatoren weniger.
 861
 862 % 9   9
 863 % 9  18
 864 % 9  27
 865 % 9  36
 866 % 9  45
 867 % 8  53
 868 % 8  61
 869 % 7  68
 870 % 7  75
 871 % 6  81
 872 % 5  86
 873
 874 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
 875 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
 876 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
 877 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
 878 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
 879 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
 880 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
 881 nur mit exponentiellem Aufwand möglich ist.
 882
 883 %\begin{itemize}
 884 %\item Mit dem Bitonic-Merge
 885 %\item Mit dem Odd-Even-Merge
 886 %\item Nach dem Pairwise sorting-network Schema.
 887 %\end{itemize}
 888
 889 \subsection{Leitungen entfernen}
 890 \label{sect:leitungen_entfernen}
 891
 892 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
 893 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
 894 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
 895 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
 896 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
 897 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
 898
 899 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
 900 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
 901 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
 902 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
 903 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
 904 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
 905 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
 906 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
 907 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
 908 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
 909 das {\em Odd-Even-Transpositionsort-Netzwerk}.
 910
 911 \begin{figure}
 912   \centering
 913   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
 914   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
 915   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
 916   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
 917   \caption{Eine Leitung wird aus dem
 918   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
 919   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
 920   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
 921   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
 922   Pfad herausgetrennt werden. In der letzten Abbildung ist
 923   $\operatorname{OET}(7)$ markiert.}
 924   \label{fig:oe-transposition-cut}
 925 \end{figure}
 926
 927 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
 928 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
 929 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
 930 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
 931 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
 932 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
 933 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
 934 auf die keine Komparatoren mehr berührt
 935 (Abbildung~\ref{fig:oe-transposition-cut1}).
 936
 937 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
 938 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
 939 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
 940 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
 941 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
 942 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
 943 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
 944 mit $(n-1)$~Elementen darstellen.
 945
 946 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
 947 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
 948 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
 949 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
 950 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
 951
 952 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
 953 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
 954 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
 955 Darstellung ergibt. Ausserdem ist das
 956 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
 957 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
 958 Ausgabe und kann entfernt werden.
 959
 960 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
 961 \label{sect:anzahl_schnittmuster}
 962
 963 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
 964 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
 965 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
 966 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
 967 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
 968 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
 969 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
 970 \emph{$k$-Schnittmuster}.
 971
 972 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
 973 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
 974 Schnittmuster \emph{unterschiedlich} bezüglich~$S$.
 975
 976 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
 977 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
 978 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
 979 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
 980 ergeben sich insgesamt
 981 \begin{equation}\label{eqn:anzahl_schnittmuster}
 982   \prod_{i=n}^{1+n-k} 2i = 2^k \cdot \frac{n!}{(n-k)!}
 983   \quad (n > m)
 984 \end{equation}
 985 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
 986 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
 987 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
 988 führen beide Reihenfolgen zum selben Ergebnis.
 989
 990 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit~\cite{M2009}, dass es
 991 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
 992 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
 993 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
 994 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
 995 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
 996 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
 997 der möglichen Schnittmuster:
 998 \begin{displaymath}
 999   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
1000   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
1001   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
1002   \quad (1 \leqq k < n)
1003 \end{displaymath}
1004
1005 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
1006 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
1007 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
1008 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
1009 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
1010 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
1011
1012 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
1013 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
1014 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
1015 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
1016 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1017 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1018 Werte unterscheiden.
1019
1020 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1021 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
1022 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1023 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1024 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1025 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1026 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1027 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1028
1029 \begin{figure}
1030   \begin{center}
1031     \includegraphics[viewport=0 0 425 262,width=15cm]{images/count-cuts-16.pdf}
1032   \end{center}
1033   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1034   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1035   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1036   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1037   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1038   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1039   \label{fig:count-cuts-16}
1040 \end{figure}
1041
1042 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1043 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1044 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1045 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1046 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke \oes{16},
1047 \bs{16} und \ps{16} angewandt. Anschließend wurde mithilfe einer Hashtabelle
1048 überprüft, ob das resultierende Sortiernetzwerk schon von einem
1049 \emph{äquivalenten} Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk
1050 noch nicht in der Hashtabelle enthalten war, wurde der Zähler für
1051 unterschiedliche Schnittmuster erhöht und das Sortiernetzwerk eingefügt.
1052
1053 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1054 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1055 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1056 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1057 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1058 nahe ist.
1059
1060 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1061 Formel~\eqref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen
1062 Schnittmuster führen aber nur zu wenigen \emph{unterschiedlichen}
1063 Sortiernetzwerken: 3519 ($\approx 0,1\%$) im Fall des
1064 \emph{Odd-Even-Mergesort-Netzwerks}, 4973 ($\approx 0,15\%$) beim
1065 \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx 0,57\%$) beim
1066 \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr Iterationen
1067 die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt. Die Graphen
1068 in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der Annahme, dass
1069 die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1070 vernachlässigbar klein ist.
1071
1072 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1073 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1074 Die Hashtabelle würde mehr Arbeitsspeicher benötigen als in derzeitigen
1075 Rechnern vorhanden ist, bevor ein entsprechender Graph den linearen Bereich
1076 für „kleine“ x-Werte verlässt.
1077
1078 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1079 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1080 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1081 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1082 zufällig erzeugt und überprüft, ob sie in der Menge~$S$ enthalten sind. Unter
1083 der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in $S$
1084 enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1085 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1086 unterschiedlichen Schnittmuster abschätzen.
1087
1088 \begin{figure}
1089   \begin{center}
1090     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1091   \end{center}
1092   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1093   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1094   $\operatorname{BS}(32)$.}
1095   \label{fig:collisions-10000-1000000-32}
1096 \end{figure}
1097
1098 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1099 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1100 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1101 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1102 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1103 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1104 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1105 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1106 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1107 \cdot 10^6$ unterschiedlichen 16-Schnittmustern für $\operatorname{OES}(32)$
1108 und $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1109
1110 \begin{figure}
1111   \begin{center}
1112     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1113   \end{center}
1114   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1115   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1116   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1117   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1118   unterschiedlichen Schnittmustern.}
1119   \label{fig:collisions-100000-1000000-32-ps}
1120 \end{figure}
1121
1122 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1123 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1124 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1125 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1126 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1127 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1128 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1129 ist dieser Umstand wenig verwunderlich. Entsprechend hätte man in einem
1130 kombinierten Graphen keine Details mehr erkennen können. Aufgrund der hohen
1131 Anzahl unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1132 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1133 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1134 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1135 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1136 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1137 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1138 die Anzahl der \emph{möglichen} Schnittmuster.
1139
1140 \newpage
1141 \section{Der \textsc{SN-Evolution}-Algorithmus}
1142
1143 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1144 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1145 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1146 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1147 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1148 in Abschnitt~\ref{sect:bewertung} behandelt.
1149
1150 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1151
1152 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1153 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1154 die bei Sortiernetzwerken verfolgt werden können:
1155 \begin{itemize}
1156   \item Möglichst wenige Komparatoren („effizient“)
1157   \item Möglichst wenige Schichten („schnell“)
1158 \end{itemize}
1159
1160 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1161 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1162 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1163 61~Komparatoren in nur 9~Schichten.
1164
1165 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1166 berücksichtigen kann, hat die folgende allgemeine Form:
1167 \begin{equation}
1168   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1169                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1170                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1171 \end{equation}
1172 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1173 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1174 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1175 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1176 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1177 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1178 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1179
1180 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1181 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1182 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1183 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1184
1185 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1186 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1187 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1188 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1189 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1190 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1191 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1192
1193 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1194 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1195 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1196 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1197 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1198
1199 \subsection{Selektion}
1200
1201 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1202 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1203 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1204 Streben des Algorithmus nach besseren Lösungen.
1205
1206 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1207 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1208 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1209
1210 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1211 Pseudocode wie folgt beschreiben:
1212 \begin{verbatim}
1213 Gütesumme := 0
1214 Auswahl := (leer)
1215
1216 für jedes Individuum in Population
1217 {
1218   reziproke Güte := 1.0 / Guete(Individuum)
1219   Wahrscheinlichkeit P := reziproke Güte / (reziproke Güte + Gütesumme)
1220   Gütesumme := Gütesumme + reziproke Güte
1221
1222   mit Wahrscheinlichkeit P
1223   {
1224     Auswahl := Individuum
1225   }
1226 }
1227 gib Auswahl zurück
1228 \end{verbatim}
1229
1230 \subsection{Rekombination}
1231
1232 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1233 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1234 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1235 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1236 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1237 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1238 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1239
1240 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1241 erhält.
1242
1243 \subsection{Mutation}
1244
1245 Zu einem vollständigen evolutionären Algorithmus gehört außerdem die Mutation
1246 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1247 Sortiernetzwerk zufällig zu verändern und dabei die Sortiereigenschaft zu
1248 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1249 Eigenschaft zerstören.
1250
1251 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1252 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1253 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1254 Ausprobieren aller $2^n$~Bitmuster, wie in Abschnitt~\ref{sect:0-1-prinzip}
1255 beschrieben.
1256
1257 Um das Potenzial einer Mutation abzuschätzen wurde in \textsc{SN-Evolution}
1258 eine Überprüfung eingebaut: Unmittelbar vor dem Einfügen in die Population
1259 überprüft eine Funktion die Notwendigkeit jedes einzelnen Komparators. Dazu
1260 wird nacheinander jeder Komparator entfernt und überprüft, ob das verbleibende
1261 Netzwerk die Sortiereigenschaft noch besitzt.
1262
1263 Trotz des hohen Rechenaufwandes -- bei 16-Sortiernetzwerken sind gut
1264 4~Millionen Tests notwendig, um alle Komparatoren zu überprüfen -- waren die
1265 Ergebnisse ernüchternd: Nach circa 1~Million Iterationen mit
1266 16-Sortiernetzwerken fand der so modifizierte Algorithmus keinen einzigen
1267 Komparator, den er hätte entfernen können.
1268
1269 \subsection{Güte}
1270
1271 Die Qualität der erreichten Sortiernetzwerke wurde mit eine Gütefunktion
1272 beurteilt, die entsprechend dem im Abschnitt~\ref{sect:bewertung}
1273 vorgestellten Muster definiert ist. Wie beschrieben müssen die Faktoren häufig
1274 an die aktuelle Problemgröße angepasst werden, damit \textsc{SN-Evolution}
1275 schnell gute Ergebnisse liefert. Als guter Standardansatz haben sich die
1276 folgenden Werte herausgestellt:
1277 \begin{eqnarray*}
1278 w_{\mathrm{Basis}} &=& 0 \\
1279 w_{\mathrm{Komparatoren}} &=& 1 \\
1280 w_{\mathrm{Schichten}} &=& \left|S\right|_\mathrm{Leitungen}
1281 \end{eqnarray*}
1282
1283 \subsection{Versuche mit dem bitonen Mischer}
1284
1285 \begin{figure}
1286   \begin{center}
1287     \input{images/16-e1-bitonic-1296542566.tex}
1288   \end{center}
1289   \caption{Sortiernetzwerk mit 16~Leitungen und 67~Komparatoren in
1290     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1291     \textsc{SN-Evolution} unter Verwendung des \emph{bitonen Mischers}
1292     erzeugt.}
1293   \label{fig:16-e1-bitonic-1296542566}
1294 \end{figure}
1295
1296 Verwendet man den \emph{bitonen Mischer} in der Rekombinationsphase von
1297 \textsc{SN-Evolution}, so erhält man Netzwerke wie das in
1298 Abbildung~\ref{fig:16-e1-bitonic-1296542566} dargestellte: Der Algorithmus
1299 wurde mit dem \emph{Odd-Even-Transpositionsort}-Netzwerk als triviale
1300 Initiallösung gestartet. Das Ergebnis ist ein Netzwerk, das effizienter ist
1301 als das bitone Mergesort-Netzwerk: $\operatorname{BS}(16)$ benötigt
1302 80~Komparatoren, das Sortiernetzwerk in
1303 Abbildung~\ref{fig:16-e1-bitonic-1296542566} benötigt lediglich~67.
1304
1305 \subsection{Versuche mit dem Odd-Even-Mischer}
1306
1307 \begin{figure}
1308   \begin{center}
1309     \input{images/16-e1-oddeven-1296543330.tex}
1310   \end{center}
1311   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1312     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1313     \textsc{SN-Evolution} unter Verwendung des \emph{Odd-Even-Mischers}
1314     erzeugt.}
1315   \label{fig:16-e1-oddeven-1296543330}
1316 \end{figure}
1317
1318 Leider lies sich das Ergebnis des bitonen Mischers -- das von
1319 \textsc{SN-Evolution} ausgegebene Netzwerk war effizienter als das rekursiv
1320 aus dem verwendeten Mischer aufgebaute Sortiernetzwerk -- mit dem
1321 \emph{Odd-Even-Mischer} nicht wiederholen. Zwar erreichen die
1322 Sortiernetzwerke, die \textsc{SN-Evolution} unter Verwendung des
1323 \emph{Odd-Even-Mischers} findet, das \emph{Odd-Even-Mergesort}-Netzwerk
1324 bezüglich Schnelligkeit und Effizienz, ein Beispiel hierfür ist in
1325 Abbildung~\ref{fig:16-e1-oddeven-1296543330} zu sehen. Ein Netzwerk, das
1326 $\operatorname{OES}(n)$ in mindestens einem Merkmal übertrifft, konnte jedoch
1327 nicht beobachtet werden.
1328
1329 \begin{itemize}
1330 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der Schichten, kombiniert)
1331 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \emph{Mischer} ab.
1332 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1333 \item Möglicherweise: Verwende den rekursiven Aufbau des \emph{Pairwise-Sorting}-Netzwerks um Sortiernetzwerke zu mergen.
1334 \end{itemize}
1335
1336 %\begin{figure}
1337 %\begin{center}
1338 %\input{images/08-e2-1237993371.tex}
1339 %\end{center}
1340 %\caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1341 %\label{fig:08-e2-1237993371}
1342 %\end{figure}
1343 %
1344 %\begin{figure}
1345 %\begin{center}
1346 %\input{images/09-e2-1237997073.tex}
1347 %\end{center}
1348 %\caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1349 %\label{fig:09-e2-1237997073}
1350 %\end{figure}
1351 %
1352 %\begin{figure}
1353 %\begin{center}
1354 %\input{images/09-e2-1237999719.tex}
1355 %\end{center}
1356 %\caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1357 %\label{fig:09-e2-1237999719}
1358 %\end{figure}
1359 %
1360 %\begin{figure}
1361 %\begin{center}
1362 %\input{images/10-e2-1239014566.tex}
1363 %\end{center}
1364 %\caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1365 %\label{fig:10-e2-1239014566}
1366 %\end{figure}
1367
1368 %\input{shmoo-aequivalenz.tex}
1369
1370 \newpage
1371 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1372 \label{sect:sn-evolution-cut}
1373
1374 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1375 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1376 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1377 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1378 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1379 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1380 gute Schnittmuster gesucht.
1381
1382 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster},
1383 die in Abschnitt~\ref{sect:anzahl_schnittmuster} definiert wurden, als
1384 Individuen. Um zwei Individuen zu rekombinieren werden die ersten $r$~Schnitte
1385 des einen Schnittmusters verwendet und die letzten ${c-r}$~Schnitte des
1386 zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit $0 \leqq r \leqq c$.
1387
1388 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1389 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1390 Schnitt-Richtung.
1391
1392 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1393
1394 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1395 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1396 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1397 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1398 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1399 werden, Komparatoren ein.
1400
1401 Beispielsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1402 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1403 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1404 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1405 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1406 Komparatoren ein.
1407
1408 \begin{figure}
1409   \begin{center}
1410     \input{images/16-ec-from-bs32.tex}
1411   \end{center}
1412   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1413     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1414     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1415     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1416   \label{fig:16-ec-from-bs32}
1417 \end{figure}
1418
1419 \begin{figure}
1420   \begin{center}
1421     \input{images/16-ec-from-bs32-normalized.tex}
1422   \end{center}
1423   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1424     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1425     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1426     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1427   \label{fig:16-ec-from-bs32-normalized}
1428 \end{figure}
1429
1430 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1431 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1432 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1433 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1434 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1435 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1436 und das
1437 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1438 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1439 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1440 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1441 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1442 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1443 Netzwerks scheinen rein zufällig zu sein.
1444
1445 \begin{figure}
1446   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1447   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1448   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1449   % 63:MAX
1450   \begin{center}
1451     \input{images/32-ec-from-bs64.tex}
1452   \end{center}
1453   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1454     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1455     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1456     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1457     Schnittmuster ist
1458     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1459     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1460     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1461   \label{fig:32-ec-from-bs64}
1462 \end{figure}
1463
1464 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1465 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1466 konstruiert haben, kann demnach auch erreicht werden, wenn
1467 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1468 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1469 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1470 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1471 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1472 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1473 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1474 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1475 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1476 Verzögerung dieser Sortiernetzwerke gleich ist.
1477
1478 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1479 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1480 gute Schnittmuster anzugeben.
1481
1482 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1483 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1484 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1485 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1486 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1487 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1488 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1489 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1490 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1491
1492 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1493 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1494 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1495 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1496 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1497 $\operatorname{OET}(n-m)$-Netzwerk.
1498
1499 \begin{figure}
1500   \begin{center}
1501     \input{images/16-ec-from-ps32.tex}
1502   \end{center}
1503   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1504     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1505     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1506     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1507   \label{fig:16-ec-from-ps32}
1508 \end{figure}
1509
1510 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1511
1512 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1513 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1514 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1515 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1516 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1517 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1518 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1519 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1520
1521 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1522 einsetzt und auch nicht auf einem Mischer basiert, ist der
1523 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1524 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1525 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1526 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1527 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1528
1529 \begin{figure}
1530   \begin{center}
1531     \input{images/32-pairwise-cut-16-pairwise.tex}
1532   \end{center}
1533   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1534   \label{fig:ps16-from-ps32}
1535 \end{figure}
1536
1537 Für das \emph{Pairwise-Sorting-Netzwerk} ist es vergleichsweise einfach
1538 regelmäßige Schnittmuster anzugeben, die aus dem Netzwerk einen kleineres
1539 schnelles und effizientes Sortiernetzwerk erzeugen. Beispielsweise führt das
1540 einfache Schnittmuster
1541 \begin{displaymath}
1542 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1543   -\infty & \quad \textrm{falls } i < \frac{1}{4} n \\
1544    \infty & \quad \textrm{falls } i \geqq \frac{3}{4} n \\
1545         ? & \quad \mathrm{sonst}
1546   \end{array} \right.
1547 \end{displaymath}
1548 für $\operatorname{PS}\left(n = 2^d\right)$ zum Sortiernetzwerk
1549 $\operatorname{PS}\left(\frac{1}{2}n\right)$. Die Art und Weise, mit der
1550 dieses Schnittmuster Komparatoren eliminiert und welche Komparatoren das
1551 verbleibende Netzwerk ausmachen, ist in Abbildung~\ref{fig:ps16-from-ps32}
1552 dargestellt. Die matt blauen und roten Leitungen und Komparatoren sind
1553 diejenigen, die Aufgrund eines Minimums oder eines Maximums im resultierenden
1554 Netzwerk nicht mehr enthalten sind. Da die Minima und Maxima bereits auf den
1555 „richtigen“ Leitungen angelegt werden, müssen keine Leitungen vertauscht
1556 werden und das Ergebnis ist bereits normalisiert. Daher ist das resultierende
1557 Netzwerk in schwarz gut zu erkennen.
1558
1559 \begin{figure}
1560   \begin{center}
1561     \input{images/16-pairwise.tex}
1562   \end{center}
1563   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1564   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1565   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1566   \label{fig:16-pairwise}
1567 \end{figure}
1568
1569 Ein Spezialfall ergibt sich, wenn man \textsc{SN-Evolution-Cut} auf
1570 $\operatorname{PS}(16)$ anwendet: In diesem Fall kann man durch ein
1571 8-Schnittmuster das \emph{Odd-Even-Mergesort}-Netzwerk \oes{8} erhalten. Für
1572 größere Sortiernetzwerke ist dies hingegen nicht mehr möglich, beispielsweise
1573 kann $\operatorname{PS}(32)$ nicht durch ein 16-Schnittmuster in \oes{16}
1574 konvertiert werden. Die Verwandschaft von $\operatorname{PS}(n)$ und \oes{n}
1575 untersucht \textit{Moritz Mühlenthaler} ausführlich in~\cite{M2009}.
1576
1577 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1578
1579 In Abschnitt~\ref{sect:anzahl_schnittmuster} wurde bereits untersucht, wie
1580 viele \emph{unterschiedliche} Schnittmuster die konstruktiven Sortiernetzwerke
1581 $\operatorname{OES}(32)$, $\operatorname{BS}(32)$ und $\operatorname{PS}(32)$
1582 besitzen. Eines der Ergebnisse war, dass von diesen Sortiernetzwerken das
1583 \emph{Odd-Even-Mergesort}-Netzwerk die wenigsten unterschiedlichen
1584 16-Schnittmuster besitzt -- nur etwa $5,2$~Millionen. Entsprechend ist es
1585 wenig verwunderlich, dass \textsc{SN-Evolution-Cut} gestartet mit
1586 $\operatorname{OES}(32)$ sehr schnell ein gutes 16-Schnittmuster findet.
1587
1588 Eines der eher zufälligen Schnittmuster ist $\operatorname{MIN}(1, 6, 11, 14,
1589 17, 23, 26, 29)$, $\operatorname{MAX}(2, 7, 8, 13, 18, 21, 27, 31)$. Das
1590 Schnittmuster ist in Abbildung~\ref{fig:16-ec-from-oes32-cut} veranschaulicht,
1591 das resultierende Netzwerk ist in Abbildung~\ref{fig:16-ec-from-oes32} zu sehen.
1592
1593 \begin{figure}
1594   \begin{center}
1595     \input{images/16-ec-from-oes32-cut.tex}
1596   \end{center}
1597   \caption{Visualisierung eines 16-Schnittmusters, das auf
1598   $\operatorname{OES}(32)$ angewendet wieder ein schnelles und effizientes
1599   Sortiernetzwerk ergibt.}
1600   \label{fig:16-ec-from-oes32-cut}
1601 \end{figure}
1602
1603 \begin{figure}
1604   \begin{center}
1605     \input{images/16-ec-from-oes32.tex}
1606   \end{center}
1607   \caption{16-Sortiernetzwerk mit 63~Komparatoren in 10~Schichten.
1608     Das Netzwerk wurde von dem Algorithmus \textsc{SN-Evolution-Cut} aus dem
1609     \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(32)$ durch
1610     16~Schnitte erzeugt.}
1611   \label{fig:16-ec-from-oes32}
1612 \end{figure}
1613
1614 \newpage
1615 \section{Der \textsc{SN-Markov}-Algorithmus}
1616 \label{sect:markov}
1617
1618 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1619 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1620 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1621 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1622 verwendet und mit sich selbst kombiniert wird.
1623
1624 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1625 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1626 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1627 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1628 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1629 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1630
1631 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1632 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1633 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1634 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1635 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1636 selbst erzeugen kann.
1637
1638 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben, ist die Anzahl
1639 der \emph{unterschiedlichen} Schnittmuster und damit die Anzahl der Nachfolger
1640 sehr groß. Bei den untersuchten 16-Sortiernetzwerken lag die Anzahl der
1641 Nachfolger zwar noch unter 20000, bei den untersuchten 32-Sortiernetzwerken
1642 wurden jedoch bereits bis zu $2,6 \cdot 10^8$ unterschiedliche Schnittmuster
1643 geschätzt.
1644
1645 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1646 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1647 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1648 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1649 selbst und erhält so einen zufälligen Nachfolger. In Pseudocode lässt dich der
1650 Algorithmus wie folgt beschreiben:
1651
1652 \begin{verbatim}
1653 Netzwerk := Eingabe
1654
1655 für n Iterationen
1656 {
1657   Nachfolger := kombiniere (Netzwerk, Netzwerk)
1658   Netzwerk   := Nachfolger
1659 }
1660
1661 gib Netzwerk zurück
1662 \end{verbatim}
1663
1664 \begin{figure}
1665   \begin{center}
1666   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-cycles-16.pdf}
1667   \end{center}
1668   \caption{Zyklen, die beim \textit{Random Walk} des
1669   \textsc{SN-Markov}-Algorithmus detektiert wurden. Auf der x-Achse sind die
1670   Anzahl der Schritte, die \textsc{SN-Markov} zurückgelegt hat, auf der
1671   y-Achse die Längen der gefundenen Zyklen aufgetragen. Das initiale
1672   Start-Sortiernetzwerk war $\operatorname{OET}(16)$.}
1673   \label{fig:markov-cycles-16}
1674 \end{figure}
1675
1676
1677 \begin{itemize}
1678   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1679   \item Anzahl der erreichbaren Sortiernetzwerke.
1680   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1681     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1682 \end{itemize}
1683
1684 \begin{figure}
1685   \begin{center}
1686   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-12-pct.pdf}
1687   \end{center}
1688   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1689   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1690   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1691   \label{fig:markov-comparators-12}
1692 \end{figure}
1693
1694 \begin{figure}
1695   \begin{center}
1696   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-14-pct.pdf}
1697   \end{center}
1698   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1699   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1700   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1701   \label{fig:markov-comparators-14}
1702 \end{figure}
1703
1704 \begin{figure}
1705   \begin{center}
1706   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-16-pct.pdf}
1707   \end{center}
1708   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1709   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1710   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1711   \label{fig:markov-comparators-16}
1712 \end{figure}
1713
1714 \begin{figure}
1715   \begin{center}
1716   \includegraphics[viewport=0 0 425 262,width=15cm]{images/markov-comparators-18-pct.pdf}
1717   \end{center}
1718   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 18~Leitungen),
1719   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1720   \emph{Gamma-Verteilung} $f(x - 81)$ mit $k = 10,724$ und $\theta = 0,766$.}
1721   \label{fig:markov-comparators-18}
1722 \end{figure}
1723
1724 \newpage
1725 \section{Empirische Beobachtungen}
1726
1727 \begin{itemize}
1728 \item So schnell konvergiert der Algorithmus.
1729 \item $\ldots$
1730 \end{itemize}
1731
1732 \newpage
1733 \section{Ausblick}
1734
1735 Das würde mir noch einfallen$\ldots$
1736
1737 \newpage
1738 \section{Implementierung}
1739
1740 So habe ich die ganzen Versuche durchgeführt.
1741
1742 \newpage
1743 \bibliography{references}
1744 \bibliographystyle{plain}
1745
1746 %\listoffigures
1747
1748 \end{document}
1749
1750 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :