diplomarbeit.tex

   1 \documentclass[a4paper,11pt]{article}
   2 \usepackage[utf8]{inputenc}
   3 \usepackage{ngerman}
   4 \usepackage{fancyhdr}
   5 \usepackage{geometry}
   6 \usepackage{amsmath, bbm}
   7 \usepackage{amsfonts}
   8 \usepackage{amssymb}
   9 \usepackage{listings}
  10 \usepackage{graphicx}
  11 \usepackage{url}
  12 %\usepackage{longtable}
  13 \usepackage{subfigure}
  14 \usepackage{icomma}
  15
  16 \usepackage{tikz}
  17 \usetikzlibrary{arrows,shapes}
  18
  19 % Fuer mathtoolsset
  20 \usepackage{mathtools}
  21
  22 \geometry{paper=a4paper,margin=30mm}
  23
  24 \pagestyle{fancy}
  25 %\fancyhf{}
  26 %\fancyhead[LO,LE]{"Ubung zu Computational Intelligence}
  27 %\fancyhead[CO,CE]{2006-05-15}
  28 %\fancyhead[RO,RE]{Florian Forster (2099894)}
  29
  30 \title{Evolutionäre Optimierung von Sortiernetzwerken}
  31 \author{Florian Forster}
  32 \date{\today}
  33
  34 \newcommand{\false}{\textsc{False}}
  35 \newcommand{\true}{\textsc{True}}
  36 \newcommand{\todo}[1]{{\bf TODO:} #1}
  37 \newcommand{\qed}{\hfill $\Box$ \par \bigskip}
  38
  39 \newtheorem{definition}{Definition}
  40 \newtheorem{satz}{Satz}
  41
  42 % Zeige Nummern nur bei referenzierten Gleichungen an.
  43 \mathtoolsset{showonlyrefs=true}
  44
  45 \begin{document}
  46
  47 \tikzstyle{vertex}   = [circle,draw,thick,fill=black,minimum size=5,inner sep=0pt]
  48 \tikzstyle{comp}     = [draw,thick,-]
  49 \tikzstyle{compup}   = [draw,thick,->]
  50 \tikzstyle{compdown} = [draw,thick,<-]
  51 \tikzstyle{edge}     = [draw,thick,-]
  52 \tikzstyle{diredge}  = [draw,thick,->]
  53 \tikzstyle{prob}     = [font=\tiny]
  54
  55 \tikzstyle{edge minimum} = [edge,color=blue!20]
  56 \tikzstyle{edge maximum} = [edge,color=red!20]
  57 \tikzstyle{vertex active minimum} = [vertex,color=blue!50, fill=blue!50]
  58 \tikzstyle{vertex active maximum} = [vertex,color=red!50, fill=red!50]
  59 \tikzstyle{vertex active minimum maximum} = [vertex,color=violet!50, fill=violet!50]
  60 \tikzstyle{vertex inactive minimum} = [vertex,color=blue!20, fill=blue!20]
  61 \tikzstyle{vertex inactive maximum} = [vertex,color=red!20, fill=red!20]
  62 \tikzstyle{vertex inactive minimum maximum} = [vertex,color=black!20, fill=black!20]
  63 \tikzstyle{comp active minimum} = [comp]
  64 \tikzstyle{comp active maximum} = [comp]
  65 \tikzstyle{comp active minimum maximum} = [comp,color=black!20]
  66 \tikzstyle{comp inactive minimum} = [comp,color=blue!20]
  67 \tikzstyle{comp inactive maximum} = [comp,color=red!20]
  68 \tikzstyle{comp inactive minimum maximum} = [comp,color=black!20]
  69
  70 \tikzstyle{red box}   = [draw,-,color=red, top color=red!2,bottom color=red!10]
  71 \tikzstyle{blue box}  = [draw,-,color=blue,top color=blue!2,bottom color=blue!10]
  72 \tikzstyle{green box} = [draw,-,color=teal,top color=teal!2,bottom color=teal!10]
  73 \tikzstyle{gray box}  = [draw,-,color=black, top color=black!2,bottom color=black!10]
  74
  75 \maketitle
  76 \begin{abstract}
  77 Sortiernetzwerke werden eingeführt und einige bekannte Konstruktionen werden
  78 vorgestellt (Off-Even-Transposition, Bitonic-Merge, Odd-Even-Merge, Pairwise).
  79 Transformationsmöglichkeiten für Sortiernetzwerke werden besprochen.
  80 Evolutionäre Algorithmen werden beschrieben und ein evolutionärer
  81 Algorithmus für die Optimierung von Sortiernetzwerken wird angegeben.
  82 Die mindestens von diesem Algorithmus erreichte Güte wird angegeben und die
  83 Transformation zu einer Markov-Kette wird gezeigt. {\em Natürlich: So fern ich
  84 das hinbekomme bzw. Recht behalte.}
  85 \end{abstract}
  86 \newpage
  87
  88 \tableofcontents
  89
  90 \newpage
  91 \section{Motivation und Einleitung}
  92
  93 \subsection{Motivation}\label{sect:motivation}
  94
  95 \begin{itemize}
  96 \item Sortiernetzwerke sind toll, weil $\ldots$
  97 \item Sortiernetzwerke sind einfach erklärt, aber trotzdem kompliziert.
  98 \item Bisher noch kein evolutionärer Algorithmus zur automatischen
  99   Optimierung von Sortiernetzwerken bekannt. \textit{(Glaube ich zumindest.)}
 100 \end{itemize}
 101
 102 \subsection{Einleitung}\label{sect:einleitung}
 103
 104 \subsubsection{Sortiernetzwerke}\label{sect:einleitung_sortiernetzwerke}
 105
 106 \emph{Komparatoren} sind die Bausteine, die \emph{Komparatornetzwerken}
 107 zugrunde liegen. Sie haben zwei Eingänge über die sie zwei Zahlen erhalten
 108 können und zwei Ausgänge, auf denen die Zahlen wieder ausgegeben werden. Dabei
 109 sind die Ausgänge im Gegensatz zu den Eingängen unterscheidbar, da die größere
 110 der beiden Zahlen wird immer auf dem einen, die kleinere der beiden Zahlen
 111 immer auf dem anderen Ausgang ausgegeben ausgegeben wird.
 112
 113 Kombiniert man mehrere \emph{Komparatoren} miteinander, das heißt, dass die
 114 Ausgänge eines Komparators mit Eingängen weiterer Komparatoren verbunden sind,
 115 erhält man ein {\em Komparatornetzwerk}.
 116
 117 \begin{figure}
 118 \begin{center}
 119 \input{images/einfaches_komparatornetzwerk.tex}
 120 \end{center}
 121 \caption{Einfaches Komparatornetzwerk mit vier Ein- bzw. Ausgängen, bestehend
 122 aus 5~Komparatoren.}
 123 \label{fig:einfaches_komparatornetzwerk}
 124 \end{figure}
 125
 126 Abbildung~\ref{fig:einfaches_komparatornetzwerk} zeigt ein einfaches
 127 \emph{Komparatornetzwerk} aus fünf Komparatoren. Insgesamt gibt es vier
 128 verschiedene Eingänge und vier Ausgänge. Die Ein- und Ausgänge werden durch
 129 eine horizontale Linie dargestellt und als \emph{Leitung} bezeichnet. Die
 130 \emph{Komparatoren} sind durch vertikale Pfeile dargestellt und verbinden je
 131 zwei verschiedene \emph{Leitungen} miteinander. Die Verbindungsstellen von
 132 \emph{Leitungen} und \emph{Komparatoren} sind zur besseren Übersichlichkeit
 133 durch schwarze Punkte symbolisiert.
 134
 135 Auf der linken Seite befinden sich die Eingänge. Hier wird eine Zahlenfolge in
 136 das Netzwerk hineingegeben. Jeder Komparator vergleicht die Zahlen „auf“ den
 137 beiden Leitungen, die er verbindet. Nach einem Komparator befindet sich die
 138 kleinere Zahl immer auf der Leitung, auf die der Pfeil zeigt, die größere Zahl
 139 befindet sich auf der Leitung, auf der der Pfeil seinen Ursprung hat.
 140
 141 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 142 gleichzeitig angewandt werden. Das Beispiel in
 143 Abbildung~\ref{fig:einfaches_komparatornetzwerk} verwendet diesen Umstand und
 144 vergleicht die zwei oberen und die zwei unteren Leitungen gleichzeitig. Eine
 145 Gruppe von Komparatoren, die gleichzeitig angewendet werden können, nennt man
 146 eine \emph{Schicht} des Komparatornetwerks. Die \emph{Verzögerung} eines
 147 Komparatornetzwerks ist gleichbedeutend mit der Anzahl der Schichten, in die
 148 sich die Komparatoren mindestens gruppieren lassen, da sie die Anzahl der
 149 benötigten parallelen Schritte darstellt.
 150
 151 \emph{Komparatornetzwerke}, die für \emph{jede} Eingabefolge eine Ausgabe
 152 erzeugen, die der Sortierung der Eingabe entspricht, heißen
 153 \emph{Sortiernetzwerke}. Das in
 154 Abbildung~\ref{fig:einfaches_komparatornetzwerk} gezeigte Komparatornetzwerk
 155 ist \emph{kein} Sotiernetzwerk: Die Eingabefolge ${(1, 2, 3, 4)}$ führt zur
 156 Ausgabe ${(2, 1, 3, 4)}$ -- die bestehenden Sortierung wird also sogar
 157 zerstört.
 158
 159 \begin{figure}
 160   \begin{center}
 161     \input{images/09-e2-c24-allbut1.tex}
 162   \end{center}
 163   \caption{Ein \emph{Komparatornetzwerk} mit neun Eingängen und
 164   24~Komparatoren, die in 8~Schichten angeordnet sind. Das Netzwerk sortiert
 165   alle Eingaben, bei denen das Minimum nicht auf dem mittleren Eingang liegt.}
 166   \label{fig:09-e2-c24-allbut1}
 167 \end{figure}
 168 Zu beweisen, dass ein gegebenes Komparatornetzwerk die Sortiereigenschaft {\em
 169 nicht} hat, ist mit einem gegebenen Gegenbeispiel einfach möglich. Das
 170 Komparatornetzwerk wird auf das Gegenbeispiel angewendet und anschließend wird
 171 überprüft, ob die Ausgabe sortiert ist. Ist sie es nicht heißt das, dass es
 172 mindestens eine Eingabefolge gibt, die nicht sortiert wird. Entsprechend der
 173 Definition handelt es sich bei dem \emph{Komparatornetzwerk} folglich
 174 \emph{nicht} um ein \emph{Sortiernetzwerk}. Ein solches Gegenbeispiel für ein
 175 gegebenes Komparatornetzwerk zu finden ist nach heutigem Kenntnisstand jedoch
 176 nicht \emph{effizient} möglich.
 177
 178 Beispielsweise sortiert das Komparatornetzwerk in
 179 Abbildung~\ref{fig:09-e2-c24-allbut1} viele der 362.880 möglichen
 180 Eingabepermutationen. Mit dem Gegenbeispiel $(3, 5, 2, 1, 0, 7, 4, 8, 6)$
 181 lässt sich jedoch leicht beweisen, dass das Komparatornetzwerk die
 182 Sortiereigenschaft \emph{nicht} besitzt, da es in diesem Fall die Folge
 183 $(1, 0, 2, 3, 4, 5, 6, 7, 8)$ ausgibt.
 184
 185 Insgesamt gibt es $n!$~Permutationen von $n$~Elementen. Wenn ein
 186 Komparatornetzwerk die Sortiereigenschaft besitzt, bildet es alle diese
 187 Permutationen auf die sortierte Reihenfolge ab. Allerdings wächst $n!$
 188 über-exponentiell schnell, so dass ein Ausprobieren aller möglichen
 189 Permutationen schon bei 16~Leitungen praktisch nicht mehr zu bewerkstelligen
 190 ist.\footnote{1.307.674.368.000 Permutationen}
 191
 192 Glücklicherweise reicht es aus, alle möglichen 0-1-Folgen zu überprüfen, wie
 193 \textit{Donald~E. Knuth} in \cite{KNUTH} zeigt. Die Beweisidee ist folgende:
 194 Angenommen ein Komparatornetzwerk sortiert alle 0-1-Folgen und es gibt eine
 195 Permutation $E = (e_0, \dots, e_{n-1})$ beliebiger Zahlen, die nicht sortiert
 196 wird. Die Ausgabefolge sei $A = (a_0, \dots, a_{n-1})$. Sei $i$ eine Position
 197 in der Ausgabe, die die Sortierbedingung verletzt:
 198 \begin{displaymath}
 199   a_0 \leqq a_1 \leqq \dots \leqq a_{i-1} > a_i \dots
 200 \end{displaymath}
 201 Die Eingabe kann mittels
 202 \begin{displaymath}
 203   \hat{e}_j = \left\{
 204     \begin{array}{cl}
 205       0 & e_j \leqq a_i \\
 206       1 & e_j > a_i
 207     \end{array} \right.
 208 \end{displaymath}
 209 auf eine 0-1-Folge abgebildet werden, die entsprechen der Annahme von
 210 Komparatornetzwerk sortiert wird. Allerdings verändert diese Abbildung das
 211 Verhalten jedes einzelnen Komparators nicht, so dass die Annahme auf einen
 212 Widerspruch geführt wird.
 213
 214 Im Gegensatz zum Überprüfen aller möglichen Permutationen, was der
 215 Komplexitätsklasse
 216 $\mathcal{O}\left(\sqrt{n}\left(\frac{n}{e}\right)^n\right)$ zuzuordnen ist,
 217 ist das Überprüfen aller 0-1-Folgen „nur“ mit dem Aufwand $\mathcal{O}(2^n)$
 218 verbunden. Entsprechend ist dieses Verfahren nicht \emph{effizient} -- ein
 219 schnelleres Verfahren ist bisher allerdings nicht bekannt. Um zu überprüfen,
 220 ob ein Komparatornetzwerk mit 16~Leitungen die Sortiereigenschaft besitzt,
 221 sind mit dieser Methode nur 65.536 Tests notwendig -- eine Zahl, die für
 222 aktuelle Prozessoren keine Herausforderung darstellt. Für die Überprüfung
 223 eines Komparatornetzwerks mit 32~Leitungen sind jedoch bereits etwa
 224 4,3~Millarden Tests notwendig, die einen Rechner durchaus mehrere Minuten
 225 beschäftigen.
 226
 227 \subsubsection{Evolutionäre Algorithmen}
 228
 229 Viele {\em kombinatorische Optimierungsprobleme} sind schwer zu lösen -- die
 230 entsprechenden Entscheidungsprobleme liegen oft in der Komplexitätsklasse
 231 $NP$, sind also mit bekannten Verfahren nicht effizient exakt lösbar. Sollte
 232 sich herausstellen, dass diese Probleme nicht in der Komplexitätsklasse $P$
 233 liegen, wäre eine Konsequenz, dass es effiziente exakte Algorithmen für diese
 234 Probleme nicht geben kann. Falls sich hingegen herausstellt, dass diese
 235 Probleme in der Komplexitätsklasse~$P$ liegen, wird es mit großer
 236 Wahrscheinlichkeit noch einige Zeit dauern bis auch Algorithmen mit
 237 praktikablen Zeitkonstanten gefunden werden.
 238
 239 Aus diesem Grund besteht die Notwendigkeit einen Kompromiss einzugehen: Statt
 240 die bzw. eine der {\em optimalen} Lösungen als einzige Ausgabe des Algorithmus
 241 zuzulassen, wird eine "`möglichst gute"' Lösung ausgegeben. Viele dieser
 242 Optimierungsalgorithmen orientieren sich an Vorgängen in der Natur,
 243 beispielsweise immitieren die "`Ameisenalgorithmen"' das Verhalten von Ameisen
 244 auf der Futtersuche um kurze Rundreisen auf Graphen zu berechnen.
 245
 246 Bei {\em Evolutionären Algorithmen} stand die Evolution pate. Die Grundidee
 247 ist es, bestehende Lösungen zu neuen, unter Umständen besseren Lösungen zu
 248 kombinieren. Dabei bedient man sich der in der Evolutionstheorie etablierten
 249 Nomenklatur, beispielsweise werden konkrete Lösungen für ein Problem häufig
 250 als {\em Individuum} bezeichnet.
 251
 252 Die Vorgehensweise lässt sich abstrakt wie folgt beschreiben. Aus einer
 253 bestehenden Lösungsmenge, der {\em Population} werden zufällig Lösungen
 254 ausgesucht {\em (Selektion)} und zu einer neuen Lösung kombiniert ({\em
 255 Rekombination}). Unter Umständen wird die neue Lösung noch zufällig
 256 verändert {\em (Mutation)}, bevor sie in die bestehende Lösungsmenge
 257 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
 258 Selektion}, sind dabei nicht zwangsläufig gleichverteilt -- üblicherweise
 259 werden bessere Lösungen bevorzugt. Zur Bewertung dient die sogenannte {\em
 260 Gütefunktion}.
 261
 262 Nicht alle Probleme eignen sich für diese Strategie: Zum einen muss es möglich
 263 sein, eine initiale Population zur Verfügung zu stellen, da diese als Basis
 264 aller weiteren Operationen dient. Das ist häufig keine große Einschränkung, da
 265 es oft einfach ist {\em irgendeine} Lösung anzugeben. Die angegebenen
 266 Algorithmen verwenden als einfache, initiale Lösung häufig das
 267 \emph{Odd-Even-Transpositionsort}-Netzwerk, das in
 268 Abschnitt~\ref{sect:odd_even_transpositionsort} beschrieben wird. Zum anderen
 269 muss eine Methode für die Rekombination existieren. Das ist insbesondere dann
 270 problematisch, wenn {\em Nebenbedingungen} eingehalten werden müssen.
 271
 272 Beim Aussuchen von zufälligen Lösungen aus der Population, der
 273 \emph{Selektion}, werden gute Lösungen bevorzugt. Wie sehr diese Lösungen
 274 bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
 275 Algorithmus. Werden gute Lösungen stark bevorzugt, konvergiert der Algorithmus
 276 schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
 277 für „Ausnutzung“) genannte Verhalten sorgt dafür, dass sich der Algorithmus
 278 schnell auf eine Lösung festlegt und andere, möglicherweise bessere lokale
 279 Optima nicht mehr findet. Werden gute Lösungen hingegen nur wenig bevorzugt,
 280 erforscht der Algorithmus den Lösungsraum in viele Richtungen. Dieses
 281 \textit{Exploration} (Englisch für „Erforschung“) genannte Verhalten sorgt
 282 zwar dafür, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafür
 283 findet er aber in der Regel bessere Lösungen.
 284
 285 Die Parameter evolutionärer Algorithmen so einzustellen, dass sich ein guter
 286 Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
 287 nur experimentell lösen lässt. Die genauen Parameter hängen nicht nur vom
 288 eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
 289 beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
 290 zwischen verschiedenen Leitungszahlen stark unterscheiden.
 291
 292 Die \textit{Exploration} kann von einem weiteren Mechanismus unterstützt
 293 werden, der ebenfalls der Evolutionslehre entliehen ist, der \emph{Mutation}.
 294 Dabei werden Lösungen zufällig verändert, so dass auch andere Lösungen „in der
 295 Nähe“ von direkten Nachfolgern erreicht werden können. Das hilft insbesondere
 296 bei der intensiven Suche in der Nähe eines lokalen Optimums aber auch beim
 297 „Ausbrechen“ und finden noch besserer Lösungen.
 298
 299 Bei \emph{Sortiernetzwerken} ist eine \emph{Mutation} leider immer damit
 300 verbunden, dass anschließend die Sortiereigenschaft des resultierenden
 301 \emph{Komparatornetzwerks} wieder überprüft werden muss, da selbst das
 302 Hinzufügen eines zufälligen Komparators diese Eigenschaft zerstören kann. Beim
 303 Suchen möglichst effizienter Netzwerke ist natürlich das zufällige Entfernen
 304 von Komparatoren interessanter, was die Sortiereigenschaft sehr oft aufhebt.
 305
 306 Die im Folgenden beschriebenen Algorithmen mutieren (verändern) daher nicht
 307 die \emph{Sortiernetzwerke} selbst, sondern verzichten auf Mutation oder
 308 mutieren lediglich Transformationen von Sortiernetzwerken, die die
 309 Sortiereigenschaft erhält. Transformationen von Sortiernetzwerken werden in
 310 Abschnitt~\ref{sect:tranformation} beschrieben, ein Algorithmus, der Mutation
 311 einsetzt, wird in Abschnitt~\ref{sect:sn-evolution-cut} vorgestellt.
 312
 313 \newpage
 314 \section{Bekannte konstruktive Sortiernetzwerke}
 315 \label{sect:konstruktive_netzwerke}
 316
 317 Übersicht über bekannte konstruktive Sortiernetzwerke.
 318
 319 \subsection{Das Odd-Even-Transpositionsort-Netzwerk}
 320 \label{sect:odd_even_transpositionsort}
 321
 322 Das Sortiernetzwerk {\em Odd-Even-Transpositionsort} (OET) ist eines der
 323 einfachsten Sortiernetzwerke. Es besteht aus $n$~{\em Schichten}, die jede
 324 "`Leitung"' abwechselnd mit den benachbarten Leitungen verbindet.
 325 Abbildung~\ref{fig:odd-even-transposition-08} zeigt das OET-Netzwerk für
 326 ${n = 8}$ Leitungen.
 327
 328 \begin{figure}
 329   \begin{center}
 330     \input{images/oe-transposition-8.tex}
 331   \end{center}
 332   \caption{Das \emph{Odd-Even-Transpositionsort}-Netzwerk mit acht Eingängen.}
 333   \label{fig:odd-even-transposition-08}
 334 \end{figure}
 335
 336 Dass das Odd-Even-Transporitionsort-Netzwerk tatsächlich jede beliegibe
 337 Eingabe sortiert ist nicht offensichtlich. Leicht zu sehen ist jedoch, dass
 338 sowohl das Minimum als auch das Maximum durch das im Netzwerk enthaltene
 339 Treppenmuster auf die unterste beziehungsweise oberste Leitung gelangt. Beim
 340 Odd-Even-Transporitionsort-Netzwerk mit drei Eingängen,
 341 $\operatorname{OET}(3)$, ist die Ausgabe folglich sortiert.
 342
 343 Die Sortiereigenschaft größerer OET-Netzwerke lässt sich rekursiv beweisen,
 344 indem man $\operatorname{OET}(n)$ auf $\operatorname{OET}(n-1)$ durch
 345 Herausschneiden einer Leitung reduziert. In
 346 Abschnitt~\ref{sect:leitungen_entfernen} wird das Vorgehen im Detail
 347 beschrieben, Abbildung~\ref{fig:oe-transposition-cut} zeigt das
 348 Herausschneiden einer Leitung aus $\operatorname{OET}(8)$.
 349
 350 Das Odd-Even-Transporitionsort-Netzwerk ist weder in Bezug auf die Anzahl der
 351 Komparatoren noch in Bezug auf die Anzahl der Schichten, in denen sich die
 352 Komparatoren anordnen lassen, effizient. Es benötigt
 353 ${\frac12 n (n-1)} = \mathcal{O}(n^2)$~Komparatoren, die in $n$~Schichten
 354 angeordnet sind. Andere Sortiernetzwerke benötigen deutlich weniger
 355 Komparatoren, beispielsweise $\mathcal{O}(n (\log n)^2)$, die in weniger
 356 Schichten, zum Beispiel $\mathcal{O}(\log n)$, angeordnet sind.
 357
 358 Das Interessante am OET-Netzwerk ist seine einfache Konstruktion. Einige der
 359 folgenden Algorithmen benötigen ein möglichst einfaches Sortiernetzwerk als
 360 Starteingabe, auf dessen Basis sie versuchen optimierte Sortiernetzwerke zu
 361 finden. Häufig dient $\operatorname{OET}(n)$ als Eingabe für diese
 362 Algorithmen.
 363
 364 \subsection{Das bitone Mergesort-Netzwerk}
 365
 366 Das \emph{bitone Mergesort}-Netzwerk ($\operatorname{BS}(n)$) ist ein
 367 Sortiernetzwerk, das 1968 von \emph{Kenneth~E. Batcher} in~\cite{B1968}
 368 veröffentlicht wurde. Es ist deutlich effizienter als das
 369 Odd-Even-Transposi\-tionsort-Netzwerk -- sowohl in Bezug auf die Anzahl der
 370 Komparatoren als auch bezüglich der benötigten Zeit, also der Anzahl der
 371 Schichten.
 372
 373 Das Sortiernetzwerk basiert auf einem Komparatornetzwerk, welches zwei
 374 sortierte Listen zusammenfügen (englisch: \textit{to~merge}) kann. Dieser
 375 \emph{„bitoner Mischer“} (englisch: \textit{bitonic merger}) genannte Baustein
 376 verleiht dem Sortiernetzwerk seinen Namen.
 377
 378 Da das Sortiernetzwerk rekursiv definiert ist, betrachten wir hier nur die
 379 Instanzen des Netzwerks, deren Leitungszahl $n = 2^t$ eine Zweierpotenz ist.
 380 Es ist jedoch möglich das Sortiernetzwerk für beliebige~$n$ zu erzeugen.
 381
 382 \subsubsection{Der bitone Mischer}\label{sect:der_bitone_mischer}
 383
 384 Das \emph{bitone Mergesort-Netzwerk} basiert auf dem sogenannten \emph{bitonen
 385 Mischer} $\operatorname{BM}(n)$, einem Kom\-parator-Netzwerk, das eine beliebige
 386 \emph{bitone Folge} in eine sortierte Listen umordnen kann. Eine \emph{bitone
 387 Folge} ist eine monoton steigende Folge gefolgt von einer monoton absteigenden
 388 Folge, oder ein zyklischer Shift davon. Abbildung~\ref{fig:beispiel-biton}
 389 zeigt die vier prinzipiellen Möglichkeiten die durch zyklische Shifts
 390 entstehen können. Die wichtigsten Varianten für das \emph{bitone
 391 Mergesort-Netzwerk} zeigen die Abbildungen~\ref{fig:beispiel-biton-0}
 392 und~\ref{fig:beispiel-biton-1}. Sie erhält man, wenn man eine aufsteigend und
 393 eine absteigend sortierte Liste aneinanderhängt. Bei den anderen beiden Formen
 394 ist wichtig zu beachten, dass das letzte Element nicht größer
 395 (Abbildung~\ref{fig:beispiel-biton-2}) bzw. kleiner
 396 (Abbildung~\ref{fig:beispiel-biton-3}) als das erste Element der Folge sein
 397 darf.
 398
 399 \begin{figure}
 400   \centering
 401   \subfigure[aufsteigend, absteigend]{\input{images/beispiel-biton-0.tex}\label{fig:beispiel-biton-0}}
 402   \subfigure[absteigend, aufsteigend]{\input{images/beispiel-biton-1.tex}\label{fig:beispiel-biton-1}}
 403   \subfigure[aufsteigend, absteigend, aufsteigend]{\input{images/beispiel-biton-2.tex}\label{fig:beispiel-biton-2}}
 404   \subfigure[absteigend, aufsteigend, absteigend]{\input{images/beispiel-biton-3.tex}\label{fig:beispiel-biton-3}}
 405   \caption{Beispiele bitoner Folgen.}
 406   \label{fig:beispiel-biton}
 407 \end{figure}
 408
 409 \begin{figure}
 410   \centering
 411   \subfigure[normal]{\input{images/bitonic-merge.tex}\label{fig:bitonic-merge-normal}}
 412   \qquad
 413   \subfigure[trichter]{\input{images/bitonic-merge-trichter.tex}\label{fig:bitonic-merge-tricheter}}
 414   \caption{Schematischer Aufbau des bitonen Mischers: Jedes Element der
 415   aufsteigenden Folge $u_0, u_1, \ldots$ wird mit dem entsprechenden Element
 416   der absteigend sortierten Folge $v_0, v_1, \ldots$ verglichen. Die beiden
 417   resultierenden Teilfolgen sind wiederum biton.}
 418   \label{fig:bitonic-merge-schema}
 419 \end{figure}
 420
 421 Der Mischer funktioniert folgendermaßen: Gegeben sind zwei Folgen mit je
 422 ${m = \frac{n}{2}}$ Elementen, $U = \left(u_0, u_1, \ldots, u_{m-1}\right)$ und
 423 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die Folge $U$ sei aufsteigend
 424 sortiert, die Folge $V$ sei absteigend sortiert:
 425 \begin{eqnarray}
 426  u_0 \leqq u_1 \leqq &\ldots& \leqq u_{m-1} \\
 427  v_0 \geqq v_1 \geqq &\ldots& \geqq v_{m-1}
 428 \end{eqnarray}
 429 Im ersten Schritt werden nun jeweils die Elemente an den gleichen relativen
 430 Positionen verglichen und ggf. vertauscht:
 431 \begin{equation}
 432 u_i \longleftrightarrow v_i, \quad 0 \leqq i < m
 433 \end{equation}
 434 Sei $j \in \{0 \ldots m\}$ der Index der ersten Elemente $u_j$ und $v_j$, die
 435 durch den gemeinsamen Komparator vertauscht werden. Unter der Annahme, dass
 436 Elemente nur vertauscht werden wenn, sie ungleich sind, muss ${u_j > v_j}$
 437 gelten. Mit $u_j \leqq u_{j+1}$ und $v_j \geqq v_{j+1}$ folgt daraus $u_{j+1}
 438 > v_{j+1}$. Es werden also alle Elemente $u_k$ und $v_k$ mit $k \geqq j$
 439 vertauscht. $j = m$ bezeichnet den Fall, in dem das größte Element der
 440 "`linken"' Folge, $u_{m-1}$, kleiner ist als das kleinste Element der
 441 "`rechten"' Folge, $v_{m-1}$. Daraus folgt, dass das Resultat in zwei bitone
 442 Folgen aufteilen lässt: Eine aufsteigende~/ absteigende Folge und eine
 443 absteigende~/ aufsteigende Folge. Abbildung~\ref{fig:bitonic-merge-normal}
 444 zeigt die Situationen vor und nach diesem Schritt des Mischers.
 445
 446 Um die Folge vollständig zu sortieren, müssen anschließend die beiden
 447 resultierenden bitonen Folgen sortiert werden. Die geschieht ebenfalls
 448 mithilfe des bitonen Mischers, mit zwei Instanzen von
 449 $\operatorname{BM}(\frac{n}{2})$. Diese rekursive Definition endet mit dem
 450 bitonen Mischer mit zwei Leitungen, $\operatorname{BM}(2)$, der als
 451 Komparator-Netzwerk mit einem Komparator zwischen den beiden Leitungen
 452 definiert ist.
 453
 454 Der bitonen Mischer kann auch zwei aufsteigende Folgen sortieren. Dazu ist
 455 lediglich eine etwas modifizierte Vergleichs-Kaskade im ersten Schritt
 456 notwendig. Die folgenden, kleineren Mischer erhalten als Eingabe wieder eine
 457 „echte“ bitone Folge. Abbildung~\ref{fig:bitonic-merge-tricheter} zeigt das
 458 Schema des bitonen Mischers für zwei aufsteigend sortierte Foglen. Durch das
 459 Umdrehen einer Folge verändert sich das Muster der Komparatoren ein wenig:
 460 Statt an eine Treppe erinnert das Muster nun an einen Trichter.
 461
 462 Da sich die Anzahl der Leitungen in jedem Rekursionsschritt halbiert, endet
 463 die Rekursion nach $\log(n)$~Schritten. In jedem Rekursionsschritt werden
 464 $\frac{n}{2}$~Komparatoren eingefügt, so dass der gesamte Mischer aus
 465 $\frac{1}{2} n \log(n) = \mathcal{O}\left(n \log(n)\right)$~Komparatoren
 466 besteht, die in $\log(n)$~Schichten angeordnet werden können.
 467
 468 \subsubsection{Das bitone Mergesort-Netzwerk}
 469
 470 Ebenso wie der bitone Mischer $\operatorname{BM}(n)$ ist auch das \emph{bitone
 471 Mergesort-Netzwerk} $\operatorname{BS}(n)$ rekursiv definiert. Es setzt sich
 472 zusammen aus zwei Instanzen des bitonen Mergesort-Netzwerks halber Größe,
 473 $\operatorname{BS}(\frac{n}{2})$, für je die Hälfte der Eingänge, sowie dem
 474 bitonen Mischer für $n$~Leitungen, $\operatorname{BM}(n)$. Das Rekursionsende
 475 ist das bitone Mergesort-Netzwerk mit nur einer Leitung,
 476 $\operatorname{BS}(1)$, welches als leeres Komparatornetzwerk definiert ist.
 477 Entsprechend sind die Komparatornetzwerke $\operatorname{BM}(2)$ und
 478 $\operatorname{BS}(2)$ identisch.
 479
 480 Bei der Konstruktion kommt die trichterförmige Anordnung der Komparatoren
 481 (Abbildung~\ref{fig:bitonic-merge-tricheter}) gelegen, weil so die beiden
 482 rekursiven Sortiernetzwerke in die gleiche Richtung sortieren können und so
 483 alle Komparatoren in die gleiche Richtung zeigen.
 484
 485 \begin{figure}
 486   \begin{center}
 487   \input{images/batcher-8.tex}
 488   \end{center}
 489   \caption{$\operatorname{BS}(8)$, Batchers {\em bitones Mergesort-Netzwerk}
 490   für acht Eingänge. Markiert sind die beiden Instanzen von
 491   $\operatorname{BS}(4)$ (rot), die beiden bitonen
 492   Mischer~$\operatorname{BM}(4)$ (blau) und die Komparatoren, die im letzten
 493   rekursiven Schritt hinzugefügt wurden (grün).}
 494   \label{fig:bitonic-08}
 495 \end{figure}
 496
 497 Das konkrete Netzwerk~$\operatorname{BS}(8)$ ist in
 498 Abbildung~\ref{fig:bitonic-08} zu sehen. Eingezeichnet sind ebenfalls die
 499 beiden Instanzen des Netzwerks~$\operatorname{BS}(4)$ (rot) sowie der bitone
 500 Mischer~$\operatorname{BM}(8)$ (blau). Die trichterförmige Komparator-Kaskade,
 501 die die bitone Eingabefolge in zwei bitone Ausgabefolgen transformiert, ist
 502 grün hinterlegt.
 503
 504 Das \emph{bitone Mergesort-Netzwerk} $\operatorname{BS}(8)$ besteht aus
 505 $\frac{1}{4} n \log(n) \log(n+1) = \mathcal{O}\left(n (log (n))^2\right)$
 506 Komparatoren, die in $\frac{1}{2} \log(n) \log(n+1) = \mathcal{O}(\log(n))$
 507 Schichten angeordnet sind.
 508
 509 %\begin{figure}
 510 %\begin{center}
 511 %\includegraphics[viewport=115 491 372 782,width=7.5cm]{images/sn-rekursiver-aufbau.pdf}
 512 %\end{center}
 513 %\caption{Rekursiver Aufbau von $S(n)$: Es besteht aus zwei Instanzen von
 514 %$S(n/2)$ und dem Mischer $M(n)$.}
 515 %\label{fig:bms_rekursiver_aufbau}
 516 %\end{figure}
 517
 518 \subsection{Das Odd-Even-Mergesort-Netzwerk}
 519
 520 Obwohl der Name ähnlich klingt, haben das \emph{Odd-Even-Mergesort-Netzwerk}
 521 (OES) und das \emph{Odd-Even-Transpositionsort-Netzwerk} (siehe
 522 Abschnitt~\ref{sect:odd_even_transpositionsort}) wenig gemein. Vielmehr ist
 523 OES dem \emph{bitonen Mergesort-Netzwerk}, das im vorherigen Abschnitt
 524 vorgestellt wurde, ähnlich: Auch dieses Sortiernetzwerk ist von
 525 \textit{Kenneth~E. Batcher} gefunden worden und ist ebenfalls in~\cite{B1968}
 526 beschrieben und initial analysiert worden. Eine weitere Gemeinsamkeit besteht
 527 darin, dass es ebenfalls rekursiv durch einen Mischer definiert ist.
 528
 529 \subsubsection{Der Odd-Even-Mischer}\label{sect:der_odd_even_mischer}
 530
 531 Der \emph{Odd-Even-Mischer} $\operatorname{OEM}(n,m)$ ist ein
 532 Komperatornetzwerk, dass zwei sortierte Folgen mit $n$ beziehungsweise $m$
 533 Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
 534 zusammenfügen kann. Dabei kommt es mit weniger Vergleichen aus als der
 535 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
 536 vorgestellt wurde. Allerdings benötigt der \emph{Odd-Even-Mischer} unter
 537 Umständen mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
 538
 539 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
 540 Eingabe für den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
 541 sortierten Folgen $U = \left(u_0, u_1, \ldots, u_{n-1}\right)$ und
 542 $V = \left(v_0, v_1, \ldots, v_{m-1}\right)$. Die gesamte Eingabe sei
 543 $W = \left(w_0, w_1, \ldots, w_{N-1}\right)$ mit:
 544 \begin{equation}
 545 w_i = \left\{ \begin{array}{ll}
 546         u_i,     & i < n \\
 547         v_{i-n}, & i \geqq n
 548       \end{array} \right.,
 549       \quad 0 \leqq i < N
 550 \end{equation}
 551
 552 \begin{figure}
 553   \begin{center}
 554   \input{images/oe-merge.tex}
 555   \end{center}
 556   \caption{Schematischer Aufbau des {\em Odd-Even} Mischers. Im Vergleich zum
 557   bitonen Mischer für Acht kommt dieses Schema mit einem Komparator weniger
 558   aus. Der Effekt wird duch den rekursiven Aufbau noch verstärkt.}
 559   \label{fig:oe-merge}
 560 \end{figure}
 561
 562 Diese werden in insgesamt vier sortierte Folgen aufgeteilt, je eine Liste der
 563 geraden Indizes und je eine Liste der ungeraden Indizes.
 564 \begin{eqnarray}
 565   U_{\textrm{gerade}}   &=& \left(u_0, u_2, u_4, \ldots\right) \\
 566   U_{\textrm{ungerade}} &=& \left(u_1, u_3, u_5, \ldots\right) \\
 567   V_{\textrm{gerade}}   &=& \left(v_0, v_2, u_4, \ldots\right) \\
 568   V_{\textrm{ungerade}} &=& \left(v_1, v_3, u_5, \ldots\right)
 569 \end{eqnarray}
 570
 571 Die geraden Folgen $U_{\textrm{gerade}}$ und $V_{\textrm{gerade}}$ bzw. die
 572 ungeraden Folgen $U_{\textrm{ungerade}}$ und $V_{\textrm{ungerade}}$ werden
 573 rekursiv von kleineren {\em Odd-Even-Mischern} zusammengefügt, so dass sich am
 574 Ausgang der Mischer die Folgen
 575 \begin{eqnarray}
 576   W_{\textrm{gerade}}   &=& \left(w_0, w_2, w_4, \ldots\right) \\
 577   W_{\textrm{ungerade}} &=& \left(w_1, w_3, w_5, \ldots\right)
 578 \end{eqnarray}
 579 ergeben.
 580
 581 Anschließend werden die Komparatoren zwischen benachbarten Leitungen
 582 hinzugefügt,
 583 \begin{equation}
 584   w_{2i-1} \longleftrightarrow w_{2i}, \quad 1 \leqq i < \frac{N}{2}
 585 \end{equation}
 586 die die Folge~$W$ sortieren. Den schematischen Aufbau des {\em
 587 Odd-Even-Mischers} zeigt Abbildung~\ref{fig:oe-merge}.
 588
 589 Leider bricht die Rekursion nicht so schön ab, wie das beim {\em bitonen
 590 Mischer} der Fall gewesen ist. Insbesondere für ${n = m = 1}$ würde --
 591 entsprechend der Konstruktionsvorschrift -- ein leeres Netzwerk entstehen, was
 592 offensichtlich nicht korrekt wäre. Die Abbruchbedingungen für den rekursiven
 593 Aufbau lauten:
 594 \begin{itemize}
 595   \item Falls ${n = 0}$ oder ${m = 0}$: Das Netzwerk ist leer.
 596   \item Falls ${n = 1}$ und ${m = 1}$: Das Netzwerk besteht aus einem
 597   einzelnen Komparator.
 598 \end{itemize}
 599
 600 Dass die resultierende Folge sortiert ist, lässt sich mit dem
 601 {\em 0-1-Prinzip} zeigen:
 602 Da $U$ und $V$ sortiert sind, ist die Anzahl der Nullen in den geraden
 603 Teilfolgen, $U_{\textrm{gerade}}$ bzw. $V_{\textrm{gerade}}$, größer oder
 604 gleich der Anzahl der Nullen in den ungeraden Teilfolgen
 605 $U_{\textrm{ungerade}}$ bzw. $V_{\textrm{ungerade}}$ --~die Einsen verhalten
 606 sich entsprechend umgekehrt. Das trifft demnach auch auf die Folgen
 607 $W_{\textrm{gerade}}$ und $W_{\textrm{ungerade}}$ entsprechend zu:
 608 \begin{eqnarray}
 609   \left|W_{\textrm{gerade}}\right|_0
 610   &=& \left|U_{\textrm{gerade}}\right|_0
 611     + \left|V_{\textrm{gerade}}\right|_0
 612    =  \left\lceil \frac{1}{2} \left|U\right|_0 \right\rceil
 613    +  \left\lceil \frac{1}{2} \left|V\right|_0 \right\rceil \\
 614   \left|W_{\textrm{ungerade}}\right|_0
 615   &=& \left|U_{\textrm{ungerade}}\right|_0
 616     + \left|V_{\textrm{ungerade}}\right|_0
 617    =  \left\lfloor \frac{1}{2} \left|U\right|_0 \right\rfloor
 618    +  \left\lfloor \frac{1}{2} \left|V\right|_0 \right\rfloor
 619 \end{eqnarray}
 620 Daraus folgt, dass $W_{\textrm{gerade}}$ $0$, $1$ oder $2$ Nullen mehr enthält
 621 als $W_{\textrm{ungerade}}$. In den ersten beiden Fällen ist die "`verzahnte"'
 622 Ausgabe der beiden kleineren Mischer bereits sortiert. Nur im letzten Fall,
 623 wenn $W_{\textrm{gerade}}$ zwei Nullen mehr enthählt als
 624 $W_{\textrm{ungerade}}$, muss genau eine Vertauschung stattfinden, um die
 625 Ausgabe zu sortieren. Diese wird von den Komparatoren, die benachbarte
 626 Leitungen miteinander vergleichen, ausgeführt. Die jeweiligen Situationen sind
 627 in Abbildung~\ref{fig:oe-post-recursive} dargestellt.
 628
 629 \begin{figure}
 630   \centering
 631   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 0$]{\input{images/oe-post-recursive-diff0.tex}}
 632   \qquad
 633   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 1$]{\input{images/oe-post-recursive-diff1.tex}}
 634   \qquad
 635   \subfigure[$\left|W_{\textrm{gerade}}\right|_0 - \left|W_{\textrm{ungerade}}\right|_0 = 2$]{\input{images/oe-post-recursive-diff2.tex}}
 636   \caption{Die drei Situationen, die nach dem Verzahnen der Ausgaben der
 637   kleineren {\em Odd-Even-Mischer} entstehen können. Ist die Differenz der
 638   Anzahl der Nullen gleich $0$ oder $1$, ist die Folge bereits sortiert. Im
 639   letzten Fall stellt einer der Komparatoren sicher, dass das Ergebnis
 640   sortiert ist.}
 641   \label{fig:oe-post-recursive}
 642 \end{figure}
 643
 644 Da die Teilfolgen $U$ und $V$ in jedem Rekursionsschritt etwa halbiert werden,
 645 bricht die Rekursion nach $\mathcal{O}\left(\log (n) + \log (m)\right)$
 646 Schritten ab. Die exakte Anzahl der benötigten Rekursionsschritte (und damit
 647 Schichten im Mischer-Netzwerk), hängt von der Längeren der beiden
 648 Eingabefolgen ab und beträgt $1 + \lceil \log\left(\max(n, m)\right) \rceil$.
 649
 650 Die Anzahl der Komparatoren $K(n,m)$, die $\operatorname{OEM}(n,m)$ im
 651 allgemeinen Fall verwendet, ist Gemäß der rekursiven Definition in
 652 Abhängigkeit der Länge der Eingabefolgen, $n$ und $m$:
 653 \begin{displaymath}
 654   K(n,m) = \left\{ \begin{array}{ll}
 655     nm, & \mathrm{falls} \quad nm \leqq 1 \\
 656     K\left(\left\lceil \frac{n}{2} \right\rceil, \left\lceil \frac{m}{2} \right\rceil\right)
 657     + K\left(\left\lfloor \frac{n}{2} \right\rfloor, \left\lfloor \frac{m}{2} \right\rfloor\right)
 658     + \left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor & \mathrm{falls} \quad nm > 1
 659   \end{array} \right.
 660 \end{displaymath}
 661 Leider ist es schwierig, diese allgemeine Formel in einer geschlossenen Form
 662 anzugeben. Aus der Anzahl der Rekursionsschritte ist jedoch leicht erkennbar,
 663 dass $K(n,m)$ in $\mathcal{O}(N \log (N))$ enthalten ist.
 664
 665 Für den wichtigen Spezialfall, dass $n = m = 2^{t-1}$, lässt sich die Anzahl
 666 der Komparatoren im Vergleich zum \emph{bitonen Mischer} angeben: Der erste
 667 Rekursionsschritt der OEM-Konstruktion fügt
 668 $\left\lfloor \frac{1}{2} (m + n - 1) \right\rfloor = \frac{N}{2} - 1$
 669 Komparatoren ein -- einen Komparator weniger als der \emph{bitone Mischer} in
 670 diesem Schritt. Das selbe gilt für die rekursiv verwendeten kleineren Mischer,
 671 $\operatorname{OEM}(\frac{n}{2}, \frac{n}{2})$ und so weiter bis
 672 einschließlich $\operatorname{OEM}(2, 2)$, von denen es $2, 4, \dots,
 673 \frac{N}{4} = 2^{\log(N)-2}$ Instanzen gibt. Insgesamt werden
 674 \begin{displaymath}
 675   \sum_{i=0}^{\log(N)-2} 2^i = 2^{\log(N) - 1} - 1 = \frac{N}{2} - 1 = n - 1
 676 \end{displaymath}
 677 Komparatoren eingespart. Damit ergibt sich
 678 \begin{displaymath}
 679   K\left(n = 2^{t-1}, n = 2^{t-1}\right) = \frac{1}{2} N \log(N) - \frac{N}{2} + 1
 680 \end{displaymath}
 681 für die Anzahl der Komparatoren, die von $\operatorname{OEM}(N = 2^t)$
 682 benötigt werden.
 683
 684 \subsubsection{Das Odd-Even-Mergesort-Netzwerk}
 685
 686 Das \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ besteht --~wie
 687 das \emph{bitone Mergesort-Netzwerk}~-- rekursiv aus kleineren Varianten von
 688 sich selbst und einem abschließenden \emph{Odd-Even-Mischer}. Die
 689 effizientesten Sortiernetzwerke in Bezuf auf Komparator- und Schichtzahl
 690 entstehen, wenn die Anzahl der Leitungen jeweils halbiert wird. Somit besteht
 691 $\operatorname{OES}(n)$ aus
 692 $\operatorname{OES}\left(\left\lceil\frac{n}{2}\right\rceil\right)$,
 693 $\operatorname{OES}\left(\left\lfloor\frac{n}{2}\right\rfloor\right)$
 694 und $\operatorname{OEM}\left(\left\lceil\frac{n}{2}\right\rceil,
 695 \left\lfloor\frac{n}{2}\right\rfloor\right)$. Die Rekursion endet mit
 696 $\operatorname{OES}(1)$ und $\operatorname{OES}(0)$, die als leere
 697 Komparatornetzwerke definiert sind.
 698
 699 \begin{figure}
 700   \begin{center}
 701   \input{images/oe-mergesort-8.tex}
 702   \end{center}
 703   \caption{Das {\em Odd-Even-Mergesort-Netzwerk} für acht Eingänge. Markiert
 704   sind die Instanzen von $\operatorname{OES}(4)$ (rot), die beiden
 705   \emph{Odd-Even-Mischer} $\operatorname{OEM}(4)$ für gerade und ungerade
 706   Leitungen (blau) und die im ersten Rekursionsschritt hinzugefügten
 707   Komparatoren zwischen benachbarten Leitungen (grün).}
 708   \label{fig:odd-even-mergesort-08}
 709 \end{figure}
 710
 711 In Abbildung~\ref{fig:odd-even-mergesort-08} ist das konkrete Sortiernetzwerk
 712 $\operatorname{OES}(8)$ zu sehen. Rot markiert sind die beiden rekursiven
 713 Instanzen $\operatorname{OES}(4)$. Die blauen und der grüne Block stellen den
 714 \emph{Odd-Even-Mischer} für acht Leitungen dar: Die beiden blauen Blöcke sind
 715 die rekursiven Instanzen von $\operatorname{OEM}(4)$, der grüne Block markiert
 716 die Komparatoren, die in ersten Rekursionsschritt hinzugefügt werden.
 717
 718 Im Allgemeinen ist die Anzahl der Komparatoren, die vom
 719 \emph{Odd-Even-Mergesort-Netzwerk} verwendet wird, $k(n)$, direkt aus der
 720 Definition beziehungsweise der Konstruktionsanleitung abzulesen:
 721 \begin{displaymath}
 722   k(n) = k\left(\left\lceil\frac{n}{2}\right\rceil\right)
 723        + k\left(\left\lfloor\frac{n}{2}\right\rfloor\right)
 724        + K\left(\left\lceil\frac{n}{2}\right\rceil, \left\lfloor\frac{n}{2}\right\rfloor\right)
 725 \end{displaymath}
 726 Eine geschlossene Form dieser Formel ist schon alleine deshalb schwierig, weil
 727 sie für $K(n,m)$ schwierig anzugeben ist. Es ist allerdings bekannt, dass
 728 $k(n)$ in $\mathcal{O}\left(n \left(\log (n)\right)^2\right)$ enthalten ist.
 729
 730 Für den wichtigen Spezialfall, dass $n = 2^t$ eine Zweierpotenz ist, kann die
 731 Anzahl der Komparatoren wieder explizit angegeben werden. \textit{Kenneth
 732 Batcher} zeigt in~\cite{B1968}, dass in diesem Fall
 733 \begin{displaymath}
 734   k(n = 2^t) = \frac{1}{4} n \left(\log (n)\right)^2 - \frac{1}{4}n\log(n) + n - 1
 735 \end{displaymath}
 736 gilt.
 737
 738 % gnuplot:
 739 % oem(n,m) = ((n*m) <= 1) ? (n*m) : oem(ceil(.5*n), ceil(.5*m)) + oem(floor(.5*n), floor(.5*m)) + floor(.5*(n+m-1.0))
 740 % oem1(n) = oem(ceil(.5*n),floor(.5*n))
 741 % oes(n) = (n <= 1.0) ? 0 : oes(ceil(0.5*n)) + oes(floor(0.5*n)) + oem1(n)
 742
 743 %\begin{itemize}
 744 %\item Pairwise sorting-network
 745 %\end{itemize}
 746
 747 \newpage
 748 \section{Transformation von Sortiernetzwerken}
 749 \label{sect:tranformation}
 750
 751 \subsection{Komprimieren}
 752
 753 Komparatoren, die unterschiedliche Leitungen miteinander vergleichen, können
 754 gleichzeitig ausgewertet werden, wie bereits in
 755 Abschnitt~\ref{sect:einleitung_sortiernetzwerke} beschrieben. Durch manche
 756 Transformationen, insbesondere das Entfernen einer Leitung, das in
 757 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben wird, kann es vorkommen,
 758 dass die Komparatoren eines Sortiernetzwerks nicht mehr in der
 759 kleinstmöglichen Anzahl von \emph{Schichten} angeordnet sind. Unter
 760 \emph{Komprimierung} wird eine (Neu-)Gruppierung der Komparatoren verstanden,
 761 die jeden Komparator so früh wie möglich ausführt. So entsteht die
 762 kleinstmögliche Anzahl von \emph{Schichten}, in die sich ein Sortiernetzwerk
 763 unterteilen lässt.
 764
 765 Diese Anzahl ist insbesondere beim automatisierten Bewerten von
 766 Komparatornetzwerken interessant, wie in Abschnitt~\ref{sect:bewertung}
 767 beschrieben. Die Anzahl der Schichten kann künstlich vergrößert werden, indem
 768 Komparatoren später angewandt werden. Deshalb sollte vor einer Bewertung, die
 769 die Anzahl der Schichten als Bewertungskriterium verwendet, immer eine
 770 Komprimierung durchgeführt werden.
 771
 772 \subsection{Normalisieren}
 773
 774 \begin{figure}
 775   \centering
 776   \subfigure[$S(8)$ (nach Konstruktion)]{\input{images/batcher-8-nonstd.tex}\label{fig:bitonic-nonstd}}
 777   \subfigure[$S(8)$ (normalisiert)]{\input{images/batcher-8-std.tex}\label{fig:bitonic-std}}
 778   \caption{Jedes Sortiernetzwerk kann in ein Standard-Sortiernetzwerk
 779   transformiert werden. Gezeigt ist das bitone Sortiernetzwerk nach der
 780   intuitiven Konstruktion und die normalisierte Variante.}
 781   \label{fig:beispiel_normalisieren}
 782 \end{figure}
 783
 784 Ein \emph{Standard-Sortiernetzwerk} oder \emph{normalisiertes Sortiernetzwerk}
 785 ist ein Sortiernetzwerk, dessen Komparatoren alle in die selbe Richtung
 786 zeigen. Jedes Sortiernetzwerk kann in eine normaliesierte Variante
 787 transformiert werden. Dazu gibt beispielsweise \emph{Donald~E. Knuth}
 788 in~\cite{KNUTH} einen Algorithmus an.
 789
 790 Abbildung~\ref{fig:beispiel_normalisieren} zeigt das das
 791 bitone Sortiernetzwerk in zwei Varianten. Abbildung~\ref{fig:bitonic-nonstd}
 792 zeigt das Netzwerk nach der Konstruktionsvorschrift, siehe auch
 793 Abbildung~\ref{fig:bitonic-merge-normal}: In den ersten drei Schichten werden
 794 die unter und die obere Hälfte gegenläufig sortiert. Das heißt dass nach drei
 795 Schritten die eine Hälfte auf- und die andere Hälfte absteigend sortiert ist.
 796 In den Schichten~4 bis~6 folgt der bitone Mischer entsprechend der rekursiven
 797 Definition.
 798
 799 In Abbildung~\ref{fig:bitonic-std} ist die normalisierte Version des bitonen
 800 Mergesort-Netzwerks zu sehen. Alle Komparatoren zeigen hier in die gleiche
 801 Richtung. Statt dem typischen "`Treppenmuster"' sind abwechselnd das Treppen-
 802 und das Trichtermuster zu sehen.
 803
 804 \subsection{Zwei Netzwerke kombinieren}
 805
 806 Um Sortiernetzwerke als \emph{Individuen} evolutionärer Algorithmen verwenden
 807 zu können, muss es möglich sein, zwei Sortiernetzwerke zu einem neuen
 808 Sortiernetzwerk zusammenzufassen.
 809
 810 Wir haben diese Technik in den vorangegangen Abschnitten bereits verwendet,
 811 beispielsweise um zwei \emph{bitone Mergesort-Netzwerke} mit jeweils der
 812 halben Leitungszahl, $\operatorname{BS}\left(\frac{n}{2}\right)$, zu einem
 813 einzigen Sortiernetzwerk $\operatorname{BS}(n)$ zu kombinieren. Auch das
 814 \emph{Odd-Even-Mergesort-Netzwerk} $\operatorname{OES}(n)$ wurde auf diese Art
 815 und Weise rekursiv aufgebaut.
 816
 817 Die vorgestellten \emph{Mischer} erwarten als Eingabe zwei bereits sortierte
 818 Folgen. \emph{Wie} diese Folgen sortiert wurden, ist unerheblich. Entsprechend
 819 können wir beliebige Sortiernetzwerke einsetzen, um die beiden Eingabefolgen
 820 zu sortieren, und die Ausgaben mit einem der beschriebenen Mischer
 821 zusammenfügen.
 822
 823 Beispielsweise kann man die Ausgabe von zwei \emph{bitonen
 824 Mergesort-Netzwerken} $\operatorname{BS}(8)$ mit je acht Leitungen mit dem
 825 \emph{Odd-Even-Merge} $\operatorname{OEM(8,8)}$ zu einer sortierten
 826 Gesamtfolge zusammenfügen. Das resultierende Sortiernetzwerk besitzt
 827 73~Komparatoren (zum Vergleich: $\operatorname{BS}(16)$ benötigt
 828 80~Komparatoren, $\operatorname{OES}(16)$ nur 63).
 829
 830 Verbesserungen in der Anzahl der benötigten Komparatoren beziehungsweise der
 831 Schichten eines „kleinen“ Sortiernetzwerks übertragen sich direkt auf das
 832 resultierende Gesamtnetzwerk. Das \emph{Odd-Even-Mergesort-Netzwerk}
 833 $\operatorname{OES}(9)$ benötigt beispielsweise 26~Komparatoren, die in in
 834 neun Schichten angeordnet sind. Es sind allerdings Sortiernetzwerke mit neun
 835 Eingängen bekannt, die lediglich 25~Komparatoren in sieben Schichten
 836 benötigen. Kombiniert man zwei dieser Netzwerke mit dem
 837 \emph{Odd-Even-Mischer} erhält man ein Sortiernetzwerk mit 18~Eingängen, das
 838 80~Komparatoren in 11~Schichten benötigt -- $\operatorname{OES}(18)$ benötigt
 839 82~Komparatoren in 13~Schichten. Damit ist das resultierende Netzwerk so
 840 schnell wie das Sortiernetzwerk mit 18~Eingängen, das \textit{Sherenaz~W.
 841 Al-Haj Baddar} und \textit{Kenneth~E. Batcher} in ihrer Arbeit „An 11-Step
 842 Sorting Network for 18~Elements“~\cite{BB2009} vorstellen, benötigt aber
 843 6~Komparatoren weniger.
 844
 845 % 9   9
 846 % 9  18
 847 % 9  27
 848 % 9  36
 849 % 9  45
 850 % 8  53
 851 % 8  61
 852 % 7  68
 853 % 7  75
 854 % 6  81
 855 % 5  86
 856
 857 Das Zusammenfassen von zwei Sortiernetzwerken durch Hintereinanderausführung
 858 ist nicht sinnvoll: Da die Ausgabe des ersten Sortiernetzwerks bereits
 859 sortiert ist, ist das zweite Sortiernetzwerk überflüssig. Eine
 860 Aneinanderreihung der Art „die ersten $x$~Schichten des einen, dann die
 861 letzten $y$~Schichten des anderen Sortiernetzwerks“ zerstören im Allgemeinen
 862 die Sortiereigenschaft. Die Sortiereigenschaft des resultierenden
 863 Komparatornetzwerks müsste überprüft werden, was nach heutigem Wissensstand
 864 nur mit exponentiellem Aufwand möglich ist.
 865
 866 %\begin{itemize}
 867 %\item Mit dem Bitonic-Merge
 868 %\item Mit dem Odd-Even-Merge
 869 %\item Nach dem Pairwise sorting-network Schema.
 870 %\end{itemize}
 871
 872 \subsection{Leitungen entfernen}
 873 \label{sect:leitungen_entfernen}
 874
 875 Im vorherigen Abschnitt haben wir gesehen, dass es mithilfe von
 876 \emph{Mischern} möglich ist, aus zwei Sortiernetzwerken mit je $n$~Eingängen
 877 ein neues Sortiernetzwerk mit $2n$~Eingängen zu erzeugen. Für einen
 878 beabsichtigen \emph{evolutionären Algorithmus} ist es jedoch notwendig, dass
 879 sich die Anzahl der Eingänge nicht verändert. Das heißt, dass wir wieder ein
 880 Sortiernetzwerk mit $n$~Eingängen erhalten müssen.
 881
 882 Man kann ein gegebenes Sortiernetzwerk mit $n$~Eingängen auf ein
 883 Sortiernetzwerk mit ${n-1}$~Leitungen verkleinern, indem man eine Leitung
 884 „eliminiert“. Dazu nehmen wir an, dass das Minimum oder das Maximum an einem
 885 bestimmten Eingang anliegt. Der Weg, den das Minimum beziehungsweise das Maxim
 886 durch das Sortiernetzwerk nimmt, ist eindeutig bestimmt und endet an einem der
 887 „Ränder“, also auf der Leitung mit dem höchsten oder dem niedrigsten Index.
 888 Insbesondere ist bekannt, welche Komparatoren „berührt“ werden und welche
 889 dafür sorgen, dass der Wert die Leitung gewechselt, da das Minimum jeden
 890 Vergleich „verliert“ und das Maximum jeden Vergleich „gewinnt“. Die
 891 Abbildung~\ref{fig:oe-transposition-cut0} zeigt den Weg eines Maximums durch
 892 das {\em Odd-Even-Transpositionsort-Netzwerk}.
 893
 894 \begin{figure}
 895   \centering
 896   \subfigure[foo]{\input{images/oe-transposition-cut0.tex}\label{fig:oe-transposition-cut0}}
 897   \subfigure[bar]{\input{images/oe-transposition-cut1.tex}\label{fig:oe-transposition-cut1}}
 898   \subfigure[baz]{\input{images/oe-transposition-cut2.tex}\label{fig:oe-transposition-cut2}}
 899   \subfigure[qux]{\input{images/oe-transposition-cut3.tex}\label{fig:oe-transposition-cut3}}
 900   \caption{Eine Leitung wird aus dem
 901   \emph{Odd-Even-Transpositionsort}-Netzwerk $\operatorname{OET}(8)$ entfernt:
 902   Auf der rot markierten Leitung wird $\infty$ angelegt. Da der Wert bei jedem
 903   Komparator am unteren Ende herauskommt, ist der Pfad fest vorgegeben. Da die
 904   restlichen Werte trotzdem noch richtig sortiert werden müssen, kann dieser
 905   Pfad herausgetrennt werden. In der letzten Abbildung ist
 906   $\operatorname{OET}(7)$ markiert.}
 907   \label{fig:oe-transposition-cut}
 908 \end{figure}
 909
 910 Im nächsten Schritt werden alle beteiligten Komparatoren gelöscht bzw.
 911 ersetzt: Komparatoren, die {\em nicht} zu einem Wechsel der Leitung geführt
 912 haben, werden ersatzlos gelöscht. Diese Komparatoren sind in
 913 Abbildung~\ref{fig:oe-transposition-cut0} grün markiert. Die Komparatoren, die
 914 zum Wechsel der Leitung geführt haben, werden durch sich kreuzende Leitungen
 915 ersetzt. Das Resultat ist eine Leitung, auf der das Minimum beziehungsweise
 916 das Maximum angenommen wird, die an unterster oder oberster Stelle endet und
 917 auf die keine Komparatoren mehr berührt
 918 (Abbildung~\ref{fig:oe-transposition-cut1}).
 919
 920 Die Werte auf den verbleibenden $(n-1)$~Leitungen müssen vom restlichen
 921 Komparatornetzwerk immernoch sortiert werden: Wir haben lediglich die Position
 922 des Minimums oder des Maximums angenommen. Ein Sortiernetzwerk muss die
 923 Eingabe sortieren, egal auf welcher Leitung das Minimum~/ das Maximum liegt.
 924 Wir haben lediglich angefangen, das Sortiernetzwerk unter diese Annahme
 925 auszuwerten -- über die verbleibenden Eingänge haben wir keine Aussage
 926 getroffen. Entsprechend müssen die verbleibenden Ausgänge eine sortierte Liste
 927 mit $(n-1)$~Elementen darstellen.
 928
 929 Wenn wir die Minimum- beziehungsweise Maximum-Leitung entfernen
 930 (Abbildung~\ref{fig:oe-transposition-cut2}), bleibt das Sortiernetzwerk für
 931 $(n-1)$~Leitungen übrig. Je nachdem, ob auf einer Leitung ein Minimum oder ein
 932 Maximum angenommen wird, bezeichnen wir das eliminieren einer Leitung als
 933 \emph{Minimum-Schnitt} beziehungsweise \emph{Maximum-Schnitt}.
 934
 935 Die letzte Abbildung, \ref{fig:oe-transposition-cut3}, zeigt das
 936 Sortiernetzwerk wieder mit den üblichen geraden Leitungen und die rot
 937 markierten Komparatoren wurden verschoben, so dass sich eine kompaktere
 938 Darstellung ergibt. Ausserdem ist das
 939 {\em Odd-Even-Transpositionsort-Netzwerk} für sieben Werte markiert. Der
 940 zusätzliche Komparator vor dem $\textrm{OET}(7)$ hat keinen Einfluss auf die
 941 Ausgabe und kann entfernt werden.
 942
 943 \subsubsection{Anzahl möglicher und unterschiedlicher Schnittmuster}
 944 \label{sect:anzahl_schnittmuster}
 945
 946 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
 947 Sortiernetzwerk mit $n$~Ein\-gängen Sortiernetzwerke mit $n-1$, $n-2$,
 948 $n-3$,~\dots Eingängen zu erzeugen. Insbesondere können auf diese Art und
 949 Weise einen Sortiernetzwerke mit $2n$~Eingängen wieder auf Sortiernetzwerke
 950 mit $n$~Eingängen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
 951 nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
 952 ${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
 953 \emph{$k$-Schnittmuster}.
 954
 955 Zwei Schnittmuster heißen \emph{äquivalent} bezüglich~$S$, wenn ihre Anwendung
 956 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heißen die
 957 Schnittmuster \emph{unterschiedlich} bezüglich~$S$.
 958
 959 Bei einem Sortiernetzwerk mit $n$~Eingängen gibt es $2n$~Möglichkeiten eine
 960 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
 961 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
 962 ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
 963 ergeben sich insgesamt
 964 \begin{equation}\label{eqn:anzahl_schnittmuster}
 965   \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
 966   \quad (n > m)
 967 \end{equation}
 968 \emph{mögliche} Schnittmuster. Diese Schnittmuster sind nicht alle
 969 unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
 970 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
 971 führen beide Reihenfolgen zum selben Ergebnis.
 972
 973 \textit{Moritz Mühlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass es
 974 möglich ist, mehrere Eingänge gleichzeitig mit Minimum beziehungsweise Maximum
 975 vorzubelegen. Dadurch wird die Anzahl der möglichen Schnittmuster reduziert,
 976 die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverändert. Die
 977 Anzahl der möglichen Schnittmuster setzt sich zusammen aus der Anzahl von
 978 Möglichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwählen, und die möglichen
 979 Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel für die Anzahl
 980 der möglichen Schnittmuster:
 981 \begin{displaymath}
 982   2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
 983   = 2^{k} \cdot \frac{n!}{k! (n-k)!}
 984   = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
 985   \quad (1 \leqq k < n)
 986 \end{displaymath}
 987
 988 Die Anzahl der möglichen Schnittmuster wird mit der Anzahl der zu entfernenden
 989 Leitungen sehr schnell sehr groß. Um ein Sortiernetzwerk mit 32~Eingängen auf
 990 ein Sortiernetzwerk mit 16~Eingängen zu reduzieren, ist ein Schmittmuster mit
 991 16~Schnitten notwendig, für das es bereits etwa ${3,939 \cdot 10^{13}}$
 992 Möglichkeiten gibt. Ein Ausprobieren aller Möglichkeiten ist für große
 993 Netzwerke nicht oder nur unter erheblichem Ressourcenaufwand möglich.
 994
 995 Die Anzahl der \emph{unterschiedlichen} Schnittmuster ist allerdings kleiner
 996 als die Anzahl der möglichen Schnittmuster. Für jeden Komparator auf der
 997 ersten Stufe gibt es neun verschiedene Eingangskonfigurationen: Für beide
 998 Eingänge gibt es drei mögliche Eingangswerte, Minimum, Maximum und
 999 unspezifiziert. Es gibt drei Konfigurationen, bei denen an beiden Eingängen
1000 der gleiche Wert angelegt wird, und sechs Konfigurationen, bei denen sich die
1001 Werte unterscheiden.
1002
1003 Bei diesen letzten sechs Konfigurationen werden je zwei auf das selbe
1004 Ausgangmuster abgebildet, weil die Position des Minimums beziehungsweise des
1005 Maximums durch den Komparator vorgegeben wird. Das heißt, dass die neun
1006 unterschiedlichen Eingangsmuster nur sechs unterschiedliche Ausgangsmuster
1007 erzeugen. In der zweiten und allen folgenden Schichten kann man diesen
1008 Unterschied nicht mehr erkennen. In allen sechs Fällen, in denen sich die
1009 Eingänge unterscheiden, wird anschließend der Komparator entfernt, so dass
1010 sich die Resultate auch in der ersten Schicht nicht unterscheiden.
1011
1012 \begin{figure}
1013   \begin{center}
1014     \includegraphics[viewport=0 0 360 216,width=15cm]{images/count-cuts-16.pdf}
1015   \end{center}
1016   \caption{Anzahl der \emph{unterschiedlichen} Sortiernetzwerke, die durch
1017   8-Schnittmuster aus $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und
1018   $\operatorname{PS}(16)$ hervorgegangen sind. Die Anzahl der
1019   unterschiedlichen Netzwerke nach $10^6$~Iterationen ist 3519 für das
1020   \emph{Odd-Even-Mergesort-Netzwerk}, 4973 für das \emph{bitone
1021   Mergesort-Netzwerk} und 18764 für das \emph{Pairwise-Sorting-Netzwerk}.}
1022   \label{fig:count-cuts-16}
1023 \end{figure}
1024
1025 Alleine durch Betrachten der ersten Schicht von Komparatoren konnte die Anzahl
1026 der \emph{unterschiedlichen} Schnittmuster auf höchstens $\frac{2}{3}$ der
1027 \emph{möglichen} Schnittmuster reduziert werden. Um die Anzahl der
1028 \emph{unterschiedlichen} Schnittmuster experimentell zu ermitteln, wurden je
1029 eine Million zufällige 8-Schnittmuster auf die 16-Sortiernetzwerke
1030 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
1031 angewandt. Anschließend wurde mithilfe einer Hashtabelle überprüft, ob das
1032 resultierende Sortiernetzwerk schon von einem \emph{äquivalenten}
1033 Schnittmuster erzeugt wurde. Falls das Sortiernetzwerk noch nicht in der
1034 Hashtabelle enthalten war, wurde der Zähler für unterschiedliche Schnittmuster
1035 erhöht und das Sortiernetzwerk eingefügt.
1036
1037 Abbildung~\ref{fig:count-cuts-16} trägt die Anzahl der
1038 \emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufälligen
1039 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
1040 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verändert und der
1041 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
1042 nahe ist.
1043
1044 Die Anzahl der möglichen 8-Schnittmuster ist entsprechend der
1045 Formel~\ref{eqn:anzahl_schnittmuster} 3.294.720. Diese möglichen Schnittmuster
1046 führen aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
1047 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
1048 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
1049 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es möglich, dass mehr
1050 Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lässt.
1051 Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
1052 Annahme, dass die Anzahl dieser zusätzlichen, unterschiedlichen Schnittmuster
1053 vernachlässigbar klein ist.
1054
1055 Bedingt durch die sehr große Anzahl möglicher Schnittmuster ist dieses
1056 Experiment für größere Sortiernetzwerke leider nicht sinnvoll durchführbar.
1057 Die Hashtabelle benötigt mehr Arbeitsspeicher als in derzeitigen Rechnern
1058 vorhanden ist, bevor ein entsprechender Graph den linearen Bereich für
1059 „kleine“ x-Werte verlässt.
1060
1061 Um die Anzahl der unterschiedlichen Schnittmuster trotzdem abschätzen zu
1062 können, kann man sich einer stochastischen Methode bedienen, der sogenannten
1063 \emph{Monte-Carlo-Methode}. Zunächst generiert man eine Menge~$S$ von
1064 $k$~unterschiedlichen Schnittmustern. Anschließend werden $n$~Schnittmuster
1065 zufällig erzeugt und überprüft, ob sie sich in der Menge~$S$ enthalten sind.
1066 Unter der Annahme, dass das Verhältnis der zufälligen Schnittmuster, die in
1067 $S$ enthalten sind, und $n$ dem Verhältnis von $k$ und der Anzahl der
1068 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
1069 unterschiedlichen Schnittmuster abschätzen.
1070
1071 \begin{figure}
1072   \begin{center}
1073     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-10000-1000000-32.pdf}
1074   \end{center}
1075   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1076   \emph{Monte-Carlo-Methode} für $\operatorname{OES}(32)$ und
1077   $\operatorname{BS}(32)$.}
1078   \label{fig:collisions-10000-1000000-32}
1079 \end{figure}
1080
1081 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
1082 Monte-Carlo-Algorithmus für 16-Schnittmuster zu sehen, die auf
1083 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
1084 jedem Sortiernetzwerk wurden zunächst eine Menge~$S$ von 10.000
1085 \emph{unterschiedlichen} Schnittmustern erzeugt. Anschließend wurden 1.000.000
1086 zufällige Schnittmuster erzeugt und der Anteil der zufälligen Schnittmuster,
1087 die \emph{äquivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
1088 Für $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, für
1089 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine Abschätzung von $5,2
1090 \cdot 10^6$ unterschiedlichen Schnittmustern für $\operatorname{OES}(32)$ und
1091 $3,4 \cdot 10^6$ für $\operatorname{BS}(32)$.
1092
1093 \begin{figure}
1094   \begin{center}
1095     \includegraphics[viewport=0 0 425 262,width=15cm]{images/collisions-100000-1000000-32-ps.pdf}
1096   \end{center}
1097   \caption{Abschnätzung der unterschiedlichen Schnittmuster mit der
1098   \emph{Monte-Carlo-Methode} für $\operatorname{PS}(32)$. 385 von 1.000.000
1099   zufälligen Schnittmustern waren äquivalent zu einem Schnittmuster in einer
1100   Menge von 100.000. Daraus ergibt sich eine Schätzung von $2,6 \cdot 10^8$
1101   unterschiedlichen Schnittmustern.}
1102   \label{fig:collisions-100000-1000000-32-ps}
1103 \end{figure}
1104
1105 Im vorherigen Abschnitt wurde das \emph{Pairwise-Sorting-Netzwerk}
1106 $\operatorname{PS}(32)$ nicht betrachtet, da es für dieses Netzwerk viel mehr
1107 unterschiedliche 16-Schnittmuster gibt als für $\operatorname{OES}(32)$ und
1108 $\operatorname{BS}(32)$. In Anbetracht der Tatsache, dass die Anzahl der
1109 unterschiedlichen 8-Schnittmuster für $\operatorname{PS}(16)$ in
1110 Abbildung~\ref{fig:count-cuts-16} bereits mehr als dreimal größer war als die
1111 Anzahl für $\operatorname{OES}(16)$ beziehungsweise $\operatorname{BS}(16)$,
1112 ist dieser Umstand wenig verwunderlich. In einem kombinierten Graphen hätte
1113 man keine Details mehr erkennen können. Aufgrund der hohen Anzahl
1114 unterschiedlicher Schnittmuster, wurde für das gleiche Experiment mit
1115 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
1116 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
1117 Schnittmuster gefunden, die zu einem Schnittmuster in der Menge äquivalent
1118 sind. Daraus ergibt sich eine Abschätzung von $2,6 \cdot 10^8$
1119 unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
1120 vorherigen Sortiernetzwerken, aber immernoch fünf Zehnerpotenzen kleiner als
1121 die Anzahl der \emph{möglichen} Schnittmuster.
1122
1123 \newpage
1124 \section{Der \textsc{SN-Evolution}-Algorithmus}
1125
1126 Der \textsc{SN-Evolution}-Algorithmus ist ein \emph{evolutionärer
1127 Algorithmus}, der die in den vorherigen Abschnitten beschriebenen Mischer
1128 (Abschnitt~\ref{sect:konstruktive_netzwerke}) und Schnittmuster
1129 (Abschnitt~\ref{sect:leitungen_entfernen}) verwendet, um „möglichst gute“
1130 Sortiernetzwerke zu erzeugen. Was ein „gutes“ Sortiernetzwerk ausmacht, wird
1131 in Abschnitt~\ref{sect:bewertung} behandelt.
1132
1133 \subsection{Bewertungsfunktion}\label{sect:bewertung}
1134
1135 Um Sortiernetzwerke überhaupt optimieren zu können, muss zunächst die
1136 {\em Güte} eines Netzwerkes definiert werden. Prinzipiell gibt es zwei Ziele,
1137 die bei Sortiernetzwerken verfolgt werden können:
1138 \begin{itemize}
1139   \item Möglichst wenige Komparatoren („effizient“)
1140   \item Möglichst wenige Schichten („schnell“)
1141 \end{itemize}
1142
1143 Diese Ziele führen im Allgemeinen zu unterschiedlichen Netzwerken. Das
1144 effizienteste bekannte Sortiernetzwerk für 16~Eingänge besteht aus
1145 60~Komparatoren in 10~Schichten. Das schnellste Netzwerk besteht aus
1146 61~Komparatoren in nur 9~Schichten.
1147
1148 Eine Gütefunktion, die die beiden Ziele "`effizient"' und "`schnell"'
1149 berücksichtigen kann, hat die folgende allgemeine Form:
1150 \begin{equation}
1151   \operatorname{Guete}(S) = w_{\mathrm{Basis}}
1152                     + w_{\mathrm{Komparatoren}} \cdot \left|S\right|_\mathrm{Komparatoren}
1153                     + w_{\mathrm{Schichten}} \cdot \left|S\right|_\mathrm{Schichten}
1154 \end{equation}
1155 Die Parameter $w_{\mathrm{Komparatoren}}$ und $w_{\mathrm{Schichten}}$ dienen
1156 dabei der Festlegung des Optimierungsziels. Wenn einer der beiden Parameter
1157 gleich Null ist, wird nur das jeweils andere Ziel verfolgt. Sind beide
1158 Parameter gleich Null, werden alle Netzwerke mit der gleich Güte bewertet --
1159 jegliche Ergebnisse sind dann rein zufälliger Natur.\footnote{Dass dies nicht
1160 so schlecht ist wie man intuitiv vermuten könnte, zeigt der
1161 \textsc{SN-Markov}-Algorithmus in Abschnitt~\ref{sect:markov}.}
1162
1163 Da möglichst effiziente und schnelle Sortiernetzwerke gefunden werden sollen,
1164 ist ein kleiner Wert von $\operatorname{Guete}(S)$ besser als ein großer Wert.
1165 Das heißt, dass das Ziel von \textsc{SN-Evolution} ist,
1166 $\operatorname{Guete}(S)$ zu \emph{minimieren}.
1167
1168 Mit dem Parameter $w_{\mathrm{Basis}}$ kann auf die Selektion Einfluss
1169 genommen werden. Ist er groß, wird der relative Unterschied der Güten
1170 verschiedener Netzwerke kleiner, was die {\em Exploration}, das Absuchen des
1171 gesamten Lösungsraums, begünstigt. Wählt man $w_{\mathrm{Basis}}$ hingegen
1172 klein -- in Abhängigkeit von den anderen beiden Parametern sind auch negative
1173 Werte möglich -- werden die relativen Unterschiede groß. Dadurch wird die {\em
1174 Exploitation}, das Finden (lokaler) Optima, bevorzugt.
1175
1176 Diese Parameter haben einen großen Einfluss auf die Geschwindigkeit, mit der
1177 der \textsc{SN-Evolution}-Algorithmus konvergiert und ob er tatsächlich gute
1178 Lösungen findet oder sich in \emph{lokalen} Optima verrennt. Leider gibt es
1179 kein Patentrezept für die Wahl der Parameter, so dass für verschiedene
1180 Leitungszahlen und Mischer-Typen experimentiert werden muss.
1181
1182 \subsection{Selektion}
1183
1184 Die \emph{Selektion} sorgt dafür, dass bessere Individuen eine größere
1185 Wahrscheinlichkeit haben, zur nächsten Generation beizutragen. Diese
1186 Ungleichbehandlung von Individuen verschiedener Güte ist der Grund für das
1187 Streben des Algorithmus nach besseren Lösungen.
1188
1189 Obwohl dieser Vorteil für gute Individuen intuitiv als sehr gering erscheint,
1190 ist es sehr häufig, dass die \emph{Exploitation} überhand gewinnt und der
1191 Algorithmus vorschnell in Richtung eines lokalen Optimums optimiert.
1192
1193 Die in \textsc{SN-Evolution} implementierte Selektion lässt sich mithilfe von
1194 Pseudocode wie folgt beschreiben:
1195 \begin{verbatim}
1196 Guetesumme := 0
1197 Auswahl := (leer)
1198
1199 fuer jedes Individuum in Population
1200 {
1201   reziproke Guete := 1.0 / Guete(Individuum)
1202   Wahrscheinlichkeit P := reziproke Guete / (reziproke Guete + Guetesumme)
1203   Guetesumme := Guetesumme + reziproke Guete
1204
1205   mit Wahrscheinlichkeit P
1206   {
1207     Auswahl := Individuum
1208   }
1209 }
1210 gebe Auswahl zurueck
1211 \end{verbatim}
1212
1213 \subsection{Rekombination}
1214
1215 Bei der Rekombination werden zwei Individuen --~hier Sortiernetzwerke~-- zu
1216 einer neuen Lösung kombiniert. Dazu verwenden wir einen Mischer, zum Beispiel
1217 den {\em bitonen Mischer} (Abschnitt~\ref{sect:der_bitone_mischer}) oder den
1218 {\em Odd-Even-Mischer} (Abschnitt~\ref{sect:der_odd_even_mischer}), um die
1219 beiden Netzwerke zu einem Netzwerk mit $2n$~Leitungen zusammenzufügen.
1220 Anschließend entfernen wir zufällig $n$~Leitungen wie in
1221 Abschnitt~\ref{sect:leitungen_entfernen} beschrieben.
1222
1223 Dieses Verfahren hat den großen Vorteil, dass es die Sortiereigenschaft
1224 erhält.
1225
1226 \subsection{Mutation}
1227
1228 Zu einem vollständigen evolutionären Algorithmus gehört außerdem eine Mutation
1229 --~eine zufällige Veränderung einer Lösung. Leider ist es nicht möglich ein
1230 Sortiernetzwerk zufällig zu verändern aber trotzdem die Sortiereigenschaft zu
1231 erhalten. Selbst das \emph{Hinzufügen} eines zufälligen Komparators kann diese
1232 Eigenschaft zerstören.
1233
1234 Nach einer Mutation müsste man überprüfen, ob das neue Komparatornetzwerk die
1235 Sortiereigenschaft noch besitzt. Nach heutigem Wissenstand ist diese
1236 Überprüfung nur mit exponentiellem Aufwand möglich, etwa durch das
1237 Ausprobieren aller $2^n$~Bitmuster.
1238
1239 Um das Potenzial einer Mutation abzuschätzen habe ich in den evolutionären
1240 Algorithmus eine Überprüfung eingebaut. Unmittelbar vor dem Einfügen in die
1241 Population überprüft das Programm die Notwendigkeit jedes einzelnen
1242 Komparators. Dazu wurde nacheinander jeder Komparator entfernt und überprüft,
1243 ob das verbleibende Netzwerk die Sortiereigenschaft noch besitzt.
1244
1245 \begin{itemize}
1246 \item Güte von Sortiernetzwerken (Anzahl der Komparatoren, Anzahl der
1247 Schichten, kobiniert)
1248 \item Rekombination: Merge Anhängen und Leitungen entfernen.
1249 \end{itemize}
1250
1251 Ein Beispielnetzwerk, das von dem Algorithmus gefunden wird, zeigt
1252 Abbildung~\ref{fig:evolutionary_08}.
1253
1254 \begin{figure}
1255 \begin{center}
1256 \input{images/evolutionary-08.tex}
1257 \end{center}
1258 \caption{Ein mit dem evolutionären Algorithmus erzeugtes Sortiernetzwerk mit
1259 acht Eingängen. Es besteht aus 19~Komparatoren in 6~Schichten.}
1260 \label{fig:evolutionary_08}
1261 \end{figure}
1262
1263 \begin{figure}
1264 \begin{center}
1265 \input{images/08-e2-1237993371.tex}
1266 \end{center}
1267 \caption{{\tt images/08-e2-1237993371.tex}: 19~Komparatoren in 6~Schichten}
1268 \label{fig:08-e2-1237993371}
1269 \end{figure}
1270
1271 \begin{figure}
1272 \begin{center}
1273 \input{images/09-e2-1237997073.tex}
1274 \end{center}
1275 \caption{{\tt images/09-e2-1237997073.tex}: 25~Komparatoren in 8~Schichten}
1276 \label{fig:09-e2-1237997073}
1277 \end{figure}
1278
1279 \begin{figure}
1280 \begin{center}
1281 \input{images/09-e2-1237999719.tex}
1282 \end{center}
1283 \caption{{\tt images/09-e2-1237999719.tex}: 25~Komparatoren in 7~Schichten}
1284 \label{fig:09-e2-1237999719}
1285 \end{figure}
1286
1287 \begin{figure}
1288 \begin{center}
1289 \input{images/10-e2-1239014566.tex}
1290 \end{center}
1291 \caption{{\tt images/10-e2-1239014566.tex}: 29~Komparatoren in 8~Schichten}
1292 \label{fig:10-e2-1239014566}
1293 \end{figure}
1294
1295 \subsection{Güte}
1296
1297 \begin{itemize}
1298 \item So gut kann man mindestens werden {\em ($\rightarrow$ Bitonic-Mergesort, vermute ich)}.
1299 \item Wie gut die Netzwerke werden, hängt stark vom verwendeten \em{Mischer} ab.
1300 \item Ggf. Abschnitt „Shmoo-Äquivalenz“ kürzen und hier einbauen.
1301 \end{itemize}
1302
1303 %\input{shmoo-aequivalenz.tex}
1304
1305 \newpage
1306 \section{Der \textsc{SN-Evolution-Cut}-Algorithmus}
1307 \label{sect:sn-evolution-cut}
1308
1309 Das Programm \textsc{SN-Evolution-Cut} implementiert einen evolutionären
1310 Algorithmus, der zu einem gegebenen Sortiernetzwerk und einer gewünschten
1311 Leitungszahl ein Schnittmuster sucht, dass ein Sortiernetzwerk mit einer
1312 möglichst geringen Anzahl von Komparatoren und Schichten ergibt. Zur Bewertung
1313 von Sortiernetzwerken siehe auch Abschnitt~\ref{sect:bewertung}. Mit diesem
1314 Algorithmus wurden zu einer Reihe von „interessanten“ Netzwerken möglichst
1315 gute Schnittmuster gesucht.
1316
1317 Der \textsc{SN-Evolution-Cut}-Algorithmus verwendet die \emph{Schnittmuster}
1318 als Individuen. Um zwei Individuen zu rekombinieren werden die ersten
1319 $r$~Schnitte des einen Schnittmusters verwendet und die letzten
1320 ${c-r}$~Schnitte des zweiten Schmittmusters. $r$ ist eine Zufallsvariable mit
1321 $0 \leqq r \leqq c$.
1322
1323 Die Mutation setzt entweder die Leitungs-Nummer eines Schnitts~$i$ zufällig
1324 auf einen neuen Wert $l$ mit $0 \leqq l \le n-i$ oder invertiert die
1325 Schnitt-Richtung.
1326
1327 \subsection{Versuche mit dem bitonen Mergesort-Netzwerk}
1328
1329 In \cite{MW2010} zeigen \textit{Moritz Mühlenthaler} und \textit{Rolf Wanka},
1330 wie man einen bitonen Mischer, der nach Batchers Methode konstruiert wurde,
1331 durch systematisches Entfernen von Leitungen in einen ebenfalls bitonen
1332 Mischer mit der Hälfte der Leitungen transformiert. Diese alternativen Mischer
1333 sparen im Vergleich zu den Mischern, die nach Batchers Methode konstruiert
1334 werden, Komparatoren ein.
1335
1336 Beispeilsweise geben \textit{Mühlenthaler} und \textit{Wanka} ein
1337 Sortiernetzwerk mit 16~Eingängen an, das mithilfe der alternativen Mischer
1338 konstruiert wurde. Dieses Sortiernetzwerk benötigt 68~Komparatoren, 12~weniger
1339 als das bitone Mergesort-Netzwerk nach Batchers Methode. Gegenüber Batchers
1340 Methode sparen so konstruierte Sortiernetzwerke ${\frac{1}{4}n(\log n - 1)}$
1341 Komparatoren ein.
1342
1343 \begin{figure}
1344   \begin{center}
1345     \input{images/16-ec-from-bs32.tex}
1346   \end{center}
1347   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1348     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1349     \textsc{SN-Evolution-Cut} aus dem \emph{bitonen Mergesort-Netzwerk}
1350     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1351   \label{fig:16-ec-from-bs32}
1352 \end{figure}
1353
1354 \begin{figure}
1355   \begin{center}
1356     \input{images/16-ec-from-bs32-normalized.tex}
1357   \end{center}
1358   \caption{Sortiernetzwerk mit 16~Leitungen und 68~Komparatoren in
1359     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1360     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1361     $\operatorname{BS}(32)$ durch 16~Schnitte erzeugt.}
1362   \label{fig:16-ec-from-bs32-normalized}
1363 \end{figure}
1364
1365 Startet man {\sc SN-Evolution-Cut} mit dem bitonen Mergesort-Netzwerk
1366 $\operatorname{BS}(32)$ und der Vorgabe 16~Leitungen zu entfernen, liefert der
1367 Algorithmus Sortiernetzwerke, die ebenfalls aus 68~Komparatoren bestehen. Ein
1368 16-Sortiernetzwerk, das auf diese Weise generiert wurde, ist in den
1369 Abbildungen~\ref{fig:16-ec-from-bs32} und~\ref{fig:16-ec-from-bs32-normalized}
1370 zu sehen. Abbildung~\ref{fig:16-ec-from-bs32} zeigt $\operatorname{BS}(32)$
1371 und das
1372 ${\operatorname{MIN}(0,5,9,11,15,17,20,22,26,29,30)}$-${\operatorname{MAX}(2,4,13,19,24)}$-Schnittmuster,
1373 das durch \textsc{SN-Evolution-Cut} gefunden wurde.
1374 Abbildung~\ref{fig:16-ec-from-bs32-normalized} zeigt das 16-Sortiernetzwerk
1375 nachdem das Schnittmuster angewandt und das Netzwerk normalisiert wurde. Eine
1376 Ähnlichkeit zu $\operatorname{BS}(32)$ oder $\operatorname{BS}(16)$ ist in
1377 diesem Netzwerk nicht mehr erkennbar -- insbesondere die ersten Schichten des
1378 Netzwerks scheinen rein zufällig zu sein.
1379
1380 \begin{figure}
1381   % 0:MAX 1:MAX 4:MIN 6:MAX 9:MAX 11:MAX 14:MIN 15:MAX 18:MAX 19:MAX 21:MAX
1382   % 23:MIN 24:MAX 25:MAX 30:MIN 31:MIN 32:MAX 34:MAX 36:MIN 37:MAX 40:MAX
1383   % 43:MAX 46:MIN 47:MAX 48:MAX 49:MAX 54:MIN 55:MAX 56:MAX 58:MIN 60:MAX
1384   % 63:MAX
1385   \begin{center}
1386     \input{images/32-ec-from-bs64.tex}
1387   \end{center}
1388   \caption{Sortiernetzwerk mit 32~Leitungen und 206~Komparatoren in
1389     15~Schichten. Das Netzwerk wurde von dem Algorithmus
1390     \textsc{SN-Evolution-Cut} aus dem bitonen Mergesort-Netzwerk
1391     $\operatorname{BS}(64)$ durch 32~Schnitte erzeugt. Das zugehörige
1392     Schnittmuster ist
1393     $\operatorname{MIN}(4, 14, 23, 30, 31, 36, 46, 54, 58)$,
1394     $\operatorname{MAX}(0, 1, 6, 9, 11, 15, 18, 19, 21, 24, 25, 32, 34, 37,
1395     40, 43, 47, 48, 49, 55, 56, 60, 63)$.}
1396   \label{fig:32-ec-from-bs64}
1397 \end{figure}
1398
1399 Das Ergebnis von \textit{Mühlenthaler} von \textit{Wanka}, die den bitonen
1400 Mischer optimiert und anschließend aus diesen Mischern ein Sortiernetzwerk
1401 konstruiert haben, kann demnach auch erreicht werden, wenn
1402 $\operatorname{BS}(32)$ auf ein 16-Sortiernetzwerk reduziert wird. Bei anderen
1403 Größen, beispielsweise wenn man $\operatorname{BS}(64)$ auf ein
1404 32-Sortiernetzwerk reduziert, kann das Ergebnis sogar noch übertroffen werden,
1405 wie in Abbildung~\ref{fig:32-ec-from-bs64} zu sehen: Ein nach Batchers Methode
1406 konstruiertes Sortiernetzwerk benötigt 240~Komparatoren, ein aus den
1407 optimierten Mischern aufgebautes Netzwerk verbessert die Kosten auf
1408 208~Komparatoren. Das in Abbildung~\ref{fig:32-ec-from-bs64} dargestellte
1409 Sortiernetzwerk benötigt lediglich 206~Komparatoren. Die Komparatoren aller
1410 dieser Netzwerke können in 15~Schichten angeordnet werden, so dass die
1411 Verzögerung dieser Sortiernetzwerke gleich ist.
1412
1413 Leider sind die Schnittmuster, die \textsc{SN-Evolution-Cut} ausgibt, sehr
1414 unregelmäßig. Bisher ist es nicht gelungen eine Konstruktionsanweisung für
1415 gute Schnittmuster anzugeben.
1416
1417 Entscheidend für das Ergebnis eines Schnittmusters scheint beim bitonen
1418 Mergesort-Netzwerk die Aufteilung der Minimum- und Maximumschnitte zu sein.
1419 Von Hundert 16-Schnittmustern für $\operatorname{BS}(32)$, die in
1420 Sortiernetzwerken mit 68~Komparatoren in 10~Schichten resultieren, hatten 73
1421 ein Verhältnis von $5/11$, 13 hatten ein Verhältnis von $4/12$ und 14 hatten
1422 ein Verhältnis von $3/13$ Minimum- beziehungsweise Maximumschnitten. Da sich
1423 die Schnittmuster aufgrund der Symmetrie des bitonen Mergesort-Netzwerks
1424 leicht invertieren lassen, werden der Fall, dass es mehr Minimumschnitte, und
1425 der Fall, dass es mehr Maximumschnitte gibt, nicht unterschieden.
1426
1427 Dass die Ergebnisse von \textsc{SN-Evolution-Cut} keine erkennbare Struktur
1428 haben, ist jedoch kein Eigenschaft des Algorithmus, sondern hängt insbesondere
1429 von der Eingabe ab. Wird \textsc{SN-Evolution-Cut} beispielsweise mit dem
1430 \emph{Odd-Even-Transpositionsort-Netzwerk} $\operatorname{OET}(n)$ und
1431 $m$~Schnitten gestartet, so ist das beste Ergebnis immer das
1432 $\operatorname{OET}(n-m)$-Netzwerk.
1433
1434 \begin{figure}
1435   \begin{center}
1436     \input{images/16-ec-from-ps32.tex}
1437   \end{center}
1438   \caption{Sortiernetzwerk mit 16~Leitungen und 63~Komparatoren in
1439     10~Schichten. Das Netzwerk wurde von dem Algorithmus
1440     \textsc{SN-Evolution-Cut} aus dem \emph{Pairwise-Sorting-Netzwerk}
1441     $\operatorname{PS}(32)$ durch 16~Schnitte erzeugt.}
1442   \label{fig:16-ec-from-ps32}
1443 \end{figure}
1444
1445 \subsection{Versuche mit dem Pairwise-Sorting-Netzwerk}
1446
1447 Anders verhält sich das \emph{Pairwise-Sorting-Netzwerk}
1448 $\operatorname{PS}(n)$, das \textit{Ian Parberry} in seiner Arbeit „The
1449 Pairwise Sorting Network“ \cite{P1992} definiert. Startet man
1450 \textsc{SN-Evolution-Cut} mit $\operatorname{PS}(32)$ und der Vorgabe,
1451 16~Leitungen zu entfernen, erhält man ein Sortiernetzwerk, dass die gleiche
1452 Anzahl an Komparatoren und Schichten hat wie $\operatorname{PS}(16)$ und
1453 $\operatorname{OES}(16)$. Eines dieser Sortiernetzwerke ist in
1454 Abbildung~\ref{fig:16-ec-from-ps32} dargestellt.
1455
1456 Obwohl das \emph{Pairwise-Sorting-Netzwerk} den \emph{Odd-Even-Mischer} nicht
1457 einsetzt und auch nicht auf einem Mischer basiert, ist der
1458 $\operatorname{OEM}(8,8)$ im Sortiernetzwerk in
1459 Abbildung~\ref{fig:16-ec-from-ps32} eindeutig erkennbar (Schichten~7--10). In
1460 den Schichten~1--6 erkennt man zwei unabhängige Sortiernetzerke, die
1461 strukturell identisch zu $\operatorname{PS}(8)$ sind -- lediglich die
1462 Schichten~1 und~2 sowie 4~und~5 sind vertauscht.
1463
1464 \begin{displaymath}
1465 \textit{Eingang}_i = \left\{ \begin{array}{rl}
1466   -\infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{0, 6\} \\
1467    \infty & \quad \textrm{falls } i \operatorname{mod} 8 \in \{2, 4\} \\
1468         ? & \quad \mathrm{sonst}
1469   \end{array} \right.
1470 \end{displaymath}
1471
1472 \begin{figure}
1473   \begin{center}
1474     \input{images/32-pairwise-cut-16-pairwise.tex}
1475   \end{center}
1476   \caption{PS(32) mit 16 Schnitten zu PS(16).}
1477   \label{fig:ps16-from-ps32}
1478 \end{figure}
1479
1480 \begin{figure}
1481   \begin{center}
1482     \input{images/16-pairwise.tex}
1483   \end{center}
1484   \caption{Das $\operatorname{PS}(16)$-Sortiernetzwerk mit 8~Schnitten
1485   ($\operatorname{MIN}(0,2,4,6), \operatorname{MAX}(9,11,13,15)$). Das
1486   resultierende 8-Sortiernetzwerk ist $\operatorname{OES}(8)$.}
1487   \label{fig:16-pairwise}
1488 \end{figure}
1489
1490 Wendet man \textsc{SN-Evolution-Cut} auf $\operatorname{PS}(16)$ an, so kann
1491 man $\operatorname{OES}(8)$ erhalten.
1492
1493 \subsection{Versuche mit dem Odd-Even-Mergesort-Netzwerk}
1494
1495 \todo{Schreibe noch etwas zum Odd-Even-Mergesort-Netzwerk.}
1496
1497 \begin{itemize}
1498   \item Beispiel: Moritz und Rolfs Optimierung für Bitonic-Sort.
1499   \item Wie gut kann man durch wegschneiden werden?
1500   \item Wieviele Schnitte ergeben das selbe Netzwerk? Oder andersrum: Wieviele
1501   unterschiedliche Netzwerke kann ich erhalten? Wieviele Nachfolger hat ein
1502   Netzwerk / Knoten in der Markov-Kette?
1503   \item Abschnitt „Optimierung der Schnitte“ hier einbauen.
1504 \end{itemize}
1505
1506 \newpage
1507 \section{Der \textsc{SN-Markov}-Algorithmus}
1508 \label{sect:markov}
1509
1510 Der evolutionäre \textsc{SN-Evolution}-Algorithmus aus dem vorherigen
1511 Abschnitt verwendete immer zwei zufällige Sortiernetzwerke („Individuen“) aus
1512 einer Population. Da die beiden „Eltern“ zufällig und unabhängig voneinander
1513 ausgewählt werden, kann es vorkommen, dass das selbe Sortiernetzwerk zweimal
1514 verwendet und mit sich selbst kombiniert wird.
1515
1516 Macht man diesen Spezialfall zum Regelfall, indem man \emph{immer} das
1517 aktuelle Netzwerk mit sich selbst kombiniert und anschließend die Hälfte aller
1518 Leitungen eliminiert, lassen sich einige interessante Beobachtungen anstellen.
1519 Netzwerke, die aus einem Netzwerk $S_0$ durch die beschriebene Kombination von
1520 $S_0$ mit sich selbst und anschließendem Eliminieren der Hälfte der Leitungen
1521 hervorgehen können, heißen \emph{Nachfolger} von $S_0$.
1522
1523 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
1524 (gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
1525 Sortiernetzwerke $S_0$ und $S_1$ repräsentieren, sind genau dann mit einer
1526 Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
1527 $S_0$ ist, das heißt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
1528 selbst erzeugen kann.
1529
1530 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
1531 (unterschiedlicher) Schnittmuster und damit die Anzahl der Nachfolger sehr
1532 groß. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
1533 zu
1534 \begin{displaymath}
1535   2^n \cdot \left( \begin{array}{c} 2n \\ n \end{array} \right)
1536 \end{displaymath}
1537 Nachfolger.
1538
1539 Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
1540 zufälligen Weg (englisch: \textit{random walk}) zurück. Er startet auf einem
1541 gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum Nächsten zu
1542 gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
1543 selbst und erhält so einen zufälligen Nachfolger.
1544
1545 \begin{itemize}
1546   \item $n \leftarrow \mathrm{Input}$
1547   \item \texttt{while} \textit{true}
1548   \begin{itemize}
1549     \item $n \leftarrow \operatorname{recombine} (n, n)$
1550   \end{itemize}
1551 \end{itemize}
1552
1553 \begin{itemize}
1554   \item Beste erreichte Netzwerke (gleich zu \emph{OE-Mergesort}).
1555   \item Anzahl der erreichbaren Sortiernetzwerke.
1556   \item Anzahl der Komparatoren und Anzahl der Schichten der durchlaufenen
1557     Netzwerke. (Abbildung~\ref{fig:markov-comparators-16})
1558 \end{itemize}
1559
1560 \begin{figure}
1561   \begin{center}
1562   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-12-pct.pdf}
1563   \end{center}
1564   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 12~Leitungen),
1565   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1566   \emph{Gamma-Verteilung} $f(x - 40)$ mit $k = 8,267$ und $\theta = 0,962$.}
1567   \label{fig:markov-comparators-12}
1568 \end{figure}
1569
1570 \begin{figure}
1571   \begin{center}
1572   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-14-pct.pdf}
1573   \end{center}
1574   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 14~Leitungen),
1575   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1576   \emph{Gamma-Verteilung} $f(x - 52)$ mit $k = 9,522$ und $\theta = 0,867$.}
1577   \label{fig:markov-comparators-14}
1578 \end{figure}
1579
1580 \begin{figure}
1581   \begin{center}
1582   \includegraphics[viewport=0 0 360 216,width=15cm]{images/markov-comparators-16-pct.pdf}
1583   \end{center}
1584   \caption{Anzahl der Komparatoren von Sortiernetzwerken (mit 16~Leitungen),
1585   die von {\sc SN-Markov} durchlaufen wurden. Grün eingezeichnet ist die
1586   \emph{Gamma-Verteilung} $f(x - 62)$ mit $k = 17,939$ und $\theta = 1,091$.}
1587   \label{fig:markov-comparators-16}
1588 \end{figure}
1589
1590 \newpage
1591 \section{Empirische Beobachtungen}
1592
1593 \begin{itemize}
1594 \item So schnell konvergiert der Algorithmus.
1595 \item $\ldots$
1596 \end{itemize}
1597
1598 \newpage
1599 \section{Ausblick}
1600
1601 Das würde mir noch einfallen$\ldots$
1602
1603 \newpage
1604 \section{Implementierung}
1605
1606 So habe ich die ganzen Versuche durchgeführt.
1607
1608 \newpage
1609 \bibliography{references}
1610 \bibliographystyle{plain}
1611
1612 %\listoffigures
1613
1614 \end{document}
1615
1616 % vim: set shiftwidth=2 softtabstop=2 tabstop=8 fdm=marker tw=78 :