X-Git-Url: https://git.octo.it/?a=blobdiff_plain;f=diplomarbeit.tex;h=25d6329db092daf40bb3a9311a9c98991c8b7818;hb=678969a72ce687ffdfcb64e9ec8a2f60ad7266c9;hp=21ff5e0377a580aa181acfed54aca62f5b12f214;hpb=88f8374f92aaee4c291f70e9faa72d42427d82cd;p=diplomarbeit.git

diff --git a/diplomarbeit.tex b/diplomarbeit.tex
index 21ff5e0..25d6329 100644
--- a/diplomarbeit.tex
+++ b/diplomarbeit.tex
@@ -208,7 +208,7 @@ Rekombination}). Unter UmstÃ¤nden wird die neue LÃ¶sung noch zufÃ¤llig
 verÃ¤ndert {\em (Mutation)}, bevor sie in die bestehende LÃ¶sungsmenge
 integriert wird. Die Wahrscheinlichkeiten, beispielsweise bei der {\em
 Selektion}, sind dabei nicht zwangslÃ¤ufig gleichverteilt -- Ã¼blicherweise
-werden bessere LÃ¶sungen bevorzugt. Zur Bewertung die die sogenannte {\em
+werden bessere LÃ¶sungen bevorzugt. Zur Bewertung dient die sogenannte {\em
 GÃ¼tefunktion}.
 
 Nicht alle Probleme eignen sich fÃ¼r diese Strategie: Zum einen muss es mÃ¶glich
@@ -218,6 +218,26 @@ es oft einfach ist {\em irgendeine} LÃ¶sung anzugeben. Zum anderen muss eine
 Methode fÃ¼r die Rekombination existieren. Das insbesondere dann problematisch
 wenn {\em Nebenbedingungen} eingehalten werden mÃ¼ssen.
 
+Beim Aussuchen von zufÃ¤lligen LÃ¶sungen aus der Population, der
+\emph{Selektion}, werden gute LÃ¶sungen bevorzugt. Wie sehr diese LÃ¶sungen
+bevorzugt werden, hat einen starken Einfluss auf das Verhalten des
+Algorithmus. Werden gute LÃ¶sungen stark bevorzugt, konvergiert der Algorithmus
+schnell gegen ein (lokales) Optimum. Dieses \textit{Exploitation} (Englisch
+fÃ¼r âAusnutzungâ) genannte Verhalten sorgt dafÃ¼r, dass sich der Algorithmus
+schnell auf eine LÃ¶sung festlegt und andere, mÃ¶glicherweise bessere lokale
+Optima nicht mehr findet. Werden gute LÃ¶sungen hingegen nur wenig bevorzugt,
+erforscht der Algorithmus den LÃ¶sungsraum in viele Richtungen. Dieses
+\textit{Exploration} (Englisch fÃ¼r âErforschungâ) genannte Verhalten sorgt
+zwar dafÃ¼r, dass der Algorithmus langsamer auf ein Optimum zusteuert, dafÃ¼r
+findet er aber in der Regel bessere LÃ¶sungen.
+
+Die Parameter evolutionÃ¤rer Algorithmen so einzustellen, dass sich ein guter
+Mittelweg zwischen den beiden Extremen einstellt, ist eine Aufgabe, die sich
+nur experimentell lÃ¶sen lÃ¤sst. Die genauen Parameter hÃ¤ngen nicht nur vom
+eigentlichen Algorithmus, sondern auch vom konkreten Problem ab, so dass sich
+beispielsweise bei der Optimierung von Sortiernetzwerken die Parameter
+zwischen verschiedenen Leitungszahlen stark unterscheiden.
+
 \begin{itemize}
 \item Unter einem "`EvolutionÃ¤ren Algorithmus"' versteht man $\ldots$
 \item Da die Sortiereigenschaft zu Ã¼berprÃ¼fen NP-schwer ist, ist die
@@ -226,6 +246,7 @@ Mutation \textit{(vermutlich)} nicht (effizient) mÃ¶glich.
 
 \newpage
 \section{Bekannte konstruktive Sortiernetzwerke}
+\label{sect:konstruktive_netzwerke}
 
 Ãbersicht Ã¼ber bekannte konstruktive Sortiernetzwerke.
 
@@ -447,8 +468,7 @@ Elementen zu einer sortierten Ausgabefolge mit $N = n+m$~Elementen
 zusammenfÃ¼gen kann. Dabei kommt es mit weniger Vergleichen aus als der
 \emph{bitone Mischer}, der im Abschnitt~\ref{sect:der_bitone_mischer}
 vorgestellt wurde. Allerdings benÃ¶tigt der \emph{Odd-Even-Mischer} unter
-UmstÃ¤nden mehr Schichten als der \emph{bitone Mischer}.\footnote{Knuth,
-âBitonic Sortingâ, Seite~230}
+UmstÃ¤nden mehr Schichten als der \emph{bitone Mischer}.~\cite{KNUTH}
 
 Der \emph{Odd-Even-Mischer} selbst ist ebenfalls rekursiv aufgebaut: Die
 Eingabe fÃ¼r den Mischer mit $N = n + m$ Leitungen besteht aus den beiden
@@ -849,10 +869,12 @@ Ausgabe und kann entfernt werden.
 
 Der Eliminierungsschritt kann iterativ angewandt werden, um aus einem
 Sortiernetzwerk mit $n$~Ein\-gÃ¤ngen Sortiernetzwerke mit $n-1$, $n-2$,
-$n-3$,~\dots EingÃ¤ngen zu erzeugen. Insbesondere kÃ¶nnen wir auf diese Art und
-Weise einen Sortiernetzwerk mit $2n$~EingÃ¤ngen wieder auf ein Sortiernetzwerk
-mit $n$~EingÃ¤ngen reduzieren. Das Anwenden mehrerer Minimum- und
-Maximum-Schnitte bezeichnen wir als \emph{Schnittmuster}.
+$n-3$,~\dots EingÃ¤ngen zu erzeugen. Insbesondere kÃ¶nnen auf diese Art und
+Weise einen Sortiernetzwerke mit $2n$~EingÃ¤ngen wieder auf Sortiernetzwerke
+mit $n$~EingÃ¤ngen reduziert werden. $k$~Minimum- und Maximum-Schnitte, die
+nacheinander angewendet ein $n$-Sortiernetzwerk auf ein
+${(n-k)}$-Sortiernetz\-werk reduzieren, bezeichnen wir als
+\emph{$k$-Schnittmuster}.
 
 Zwei Schnittmuster heiÃen \emph{Ã¤quivalent} bezÃ¼glich~$S$, wenn ihre Anwendung
 auf das Sortiernetzwerk~$S$ das selbe Ergebnis liefert. Ansonsten heiÃen die
@@ -861,10 +883,10 @@ Schnittmuster \emph{unterschiedlich} bezÃ¼glich~$S$.
 Bei einem Sortiernetzwerk mit $n$~EingÃ¤ngen gibt es $2n$~MÃ¶glichkeiten eine
 Leitung zu entfernen: Auf jeder der $n$~Leitungen kann sowohl das Minimum als
 auch das Maximum angenommen werden. Wendet man das Verfahren iterativ an, um
-ein $n$-Sortiernetzwerk auf ein $m$-Sortiernetzwerk zu reduzieren, ergeben
-sich insgesamt
+ein $n$-Sortiernetzwerk auf ein ${(n-k)}$-Sortiernetzwerk zu reduzieren,
+ergeben sich insgesamt
 \begin{equation}\label{eqn:anzahl_schnittmuster}
-  \prod_{i=n}^{m+1} 2i = 2^{n-m} \frac{n!}{m!}
+  \prod_{i=n}^{1+n-k} 2i = 2^k \frac{n!}{(n-k)!}
   \quad (n > m)
 \end{equation}
 \emph{mÃ¶gliche} Schnittmuster. Diese Schnittmuster sind nicht alle
@@ -872,19 +894,19 @@ unterschiedlich. Legt man beispielsweise das Minimum auf die unterste Leitung
 und das Maximum auf die oberste Leitung eines Standard-Sortiernetzwerks,
 fÃ¼hren beide Reihenfolgen zum selben Ergebnis.
 
-\textit{Moritz MÃ¼hlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass
-es mÃ¶glich ist, mehrere EingÃ¤nge gleichzeitig mit Minimum beziehungsweise
-Maximum vorzubelegen. Dadurch wird die Anzahl der mÃ¶glichen Schnittmuster
-reduziert, die Menge der so erzeugbaren Sortiernetzwerke bleibt aber
-unverÃ¤ndert. Die Anzahl der mÃ¶glichen Schnittmuster setzt sich zusammen aus
-der Anzahl von MÃ¶glichkeiten, $n-m$~Leitungen aus $n$ Leitungen auszuwÃ¤hlen,
-und die mÃ¶glichen Minimum-~/ Maximum-Muster. Damit ergibt sich folgende
-Formel fÃ¼r die Anzahl der Schnittmuster:
+\textit{Moritz MÃ¼hlenthaler} zeigt in seiner Arbeit (\todo{Referenz}), dass es
+mÃ¶glich ist, mehrere EingÃ¤nge gleichzeitig mit Minimum beziehungsweise Maximum
+vorzubelegen. Dadurch wird die Anzahl der mÃ¶glichen Schnittmuster reduziert,
+die Menge der so erzeugbaren Sortiernetzwerke bleibt aber unverÃ¤ndert. Die
+Anzahl der mÃ¶glichen Schnittmuster setzt sich zusammen aus der Anzahl von
+MÃ¶glichkeiten, $k$~Leitungen aus $n$~Leitungen auszuwÃ¤hlen, und die mÃ¶glichen
+Minimum-~/ Maximum-Muster. Damit ergibt sich folgende Formel fÃ¼r die Anzahl
+der mÃ¶glichen Schnittmuster:
 \begin{displaymath}
-  2^{n-m} \cdot \left( \begin{array}{c} n \\ n-m \end{array} \right)
-  = 2^{n-m} \cdot \frac{n!}{(n-m)! m!}
-  = 2^{n-m} \cdot \frac{n!}{m!} \cdot \frac{1}{(n-m)!}
-  \quad (n > m)
+  2^k \cdot \left( \begin{array}{c} n \\ k \end{array} \right)
+  = 2^{k} \cdot \frac{n!}{k! (n-k)!}
+  = 2^{k} \cdot \frac{n!}{(n-k)!} \cdot \frac{1}{k!}
+  \quad (1 \leqq k < n)
 \end{displaymath}
 
 Die Anzahl der mÃ¶glichen Schnittmuster wird mit der Anzahl der zu entfernenden
@@ -928,7 +950,7 @@ Um die Anzahl der \emph{unterschiedlichen} Schnittmuster abschÃ¤tzen zu kÃ¶nnen,
 wurden je eine Million zufÃ¤llige 8-Schnittmuster auf die 16-Sortiernetzwerke
 $\operatorname{OES}(16)$, $\operatorname{BS}(16)$ und $\operatorname{PS}(16)$
 angewandt. Abbildung~\ref{fig:count-cuts-16} trÃ¤gt die Anzahl der
-\emph{unterschiedlichen} Sortiernetzwerke gegen die Anzahl der zufÃ¤lligen
+\emph{unterschiedlichen} Schnittmuster gegen die Anzahl der zufÃ¤lligen
 Schnittmuster auf. Klar zu sehen ist, dass sich die Anzahl der erzeugten
 Sortiernetzwerke nach $500.000$~Iterationen nur noch gering verÃ¤ndert und der
 Wert nach $1.000.000$~Iterationen allem Anschein nach dem Endwert schon sehr
@@ -940,9 +962,9 @@ fÃ¼hren aber nur zu wenigen \emph{unterschiedlichen} Sortiernetzwerken: 3519
 ($\approx 0,1\%$) im Fall des \emph{Odd-Even-Mergesort-Netzwerks}, 4973
 ($\approx 0,15\%$) beim \emph{bitonen Mergesort-Netzwerk} und 18764 ($\approx
 0,57\%$) beim \emph{Pairwise-Sorting-Netzwerk}. Zwar ist es mÃ¶glich, dass mehr
-Iterationen die Anzahl der unterschiedlichen Netzwerke noch wachsen lÃ¤sst. Die
-Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
-Annahme, dass Anzahl dieser zusÃ¤tzlichen, unterschiedlichen Schnittmuster
+Iterationen die Anzahl der unterschiedlichen Schnittmuster noch wachsen lÃ¤sst.
+Die Graphen in Abbildung~\ref{fig:count-cuts-16} geben jedoch Grund zu der
+Annahme, dass die Anzahl dieser zusÃ¤tzlichen, unterschiedlichen Schnittmuster
 vernachlÃ¤ssigbar klein ist.
 
 Bedingt durch die sehr groÃe Anzahl mÃ¶glicher Schnittmuster ist dieses
@@ -951,7 +973,7 @@ die Anzahl der unterschiedlichen Schnittmuster trotzdem abschÃ¤tzen zu kÃ¶nnen,
 kann man sich einer stochastischen Methode bedienen, der sogenannten
 \emph{Monte-Carlo-Methode}. ZunÃ¤chst generiert man eine Menge~$S$ von
 $k$~unterschiedlichen Schnittmustern. AnschlieÃend werden $n$~Schnittmuster
-zufÃ¤llig erzeugt, und Ã¼berprÃ¼ft, ob sie sich in der Menge~$S$ enthalten sind.
+zufÃ¤llig erzeugt und Ã¼berprÃ¼ft, ob sie sich in der Menge~$S$ enthalten sind.
 Unter der Annahme, dass das VerhÃ¤ltnis der zufÃ¤lligen Schnittmuster, die in $S$
 enthalten sind, und $n$ dem VerhÃ¤ltnis von $k$ und der Anzahl der
 unterschiedlichen Schnittmuster ingesamt entspricht, kann man die Anzahl der
@@ -970,10 +992,10 @@ unterschiedlichen Schnittmuster abschÃ¤tzen.
 In Abbildung~\ref{fig:collisions-10000-1000000-32} ist das Ergebnis des
 Monte-Carlo-Algorithmus fÃ¼r 16-Schnittmuster zu sehen, die auf
 $\operatorname{OES}(32)$ und $\operatorname{BS}(32)$ angewandt wurden: Von
-jedem Sortiernetzwerk wurden zunÃ¤chst eine Menge von 10.000
+jedem Sortiernetzwerk wurden zunÃ¤chst eine Menge~$S$ von 10.000
 \emph{unterschiedlichen} Schnittmustern erzeugt. AnschlieÃend wurden 1.000.000
 zufÃ¤llige Schnittmuster erzeugt und der Anteil der zufÃ¤lligen Schnittmuster,
-die identisch zu einem in der Menge enthalten Schnittmuster sind, berechnet.
+die \emph{Ã¤quivalent} zu einem in~$S$ enthalten Schnittmuster sind, berechnet.
 FÃ¼r $\operatorname{OES}(32)$ war dieser Anteil etwa $0,19 \%$, fÃ¼r
 $\operatorname{BS}(32)$ etwa $0,29 \%$. Das ergibt eine AbschÃ¤tzung von $5,2
 \cdot 10^6$ unterschiedlichen Schnittmustern fÃ¼r $\operatorname{OES}(32)$ und
@@ -1003,11 +1025,11 @@ man keine Details mehr erkennen kÃ¶nnen. Aufgrund der hohen Anzahl
 unterschiedlicher Schnittmuster, wurde fÃ¼r das gleiche Experiment mit
 $\operatorname{PS}(32)$ eine initiale Menge von 100.000 unterschiedilchen
 Schnittmustern erzeugt. Trotzdem wurden nach 1.000.000 Iterationen nur 385
-Schnittmuster gefunden, die ein Sortiernetzwerk aus dieser Menge erzeugen.
-Daraus ergibt sich eine AbschÃ¤tzung von $2,6 \cdot 10^8$ unterschiedlichen
-Schnittmustern -- zwei Zehnerpotenzen mehr als bei den vorherigen
-Sortiernetzwerken, aber immernoch fÃ¼nf Zehnerpotenzen kleiner als die Anzahl
-der \emph{mÃ¶glichen} Schnittmuster.
+Schnittmuster gefunden, die zu einem Schnittmuster in der Menge Ã¤quivalent
+sind. Daraus ergibt sich eine AbschÃ¤tzung von $2,6 \cdot 10^8$
+unterschiedlichen Schnittmustern -- zwei Zehnerpotenzen mehr als bei den
+vorherigen Sortiernetzwerken, aber immernoch fÃ¼nf Zehnerpotenzen kleiner als
+die Anzahl der \emph{mÃ¶glichen} Schnittmuster.
 
 \newpage
 \section{Der \textsc{SN-Evolution}-Algorithmus}
@@ -1365,14 +1387,14 @@ $S_0$ mit sich selbst und anschlieÃendem Eliminieren der HÃ¤lfte der Leitungen
 hervorgehen kÃ¶nnen, heiÃen \emph{Nachfolger} von $S_0$.
 
 Beim beschriebenen Vorgehen kann man die Sortiernetzwerke als Knoten in einem
-gerichteten Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
+(gerichteten) Graphen betrachten. Zwei Knoten $V_0$ und $V_1$, die zwei
 Sortiernetzwerke $S_0$ und $S_1$ reprÃ¤sentieren, sind genau dann mit einer
-Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von $S_0$
-ist, das heiÃt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
+Kante ${E_{0,1} = (V_0, V_1)}$ verbunden, wenn $S_1$ ein \emph{Nachfolger} von
+$S_0$ ist, das heiÃt dass man $S_1$ durch die Rekombination von $S_0$ mit sich
 selbst erzeugen kann.
 
 Wie in Abschnitt~\ref{sect:anzahl_schnittmuster} beschrieben ist die Anzahl
-(unterschiedlichen) Schnittmuster und damit die Anzahl der Nachfolger sehr
+(unterschiedlicher) Schnittmuster und damit die Anzahl der Nachfolger sehr
 groÃ. Wenn $S_0$ ein Sortiernetzwerk mit $n$~Leitungen ist, so hat $S_0$ bis
 zu
 \begin{displaymath}
@@ -1380,11 +1402,11 @@ zu
 \end{displaymath}
 Nachfolger.
 
-Der Algorithmus {\sc SN-Markov} legt auf diesem Graph einen zufÃ¤lligen Weg
-(englisch: \textit{random walk}) zurÃ¼ck. Er startet auf einem gegebenen
-Sortiernetzwerk. Um von einem Sortiernetzwerk zum NÃ¤chsten zu gelangen
-rekombiniert er das aktuelle Sortiernetzwerk mit sich selbst und erhÃ¤lt so
-einen zufÃ¤lligen Nachfolger.
+Der Algorithmus {\sc SN-Markov} legt auf diesem Nachfolger-Graph einen
+zufÃ¤lligen Weg (englisch: \textit{random walk}) zurÃ¼ck. Er startet auf einem
+gegebenen Sortiernetzwerk. Um von einem Sortiernetzwerk zum NÃ¤chsten zu
+gelangen, rekombiniert der Algorithmus das aktuelle Sortiernetzwerk mit sich
+selbst und erhÃ¤lt so einen zufÃ¤lligen Nachfolger.
 
 \begin{itemize}
   \item $n \leftarrow \mathrm{Input}$
@@ -1445,6 +1467,11 @@ einen zufÃ¤lligen Nachfolger.
 Das wÃ¼rde mir noch einfallen$\ldots$
 
 \newpage
+\section{Implementierung}
+
+So habe ich die ganzen Versuche durchgefÃ¼hrt.
+
+\newpage
 \bibliography{references}
 \bibliographystyle{plain}