- Tytuł:
-
Analiza treningu i własności głębokich sieci neuronowych typu GAN (Generative Adversarial Networks)
Analysis of training and properties of deep neural networks of the GAN type (Generative Adversarial Networks) - Autorzy:
- Kadłubowski, Paweł
- Opis:
-
The diploma thesis focused on the analysis of training and properties of deep neural networks ofthe GAN type. The impact of various parameters on the quality of images generated by the DCGANnetwork was investigated. To accomplish this, the CelebA dataset with varying amounts of data,different architectures, and optimizers was utilized. The experiments involved the followingoptimizers: Adam, NAdam, RAdam, AdaMax, AdaGrad, as well as two distinct network architecturesdiffering in the depth of the feature map. During the experiment, a CelebA dataset was prepared, consisting of 202554 color images ofcelebrity faces with a resolution of 178x218 pixels. Three subsets were created from this dataset,containing 13453, 45073 and 202554 images, respectively. The resolution of these images wasreduced to 64x64 pixels for further analysis. For three subsets of different sizes, a neural network training process was conducted, leading to thegeneration of artificially generated images. Upon completion of the network training process, a comparative analysis of the generated imageswas conducted, and graphs depicting the relationship between loss and the number of trainingiterations were generated. Next, a comparison of the quality of generated images was conducted using two different types ofnetworks: WGAN and DCGAN. The CelebA dataset, containing 200000 celebrity face images, wasdivided into three subsets, each containing 10000, 45000, and 200000 color images, all with aresolution of 64x64 pixels. For each of the three subsets of data, a training process was conducted for both WGAN andDCGAN networks to generate images. Finally, a comparison of the quality of the generated imageswas performed. The next experiment aimed to investigate how the length of the input noise vector affects thequality and diversity of generated images using the MNIST dataset, which contains 60000 handwritten digits. The experiment was conducted for various values of the noise vector length (nz), generating atotal of 10,000 images for each of these values. Based on these images, a tensor representing theaverage image was calculated, and the variance was computed. Subsequently, a chart illustrating therelationship between variance and the length of the noise vector was created.
Praca dyplomowa dotyczyła analizy treningu i własności głębokich sieci neuronowych typu GAN.Badano wpływ różnych parametrów na jakość obrazów generowanych przez sieć DCGAN.W tym celu wykorzystano zbiór CelebA o zróżnicowanej liczbie danych, różnych architekturachi optymalizatorach. Eksperymenty obejmowały optymalizatory: Adama, NAdama, RAdama, AdaMax,AdaGrad oraz dwie różne architektury, które różniły się głębokością mapy cech. W trakcie doświadczenia przygotowano zbiór CelebA, składający się z 202554 kolorowychobrazów twarzy celebrytów o rozdzielczości 178x218 pikseli. Na podstawie tego zbioru stworzonotrzy podzbiory zawierające odpowiednio: 13453, 45073 i 202554 obrazów. Rozdzielczość zdjęć wtych podzbiorach została zmniejszona do 64x64 pikseli w celu dalszej analizy.Dla trzech podzbiorów o różnych rozmiarach, przeprowadzono proces uczenia sieci neuronowej,który doprowadził do uzyskania sztucznie wygenerowanych obrazków. Po zakończonym procesie uczenia sieci przeprowadzono analizę porównawczą generowanychobrazów oraz wygenerowano wykresy, przedstawiające zależność straty (Loss) od liczby iteracjitreningowych.Następnie przeprowadzono porównanie jakości generowanych obrazów przy użyciu dwóchróżnych typów sieci: WGAN oraz DCGAN. Zbiór CelebA zawierający 200000 zdjęć twarzycelebrytów, został podzielony na trzy podzbiory zawierające odpowiednio: 10000, 45000 i 200000kolorowych obrazków, wszystkie o rozdzielczości 64x64 piksele.Dla każdego z trzech podzbiorów danych przeprowadzono proces uczenia zarówno dla sieciWGAN, jak i DCGAN, w celu generacji obrazów. Na zakończenie przeprowadzono porównaniejakości generowanych obrazków.Kolejnym eksperymentem było zbadanie, jak długość wektora szumu wejściowego wpływa najakość i różnorodność generowanych obrazów przy użyciu zbioru danych MNIST, który zawiera60000 ręcznie napisanych cyfr.Doświadczenie przeprowadzono dla różnych wartości długości wektora szumu (nz), generującłącznie 10000 obrazków dla każdej z tych wartości. Na podstawie tych obrazów obliczono tensorreprezentujący średni obrazek oraz obliczono wariancję. Następnie stworzono wykres ilustrującyzależność między wariancją, a długością wektora szumu. - Dostawca treści:
- Repozytorium Uniwersytetu Jagiellońskiego
Inne