Temat: sparse matrices - Prolib Integro

Skocz do pozycji: 1.

Tytuł:: Computational aspects of GPU - accelerated sparse matrix - vector multiplication for solving Markov models
Obliczeniowe aspekty mnożenia macierzy rzadkiej przez wektor dla rozwiązywania modeli Markowa przyspieszanego przez karty GPU
Autorzy:: Bylina, B.
Bylina, J.
Karwacki, M.
Tematy:: Markovian models
wireless network models
GPU
matrix-vector multiplication
sparse matrices; Pokaż więcej
Wydawca:: Polska Akademia Nauk. Czytelnia Czasopism PAN
Powiązania:: https://bibliotekanauki.pl/articles/375696.pdf Link otwiera się w nowym oknie
Opis:: In this article we investigate some computational aspects of GPU-accelerated matrix-vector multiplication where matrix is sparse. Particularly, we deal with sparse matrices appearing in modelling with Markovian queuing models. The model we use for research is a Markovian queuing model of a wireless device. This model describes the device’s behavior during possible channel occupation by other devices. We study the efficiency of multiplication of a sparse matrix by a dense vector with the use of an appropriate, ready-to-use GPU-accelerated mathematical library, namely CUSP. For the CUSP library we discuss data structures and their impact on the CUDA platform for the fine-grained parallel architecture of the GPU. Our aim is to find the best format for storing a sparse matrix for GPU-computation (especially one associated with the Markovian model of a wireless device). We compare the time, the performance and the speed-up for the card NVIDIA Tesla C2050 (with ECC ON). For unstructured matrices (as our Markovian matrices), we observe speed-ups (in respect to CPU-only computations) of over 8 times.
Łańcuchy Markowa są przydatnym narzędziem do modelowania systemów złożonych, takich jak systemy i sieci komputerowe. W ostatnich latach łańcuchy Markowa zostały z powodzeniem wykorzystane do oceny pracy sieci bezprzewodowych. Jednym z problemów jaki się pojawia przy wykorzystywaniu łańcuchów Markowa w modelowaniu sieci są problemy natury obliczeniowej. W artykule zajmiemy się badaniem mnożenia macierzy rzadkiej przez wektor, które jest jedną z głównych operacji podczas numerycznego rozwiązywania modeli Markowowskich. Aby, przyspieszyć czas obliczeń mnożenia macierz rzadkiej przez wektor wykorzystano funkcje z biblioteki CUSP. Biblioteka jest zbiorem funkcji wykonywanych na GPU (ang.Graphics Processing Unit) celem skrócenia czasu obliczeń. Do testowania operacji mnożenia macierzy rzadkiej przez wektor badano macierze z Markowowskiego modelu pracy sieci bezprzewodowej. Model ten opisuje zachowanie urządzenia, gdy kanał transmisyjnych może być zajęty przez inne urządzenia. Macierz przejść wspomnianego modelu jest macierzą rzadką i potrzeba specialnej struktury danych do jej przechowywania, dlatego w artykule dyskutowane są różne struktury danych dla macierzy rzadkich i ich przydatność do obliczen na kartach graficznych. W pracy porównano czas, wydajność i przyspieszenie jakie otrzymano podczas testowania biblioteki CUSP na karcie NVIDIA Tesla C2050 dla niestrukturalnych macierzy rzadkich opisujących model zajętości węzła w sieciach bezprzewodowych przy różnych formatach przechowywania macierzy rzadkich. Dla testowanych macierzy zauważono ośmiokrotne przyspieszenie obliczeń przy wykorzystaniu karty graficznej.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 2.

Tytuł:: A parallel block Lanczos algorithm and its implementation for the evaluation of some eigenvalues of large sparse symmetric matrices on multicomputers
Autorzy:: Guarracino, M. R.
Perla, F.
Zanetti, P.
Tematy:: cluster architecture
symmetric block Lanczos algorithm
sparse matrices
parallel eigensolver
algorytm Lanczosa
macierze rzadkie
architektura klastrowa; Pokaż więcej
Wydawca:: Uniwersytet Zielonogórski. Oficyna Wydawnicza
Powiązania:: https://bibliotekanauki.pl/articles/908413.pdf Link otwiera się w nowym oknie
Opis:: In the present work we describe HPEC (High Performance Eigenvalues Computation), a parallel software package for the evaluation of some eigenvalues of a large sparse symmetric matrix. It implements an efficient and portable Block Lanczos algorithm for distributed memory multicomputers. HPEC is based on basic linear algebra operations for sparse and dense matrices, some of which have been derived by ScaLAPACK library modules. Numerical experiments have been carried out to evaluate HPEC performance on a cluster of workstations with test matrices from Matrix Market and Higham’s collections. A comparison with a PARPACKroutine is also detailed. Finally, parallel performance is evaluated on random matrices, using standard parameters.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 3.

Tytuł:: Parallel Algorithms for Forward and Back Substitution in Linear Algebraic Equations of Finite Element Method
Autorzy:: Fialko, Sergiy
Tematy:: finite element method
multithreaded parallelization
sparse symmetric matrices
triangular solution; Pokaż więcej
Wydawca:: Instytut Łączności - Państwowy Instytut Badawczy
Powiązania:: https://bibliotekanauki.pl/articles/308616.pdf Link otwiera się w nowym oknie
Opis:: This paper considers several algorithms for parallelizing the procedure of forward and back substitution for high-order symmetric sparse matrices on multi-core computers with shared memory. It compares the proposed approaches for various ﬁnite-element problems of structural mechanics which generate sparse matrices of diﬀerent structures.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 4.

Tytuł:: Electronic structures of CdSe quantum dots embedded in ZnSe
Autorzy:: Jayawardhana, M. R. P. I.
Wijewardena Gamalath, K. A. I. L.
Tematy:: LCAO method
Quantum dot
Sparse matrices
adjacency matrix
folded spectrum method
optical matrix elements
strain effects
valence band offset; Pokaż więcej
Wydawca:: Przedsiębiorstwo Wydawnictw Naukowych Darwin / Scientific Publishing House DARWIN
Powiązania:: https://bibliotekanauki.pl/articles/1178287.pdf Link otwiera się w nowym oknie
Opis:: The electronic structures and optical matrix elements of CdSe semiconductor quantum dots of near cubical, hemispherical and cylindrical shape embedded in ZnSe were calculated. Bulk Hamiltonian matrices were obtained using the empirical tight binding method including spin-orbital coupling and relativistic effects. All quantum dots were simulated in reciprocal space and the number of atoms in each quantum dot was kept nearly equal for the comparison purpose. An adjacency matrix was produced which indicates the adjacencies of unit cells and the bulk Hamiltonian was included for each adjacency point in order to obtain the quantum dot Hamiltonians. The strain effects, valence band offset and spin orbital coupling were included in the calculations. The quantum dot Hamiltonian was solved to obtain the highest and lowest eigenvalues from which the electronic structure was obtained. Then eigenvalues near integers ranging from the lowest eigenvalue to highest eigenvalue was generated for the point.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 5.

Tytuł:: Implementation and performance analysis of parallelized self-consistent field procedure
Implementacja i analiza wydajności zrównoleglonej procedury samouzgodnionego pola
Autorzy:: Kuźniarowicz, Piotr
Opis:: The aim of the thesis is to propose an efficient implementation of the Hartree-Fock (HF) method exploiting the properties of modern computer architectures, with special emphasis on the General Purpose Graphics Processing Units (GPGPU). The program employs prescreening of neglible contributions to the Fock matrix and a mechanism for dynamic switching between single and double precision calculations. An important aspect of the thesis is a detailed analysis of the transformational properties of the tensors present in the HF method. Additionally, a preliminary attempt is made at exploiting the sparsity of matrices appearing in the HF method to reduce the computational cost for large systems. For this purpose, diagonalization of the Fock matrix was replaced with the density-matrix minimization of Sałek et al. [J Chem Phys, 2007 (126) 114110] and a~sparse matrix algebra library tailored to the expected pattern of sparsity was developed.
Celem niniejszej pracy jest opracowanie wydajnej implementacji metody Hartree-Focka (HF) efektywnie wykorzystującej właściwości współczesnych systemów obliczeniowych ze szczególnym uwzględnieniem procesorów graficznych ogólnego zastosowania (General Purpose Graphics Processing Units, GPGPU). W programie zastosowano wstępną eliminację zaniedbywalnych przyczynków do macierzy Focka oraz mechanizm dynamicznego przełączania między pojedynczą a podwójną precyzją obliczeń. Istotnym aspektem pracy jest szczegółowa analiza właściwości transformacyjnych wielkości tensorowych występujących w równaniach metody HF. Ponadto wstępnie opracowano zagadnienie wykorzystania rzadkości macierzy pojawiających się w metodzie HF do poprawy skalowania czasu obliczeń z rozmiarem układu. W tym celu wykorzystano podejście polegające na bezpośredniej minimalizacji energii względem macierzy gęstości [Sałek et al., J Chem Phys, 2007 (126) 114110] i stworzono bibliotekę do operacji na macierzach rzadkich dostosowaną do spodziewanego schematu rzadkości.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 6.

Tytuł:: Biblioteka do badań nad optymalizacją w czasie komilacji
numpp: research library for compile time optimization
Autorzy:: Maszke, Szymon
Opis:: Biblioteka zawierająca moduły odnośnie różniczkowania (skończonej precyzji, algorytmiczne, symboliczne), struktur algebraicznych (macierz, macierz rzadka, wektor) i niektórych popularnych algorytmów takich jak iterowana metoda Newtona-Raphsona. Wszystkie kalkulacje są wykonane w fazie kompilacji.Ponadto ta praca pokazuje podstawowy workflow, który umożliwia łatwą weryfikację testów/badań i łatwość w użytkowaniu.
Research library containing modules regarding differentiation (finite difference, automatic and symbolic), algebraic structures (matrix, vector, sparse matrix) and some popular algorithms like Newton-Raphson iterative method. Everything is performed during compilation phase.Furthermore, this paper provides the basic workflow paving the way towards easily verifiable research and ease of use for end user.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 7.

Tytuł:: Komputerowe usuwanie odbić i przeszkód w fotografii
Computer method of removing reflections and obstacles from photos
Autorzy:: Shubovych, Artem
Opis:: Praca obejmuje analizę, porównanie i autorską implementację dwóchalgorytmów, użytych ze specjalnie przygotowanym filmem w celu uzyskania ob-razu wolnego od możliwych przeszkód i odbić. Implementacja wprowadza ciągoptymalizacji oraz użycie drzewiastej struktury danych, wymyślonej w ramachtej pracy, które zapewniają jej wydajność, z punktu widzenia złożoności czasowej oraz pamięciowej.
The work contains analysis, comparison and author’s implementation of twoalgorithms, used to get the image, free from possible obstructions and reflections from a specially-prepared film. This implementation incorporates a set ofoptimisations and the custom tree-like data structure, invented for the presentwork, which enhance implementations’ performance in both time and memoryaxes.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 8.

Tytuł:: Inverting large matrices
Odwracanie dużych macierzy
Autorzy:: Vialko, Iryna
Opis:: Niniejsza praca dotyczy odwracania dużych macierzy. Celem pracy jest sformułowanie wydajnego algorytmu odwracania, odpowiedniego przede wszystkim dla gęstych macierzy mających duży rzadki blok. Problem jest rozważony na przykładzie metody na obliczanie przekątnej macierzy odwrotnej.Pierwszym krokiem w dążeniu do sformułowania wydajnego algorytmu odwracania jest wprowadzenie pojęcia wybranego odwracania macierzy oraz formuły Takahashiego do obliczania wybranych wyrazów macierzy odwrotnej, przydatnych szczególnie dla rzadkich bloków w macierzach gęstych. Dalej, w celu osiągnięcia najlepszej wydajności dla gęstej części macierzy, zastosowano rozkład blokowy oparty na uzupełnieniu Schura. Na koniec połączono blokowy algorytm odwracania z formułą Takahashiego w algorytmie wyznaczania przekątnej macierzy odwrotnej.Praca również zawiera implementację sekwencyjnej metody Takahashiego na obliczanie przekątnej macierzy odwrotnej oraz wstęp do opisu równoległej metody Takahashiego.
This thesis concerns the inverting large matrices. The aim of the thesis is the formulation of a high-performance inversion algorightm suitable for any dense matrix presenting a large, sparse block. The problem is considered on the example of the method for computing the diagonal of the inverse matrix.The first step in formulating an efficient inversion algorithm is introducing the concept of the selected inversion and the Takahashi's formula for computing the selected inverse, which are especially useful for sparse blocks in dense matrices. Further, a block decomposition based on the Schur complement is used to achieve the best performance for the dense part of the matrix. Finally, the block inversion algorithm and the Takahashi's formula are combined in the algorithm for computing the diagonal of the inverse matrix.The thesis also includes the implementation of the sequential Takahashi's method for computing the diagonal of the inverse matrix and an introduction to the description of the parallel Takahashi's method.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Informacja

Wyszukujesz frazę "sparse matrices" wg kryterium: Temat