Temat: grupowanie danych - Prolib Integro

Skocz do pozycji: 1.

Tytuł:: Linguistically defined clustering of data
Autorzy:: Leski, J. M.
Kotas, M. P.
Tematy:: data clustering
possibility theory
linguistic rules
data analysis
grupowanie danych
teoria możliwości
analiza danych; Pokaż więcej
Wydawca:: Uniwersytet Zielonogórski. Oficyna Wydawnicza
Powiązania:: https://bibliotekanauki.pl/articles/329995.pdf Link otwiera się w nowym oknie
Opis:: This paper introduces a method of data clustering that is based on linguistically specified rules, similar to those applied by a human visually fulfilling a task. The method endeavors to follow these remarkable capabilities of intelligent beings. Even for most complicated data patterns a human is capable of accomplishing the clustering process using relatively simple rules. His/her way of clustering is a sequential search for new structures in the data and new prototypes with the use of the following linguistic rule: search for prototypes in regions of extremely high data densities and immensely far from the previously found ones. Then, after this search has been completed, the respective data have to be assigned to any of the clusters whose nuclei (prototypes) have been found. A human again uses a simple linguistic rule: data from regions with similar densities, which are located exceedingly close to each other, should belong to the same cluster. The goal of this work is to prove experimentally that such simple linguistic rules can result in a clustering method that is competitive with the most effective methods known from the literature on the subject. A linguistic formulation of a validity index for determination of the number of clusters is also presented. Finally, an extensive experimental analysis of benchmark datasets is performed to demonstrate the validity of the clustering approach introduced. Its competitiveness with the state-of-the-art solutions is also shown.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 2.

Tytuł:: Wyznaczanie wartości granicznych z wykorzystaniem metod grupowania danych
The determination of limit values using methods of data clustering
Autorzy:: Targosz, M.
Timofiejczuk, A.
Tematy:: wartości graniczne
grupowanie danych
modelowanie uszkodzeń
limits values
data clustering
failure modeling; Pokaż więcej
Wydawca:: Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Powiązania:: https://bibliotekanauki.pl/articles/257429.pdf Link otwiera się w nowym oknie
Opis:: W artykule zaproponowano podejście do wyznaczenia wartości granicznych za pomocą algorytmów rozmytego grupowania danych. Wykorzystano algorytmy FCM, PCM oraz algorytm Gustafsona-Kessela. Eksperyment przeprowadzano na danych symulacyjnych. W tym celu zbudowano model numeryczny maszyny wirnikowej, symulującej określone stany i wielkości niewyważenia. Wyznaczone wartości graniczne porównano z wartościami otrzymanymi przy pomocy metody statystycznej. Wszystkie obliczenia wykonywano w środowisku Matlab-Simulink.
The paper describes a methodology for estimating the limit values of char-icteristics of diagnostic signals using methods of fuzzy data clustering (FCM, PCM and Gustafson-Kessel algorithms). The experiment was conducted on simulated data, using a numerical model of a rotor machine, simulating given inbalanced states. Limits were compared with value estimating using the statistical method.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 3.

Tytuł:: A quaternion clustering framework
Autorzy:: Piórek, Michał
Jabłoński, Bartosz
Tematy:: data clustering
quaternions data processing
human gait
data processing
grupowanie danych
chód człowieka
przetwarzanie danych; Pokaż więcej
Wydawca:: Uniwersytet Zielonogórski. Oficyna Wydawnicza
Powiązania:: https://bibliotekanauki.pl/articles/330038.pdf Link otwiera się w nowym oknie
Opis:: Data clustering is one of the most popular methods of data mining and cluster analysis. The goal of clustering algorithms is to partition a data set into a specific number of clusters for compressing or summarizing original values. There are a variety of clustering algorithms available in the related literature. However, the research on the clustering of data parametrized by unit quaternions, which are commonly used to represent 3D rotations, is limited. In this paper we present a quaternion clustering methodology including an algorithm proposal for quaternion based k-means along with quaternion clustering quality measures provided by an enhancement of known indices and an automated procedure of optimal cluster number selection. The validity of the proposed framework has been tested in experiments performed on generated and real data, including human gait sequences recorded using a motion capture technique.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 4.

Tytuł:: Unsupervised clustering for fetal state assessment based on selected features of the cardiotocographic signals
Autorzy:: Przybyła, T.
Jeżewski, J.
Roj, D.
Tematy:: klasyfikacja algorytmów bez nadzoru
grupowanie danych
monitoring płodu
kardiotokografia
unsupervised classification
fuzzy clustering
principal component analysis
fetal monitoring; Pokaż więcej
Wydawca:: Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Powiązania:: https://bibliotekanauki.pl/articles/333112.pdf Link otwiera się w nowym oknie
Opis:: In modern obstetrics the cardiotocography is a routine method of fetal condition assessment based mainly on analysis of the fetal heart rate signals. The correct interpretation of recorded traces from a bedside monitor is very difficult even for experienced clinicians. Therefore, computerized fetal monitoring systems are used to yield the quantitative description of the signal. However, the effective techniques enabling automated conclusion generation based on cardiotocograms are still being searched. The paper presents an attempt to diagnose the fetal state basing on seventeen features describing the cardiotocographic records. The proposed method applies the unsupervised classification of signals. During our research we tried to classify the fetal state using the fuzzy c-means (FCM) clustering. We also tested how the efficiency of classification could be influenced by application of principal component analysis (PCA) algorithm. The obtained results showed that unsupervised classification cannot be considered as a support to fetal state assessment.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 5.

Tytuł:: Wybrane aspekty aktywności zawodowej kobiet w państwach UE. Analiza dla lat 2006–2014
Participation of women in the labormarket in the years 2006–2014. EU ststes clustering
Autorzy:: Matuszewska-Janica, Aleksandra
Tematy:: rynek pracy
aktywność zawodowa kobiet
grupowanie danych
metoda k-średnich
labour market
female employment activity
data clustering
k-mean method; Pokaż więcej
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Powiązania:: https://bibliotekanauki.pl/articles/658551.pdf Link otwiera się w nowym oknie
Opis:: The main aim of the analysis was European Union's states clustering in point of view of female activity on the labour market. The data was obtained from the Eurosat's Labour Force Surveys from years 2006–2014. K-means algorithms was the main analysis method. Obtained results indicate to a wide variety of different forms of women's labour market participation among European Union countries. We can mention three phenomena that have been most highlighted. (1) We found a high percentage of women working in part-time work, especially in the Netherlands. (2) The results show a high proportion of full-time employed women, especially in the EU countries from the former Eastern Bloc. (3) We noted a significant proportion of selfemployed among the employed women in the countries of Southern Europe (Greece, Italy, Portugal, Spain) and in Poland. So, in terms of female economic activity, Poland has a similar pattern as the Southern European countries (also in terms of self-employment).
Jednym z założeń strategii Europa 2020 jest podwyższenie odsetka osób zatrudnionych w wieku 20–64 lata na terenie Unii Europejskiej (UE) do 75%. Realizacja tej strategii ma nastąpić między innymi poprzez zwiększenie aktywności zawodowej kobiet i osób starszych. Powiększenie zasobów siły roboczej ma swoje ekonomiczne uzasadnienie. Związane jest ono przede wszystkim z procesami demograficznymi, a zwłaszcza z powiększaniem się grupy osób w wieku poprodukcyjnym. W różnych państwach UE sytuacja związana z aktywnością zawodową kobiet kształtuje się odmiennie, dlatego też powstało pytanie o podobieństwa i różnice w zaangażowaniu kobiet na rynku pracy w poszczególnych regionach UE. Celem analizy jest grupowanie państw Unii Europejskiej ze względu na różne formy aktywności zawodowej kobiet. Klasyfikacja ta pozwoli na ocenę wzorców dotyczących aktywności zawodowej kobiet w poszczególnych krajach UE. W analizie wykorzystano metodę k-średnich. Dane pochodzą z zasobów Eurostatu z Badania Aktywności Ekonomicznej Ludności. Analizowany okres to lata 2006–2014.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 6.

Tytuł:: Estimation of parameters of Gaussian mixture models by a hybrid method combining a self-adaptive differential evolution with the EM algorithm
Estymacja parametrów modeli mieszanin rozkładów normalnych przy pomocy metody hybrydowej łączącej samoadaptacyjną ewolucję różnicową z algorytmem EM
Autorzy:: Kwedlo, W.
Tematy:: mieszaniny rozkładów normalnych
ewolucja różnicowa
algorytm EM
grupowanie danych
Gaussian mixture models
differential evolution
expectation maximization
model-based clustering; Pokaż więcej
Wydawca:: Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Powiązania:: https://bibliotekanauki.pl/articles/88410.pdf Link otwiera się w nowym oknie
Opis:: In the paper the problem of learning of Gaussian mixture models (GMMs) is considered. A new approach based on hybridization of a self-adaptive version of differential evolution (DE) with the classical EM algorithm is described. In this approach, called DEEM, the EM algorithm is run until convergence to fine-tune each solution obtained by the mutation and crossover operators of DE. To avoid the problem with parameter representation and infeasible solutions we use a method in which the covariance matrices are encoded using their Cholesky factorizations. In a simulation study GMMs were used to cluster synthetic datasets differing by a degree of separation between clusters. The results of experiments indicate that DE-EM outperforms the standard multiple restart expectation-maximization algorithm (MREM). For datasets with high number of features it also outperforms the state of-the-art random swap EM (RSEM).
W pracy poruszono problem uczenia modeli mieszanin rozkładów normalnych. Zaproponowano nowe podejście, nazwane DE-EM, oparte na hybrydyzacji samoadaptacyjnego algorytmu ewolucji różnicowej i klasycznego algorytmu EM. W nowej metodzie rozwiązanie otrzymane jako wynik operatorów mutacji i krzyżowania jest poddawane optymalizacji lokalnej, prowadzonej aż do momentu uzyskania zbieżności, przez algorytm EM. Aby uniknąć problemu z reprezentacją macierzy kowariancji i niedopuszczalności rozwiązań użyto metody, w której macierze kowariancji są kodowane przy pomocy dekompozycji Cholesky’ego. W badaniach symulacyjnych modele mieszanin rozkładów normalnych zastosowano do grupowania danych syntetycznych. Wyniki eksperymentów wskazują, że metoda DE-EM osiąga lepsze wyniki niż standardowa technika wielokrotnego startu algorytmu ˙ EM. Dla zbiorów danych z dużą liczbą cech, metoda osiąga lepsze wyniki niż technika losowej wymiany rozwiązań połączona z algorytmem EM.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 7.

Tytuł:: Analiza skupień
Cluster Analysis
Autorzy:: Rudnicka, Sandra
Opis:: W pracy zostały przedstawione niezbędne zagadnienia ze statystyki matematycznej pozwalające na zdefiniowanie pojęcia grupowania danych zwanego również analizą skupień czy klasteryzacją wraz z ich podstawowymi własnościami. Co pozwoliło na zaprezentowanie ważnej części pracy, czyli algorytmów podziału zbioru danych na klastry. \\W~dalszej części zostało zaprezentowane grupowanie danych z wykorzystaniem algorytmu k-średnich oraz klasteryzacji hierarchicznej metodą aglomeracyjną. Podczas tego procesu została również przedstawiona wizualizacja danych z wykorzystaniem języka Python oraz modułów takich jak matplotlib, seaborn i plotly. Do modelowania i przetwarzania danych użyto pandas, scikit-learn oraz numpy.
This work presents the necessary issues from mathematical statistics, which allow to define the concept of cluster analysis. The third chapter has an important part of the work, i.e. algorithms for finding set of clusters for the sample.The following part presents data clustering using the k-means algorithm and hierarchical clustering with the agglomerative method. It also contains data visualization as well as modeling with using Python and it's modules i.e. seaborn, matplotlib, plotly, numpy, seaborn and pandas.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 8.

Tytuł:: Topological data analysis in financial applications
Topologiczna analiza danych w zastosowaniach finansowych.
Autorzy:: Belozerov, Konstantin
Opis:: Praca jest poświęcona topologicznej analizie danych (TDA) i jej zastosowaniom w Finansach. W prace są opisane teoretyczne podstawy TDA oraz są rozpatrzone dwa przykłady zastosowania TDA w finansach: algorytm Mapper grupowania danych oraz zastosowanie wyliczenia odległości bottleneck między diagramami persystencji dla prognozowaniakryzysów finansowych.
The present thesis is dedicated to Topological Data Analysis (TDA) and its applications in Finance. It describes the theoretical foundations of TDA and considers two examples of TDA applications in finance: the Mapper data clustering algorithm and the use of calculating the bottleneck distance between persistence diagrams for forecasting financial crises.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 9.

Tytuł:: User behaviour analysis of tourism e-commerce support platform by means of Topological Data Analysis
Analiza zachowań użytkowników platformy wspomagającej e-commerce w przemyśle turystycznym przy użyciu Topologicznej Analizy Danych
Autorzy:: Kawa, Jakub
Opis:: The following thesis presents analysis of Format Finder webpage users behavior by means of Topological Data Analysis and machine learning. Conducted experiments were based on approximately 7 thousand users’ visits, that were examined in order to find correlation between user’s activity and his/her expertise in both Sabre systems and tourism overall. To this end, a web application was built along with tools allowing the process of data analysis to be fully automated. Project is based on elastic architecture and design patterns which makes it easy for both extension and deployment. This thesis was created in cooperation with Sabre company.
W niniejszej pracy została przedstawiona analiza zachowania użytkowników aplikacji internetowej Format Finder firmy Sabre przy użyciu Topologicznej Analizy Danych oraz nauczania maszynowego. Przeanalizowanych zostało około 7 tysięcy wizyt, które badano pod kątem korelacji aktywności użytkownika w serwisie a jego ekspertyzą w systemach Sabre i branży turystycznej. W tym celu została przygotowana aplikacja internetowa wraz z szeregiem narzędzi pozwalająca w sposób zautomatyzowany na przeprowadzenie analizy i porównanie wyników. Projekt został zbudowany na bazie elastycznej architektury oraz przy użyciu wzorców projektowych przez co jest łatwy do rozszerzenia i wdrożenia. Praca powstała przy udziale firmy Sabre.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 10.

Tytuł:: Metody analizy spójności i zgodności kolekcji dokumentów WWW
Autorzy:: Kopel, Marek
Opis:: Marek Kopel
Dostawca treści:: Repozytorium Centrum Otwartej Nauki

Książka

na półce

Informacja

Wyszukujesz frazę "grupowanie danych" wg kryterium: Temat