Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Piasecki, Maciej" wg kryterium: Autor


Tytuł:
Dynamic verbs in the Wordnet of Polish
Autorzy:
Dziob, Agnieszka
Piasecki, Maciej
Tematy:
plWordNet
Wordnet of Polish
lexico-semantic relations
Polish language
dynamic verbs
verbs in wordnet
natural language processing
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677246.pdf  Link otwiera się w nowym oknie
Opis:
Dynamic verbs in the Wordnet of PolishThe paper presents patterns of co-occurrences of wordnet relations involving verb lexical units in plWordNet - a large wordnet of Polish. The discovered patterns reveal tendencies of selected synset and lexical relations to form regular circular structures of clear semantic meanings. They involve several types of relations, e.g., presupposition, cause, processuality and antonymy, do not have a necessary character (there are exceptions), but can be used in wordnet diagnostics and guidelines for wordnet editors. The analysis is illustrated with numerous positive and negative examples, as well as statistics for verb relations in plWordNet 4.0 emo. Some attempts to a more general, linguistic explanation of the observed phenomena are also made. As a background, plWordNet model of linguistic character is briefly recollected. A special attention is given to the verb part. In addition the description of dynamic verbs by relations and features is discussed in details including relation definitions and substitution tests. Czasowniki dynamiczne w Słowosieci - wordnecie języka polskiego W artykule zostały przedstawione wzorce współwystępowania relacji leksykalno-semantycznych obejmujących czasownikowe jednostki leksykalne w ramach Słowosieci - wielkiego relacyjnego słownika języka polskiego, wordnetu języka polskiego. Tłem obserwacji jest Słowosieć 4.0 emo, dla której omówiono skrótowo system relacji czasownikowych wraz ze statystykami. Szczególną uwagę autorzy poświęcili czasownikom dynamicznym i ich typowym relacjom, dla których przedstawiono testy substytucji z wytycznych do relacyjnego opisu czasownika, zdefiniowanych na potrzeby edycji Słowosieci przez lingwistów. Opisane w artykule wzorce współwystępowania ukazują tendencje niektórych relacji synsetów (tj. zbiorów synonimów) i jednostek leksykalnych (m.in. presupozycji, kauzacji, procesywności i antonimii) do tworzenia regularnych struktur, specyfikujących znaczenie wszystkich jednostek/synsetów, połączonych za pomocą danych relacji. Współwystępowania relacji wg wzorców nie mają charakteru obligatoryjnego, dlatego też w artykule przedstawiono zarówno pozytywne, jak i negatywne przykłady jednostek i synsetów, połączonych ze sobą za pomocą relacji współwystępujących, jak i pewne uwagi natury ogólnej, wskazujące na językowy charakter obserwowanego zjawiska. Oprócz znaczenia poznawczego, związanego ze współzależnościami, jakie zachodzą w obrębie systemu językowego, opis tych regularności ma również znaczenie praktyczne - może być wykorzystany przy diagnostyce wordnetu oraz w wytycznych dla lingwistów.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lexical Means in Communicating Emotion in Suicide Notes – on the Basis of the Polish Corpus of Suicide Notes
Autorzy:
Zaśko-Zielińska, Monika
Piasecki, Maciej
Tematy:
suicide note
corpus
lexical means for expressing emotions
sentiment analysis
Polish Corpus of Suicide Notes
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677119.pdf  Link otwiera się w nowym oknie
Opis:
Lexical Means in Communicating Emotion in Suicide Notes - on the Basis of the Polish Corpus of Suicide NotesPolish Corpus of Suicide Notes (PCSN) is a relatively large set of authentic suicide notes that are linguistically annotated on several levels. In order to identify features characteristic for this genre we compared PCSN with the collected subcorpus of counterfeited suicide notes. In this paper we focus on the lexical means of expressing emotions. Our goal was to analyse ways of expressing emotions in this specific genre. Our initial list of lexical markers was based on Markowski’s list of the lexis common for different genres. The list was next expanded with the help of the plWordNet 2.0 - a lexico-semantic network. The expansion was based on the manually selected noun and verb hypernymy branches according to their correspondence to the elements of the initial list. For words from the extended list, a quantitative analysis was performed for both authentic and fake suicide notes. We have also analysed the use of the lexical markers of emotions, feelings and emotional states, as well as emotion operators, and ways of expressing personal evaluation, affection and hate.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The System of Register Labels in plWordNet
Autorzy:
Maziarz, Marek
Piasecki, Maciej
Szpakowicz, Stan
Tematy:
wordnets
plWordNet
lexical register
large-scale wordnet expansion
inter-annotator agreement
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677096.pdf  Link otwiera się w nowym oknie
Opis:
The System of Register Labels in plWordNetStylistic registers influence word usage. Both traditional dictionaries and wordnets assign lexical units to registers, and there is a wide range of solutions. A system of register labels can be flat or hierarchical, with few labels or many, homogeneous or decomposed into sets of elementary features. We review the register label systems in lexicography, and then discuss our model, designed for plWordNet, a large wordnet for Polish. There follows a detailed comparative analysis of several register systems in Polish lexical resources. We also present the practical effect of the adoption of our flat, small and homogeneous system: a relatively high consistency of register assignment in plWordNet, as measured by inter-annotator agreement on a manageable sample. Large-scale conclusions for the whole plWordNet remain to be made once the annotation has been completed, but the experience half-way through this labour-intensive exercise is very encouraging.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An open stylometric system based on multilevel text analysis
Autorzy:
Eder, Maciej
Piasecki, Maciej
Walkowiak, Tomasz
Tematy:
stylometry
Polish
CLARIN-PL
research infrastructure
language technology
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677202.pdf  Link otwiera się w nowym oknie
Opis:
An open stylometric system based on multilevel text analysisStylometric techniques are usually applied to a limited number of typical tasks, such as authorship attribution, genre analysis, or gender studies. However, they could be applied to several tasks beyond this canonical set, if only stylometric tools were more accessible to users from different areas of the humanities and social sciences. This paper presents a general idea, followed by a fully functional prototype of an open stylometric system that facilitates its wide use through to two aspects: technical and research flexibility. The system relies on a server installation combined with a web-based user interface. This frees the user from the necessity of installing any additional software. At the same time, the system offers a variety of ways in which the input texts can be analysed: they include not only the usual lexical level, but also deep-level linguistic features. This enables a range of possible applications, from typical stylometric tasks to the semantic analysis of text documents. The internal architecture of the system relies on several well-known software packages: a collection of language tools (for text pre-processing), Stylo (for stylometric analysis) and Cluto (for text clustering). The paper presents: (1) The idea behind the system from the user’s perspective. (2) The architecture of the system, with a focus on data processing. (3) Features for text description. (4) The use of analytical systems such as Stylo and Cluto. The presentation is illustrated with example applications. Otwarty system stylometryczny wykorzystujący wielopoziomową analizę języka Zastosowania metod stylometrycznych na ogół ograniczają się do kilku typowych problemów badawczych, takich jak atrybucja autorska, styl gatunków literackich czy studia nad zróżnicowaniem stylistycznym kobiet i mężczyzn. Z pewnością dałoby się je z powodzeniem zastosować również do wielu innych problemów klasyfikacji tekstów, gdyby tylko owe metody oraz odpowiednie narzędzia były bardziej dostępne dla uczonych reprezentujących różne dyscypliny nauk humanistycznych i społecznych. Artykuł niniejszy omawia założenia teoretyczne oraz w pełni funkcjonalny prototyp otwartego systemu stylometrycznego, którego szerokie zastosowanie umożliwią dwie jego cechy: elastyczność techniczna oraz dostosowywalność do różnych pytań badawczych. System opiera się na instalacji serwerowej sprzęgniętej z sieciowym interfejsem użytkownika. Uwalnia to użytkownika od konieczności instalowania jakichkolwiek dodatkowych programów. Jednocześnie system oferuje wiele sposobów analizowania tekstów nie tylko na poziomie leksykalnym, lecz także poprzez cechy językowe niskiego poziomu. Daje to możliwość stosowania systemu na wiele różnych sposobów, od typowych testów stylometrycznych do analizy semantycznej dokumentów. Wewnętrzna architektura systemu składa się z wielu elementów znanych ze swej funkcjonalności, w tym z pakietu Stylo przeznaczonego do analiz stylometrycznych oraz pakietu Cluto służącego do zaawansowanej analizy skupień. Artykuł omawia: (1) Koncepcję całego systemu, postrzeganą z punktu widzenia użytkownika, (2) Architekturę systemu oraz jego elementy odpowiedzialne za przetwarzanie tekstu, (3) Cechy językowe służące do opisu dokumentów, (4) Zastosowanie modułów analizy danych, takich jak Stylo czy Cluto. W artykule zostały też przedstawione przykładowe zastosowania systemu.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Word Sense Disambiguation Based on Large Scale Polish CLARIN Heterogeneous Lexical Resources
Autorzy:
Kędzia, Paweł
Piasecki, Maciej
Orlińska, Marlena
Tematy:
word sense disambiguation
WSD
page rank
plWordNet
graphs
lexical resources
SUMO
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677123.pdf  Link otwiera się w nowym oknie
Opis:
Word Sense Disambiguation Based on Large Scale Polish CLARIN Heterogeneous Lexical ResourcesLexical resources can be applied in many different Natural Language Engineering tasks, but the most fundamental task is the recognition of word senses used in text contexts. The problem is difficult, not yet fully solved and different lexical resources provided varied support for it. Polish CLARIN lexical semantic resources are based on the plWordNet - a very large wordnet for Polish - as a central structure which is a basis for linking together several resources of different types. In this paper, several Word Sense Disambiguation (henceforth WSD) methods developed for Polish that utilise plWordNet are discussed. Textual sense descriptions in the traditional lexicon can be compared with text contexts using Lesk’s algorithm in order to find best matching senses. In the case of a wordnet, lexico-semantic relations provide the main description of word senses. Thus, first, we adapted and applied to Polish a WSD method based on the Page Rank. According to it, text words are mapped on their senses in the plWordNet graph and Page Rank algorithm is run to find senses with the highest scores. The method presents results lower but comparable to those reported for English. The error analysis showed that the main problems are: fine grained sense distinctions in plWordNet and limited number of connections between words of different parts of speech. In the second approach plWordNet expanded with the mapping onto the SUMO ontology concepts was used. Two scenarios for WSD were investigated: two step disambiguation and disambiguation based on combined networks of plWordNet and SUMO. In the former scenario, words are first assigned SUMO concepts and next plWordNet senses are disambiguated. In latter, plWordNet and SUMO are combined in one large network used next for the disambiguation of senses. The additional knowledge sources used in WSD improved the performance. The obtained results and potential further lines of developments were discussed.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Semantic relations among adjectives in Polish WordNet 2.0: a new relation set, discussion and evaluation
Autorzy:
Maziarz, Marek
Szpakowicz, Stanisław
Piasecki, Maciej
Tematy:
wordnet
lexico-semantic relations
derivational relations
Polish WordNet
Słowosieć
adjective
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677296.pdf  Link otwiera się w nowym oknie
Opis:
Semantic relations among adjectives in Polish WordNet 2.0: a new relation set, discussion and evaluationAdjectives in wordnets are often neglected: there are many fewer of them than nouns, and relations among them are sometimes not as varied as those among nouns or verbs. Polish WordNet 1.0 was no exception. Version 2.0 aims to correct that. We present an overview of a much larger set of lexical-semantic relations which connect adjectives to the other parts of the network. Our choice of relations has been motivated by linguistic considerations, especially the concerns of the Polish lexical semantics, and by pragmatic reasons. The discussion includes detailed substitution tests, meant to ensure consistency among wordnet editors.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Lexical platform – the first step towards user-centred integration of lexical resources
Autorzy:
Piasecki, Maciej
Walkowiak, Tomasz
Rudnicka, Ewa
Bond, Francis
Tematy:
lexical resources
wordnet
interoperability of lexical resources
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677290.pdf  Link otwiera się w nowym oknie
Opis:
Lexical platform – the first step towards user-centred integration of lexical resourcesLexical platform – the first step towards user-centred integration of lexical resources The paper describes the Lexical Platform - a means for lightweight integration of independent lexical resources. Lexical resources (LRs) are represented as web components that implement a minimal set of predefined programming interfaces. These provide functionality for querying and generate a simple, common presentation format. Therefore, a common data format is not needed and the identity of component LRs is preserved. Users can search, browse and navigate via resources on the basis of a limited set of anchor elements such as base form, word form and synset id. Platforma leksykalna – pierwszy krok w kierunku integracji zasobów leksykalnych zorientowanej na użytkownikówArtykuł opisuje Platformę Leksykalną – sposób na lekką integrację niezależnych zasobów leksykalnych. Zasoby leksykalne są na niej reprezentowane jako komponenty webowe, które implementują minimalny zestaw predefiniowanych interfejsów programistycznych. Interfejsy te dostarczają funkcjonalność do przeszukiwania oraz generują prosty, jednolity format prezentacji zasobów. W związku z tym wspólny format danych nie jest konieczny i tożsamość składowych zasobów leksykalnych jest zachowana. Użytkownicy mogą przeszukiwać zasoby na podstawie ograniczonego zbioru odwołań takich jak forma podstawowa, forma wyrazowa i identyfikator synsetu.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Semantic relations among nouns in Polish WordNet grounded in lexicographic and semantic tradition
Autorzy:
Maziarz, Marek
Piasecki, Maciej
Szpakowicz, Stanisław
Rabiega-Wiśniewska, Joanna
Tematy:
wordnet
lexico-semantic relations
nouns
plWordNet
Polish WordNet
derivational relations
Pokaż więcej
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:
https://bibliotekanauki.pl/articles/677040.pdf  Link otwiera się w nowym oknie
Opis:
Semantic relations among nouns in Polish WordNet grounded in lexicographic and semantic traditionThe paper describes a system of lexico-semantic relations proposed for the nominal part of plWordNet 2.0 – the largest Polish wordnet. We briefly introduce a wordnet as a large electronic thesaurus. We discuss sixteen nominal relations together with many sub-types proposed for plWordNet 2.0. Each relation is based on linguistic intuition and supported by a set of tests which facilitate its identification. There are two main groups: pure lexico-semantic relations and semantic-derivational relations.
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies