Temat: lexical resources - Prolib Integro

Skocz do pozycji: 1.

Tytuł:: Lexical platform – the first step towards user-centred integration of lexical resources
Autorzy:: Piasecki, Maciej
Walkowiak, Tomasz
Rudnicka, Ewa
Bond, Francis
Tematy:: lexical resources
wordnet
interoperability of lexical resources; Pokaż więcej
Wydawca:: Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:: https://bibliotekanauki.pl/articles/677290.pdf Link otwiera się w nowym oknie
Opis:: Lexical platform – the first step towards user-centred integration of lexical resourcesLexical platform – the first step towards user-centred integration of lexical resources The paper describes the Lexical Platform - a means for lightweight integration of independent lexical resources. Lexical resources (LRs) are represented as web components that implement a minimal set of predefined programming interfaces. These provide functionality for querying and generate a simple, common presentation format. Therefore, a common data format is not needed and the identity of component LRs is preserved. Users can search, browse and navigate via resources on the basis of a limited set of anchor elements such as base form, word form and synset id. Platforma leksykalna – pierwszy krok w kierunku integracji zasobów leksykalnych zorientowanej na użytkownikówArtykuł opisuje Platformę Leksykalną – sposób na lekką integrację niezależnych zasobów leksykalnych. Zasoby leksykalne są na niej reprezentowane jako komponenty webowe, które implementują minimalny zestaw predefiniowanych interfejsów programistycznych. Interfejsy te dostarczają funkcjonalność do przeszukiwania oraz generują prosty, jednolity format prezentacji zasobów. W związku z tym wspólny format danych nie jest konieczny i tożsamość składowych zasobów leksykalnych jest zachowana. Użytkownicy mogą przeszukiwać zasoby na podstawie ograniczonego zbioru odwołań takich jak forma podstawowa, forma wyrazowa i identyfikator synsetu.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 2.

Tytuł:: Définir le sens dans un réseau lexical
How to define a word in a lexical network?
Autorzy:: Sikora, Dorota
Tematy:: Lexical definition
Explanatory and Combinatorial Lexicology
Lexical resources; Pokaż więcej
Wydawca:: Uniwersytet im. Adama Mickiewicza w Poznaniu
Powiązania:: https://bibliotekanauki.pl/articles/1051395.pdf Link otwiera się w nowym oknie
Opis:: As underlined in Wierzbicka (1996: 239), a «linguistic definition is a scientific hypothesis about the concept encoded in a given word». The present paper focuses on the problem of what such hypothesis is about. Lexicon of any language is structured with a set of connections relating lexical items. That is to say that speakers of any language need to master not only separate words, but rather a cluster of connected senses. If so, then a lexical definition should lay out the concept the word lexicalizes in the way that gives access to the whole grasp of its conceptual, paradigmatic and syntagmatic relations. We discuss the topic of definitional structures developed in the context of the French Lexical Network (Réseau Lexical du Français).
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 3.

Tytuł:: Word Sense Disambiguation Based on Large Scale Polish CLARIN Heterogeneous Lexical Resources
Autorzy:: Kędzia, Paweł
Piasecki, Maciej
Orlińska, Marlena
Tematy:: word sense disambiguation
WSD
page rank
plWordNet
graphs
lexical resources
SUMO; Pokaż więcej
Wydawca:: Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:: https://bibliotekanauki.pl/articles/677123.pdf Link otwiera się w nowym oknie
Opis:: Word Sense Disambiguation Based on Large Scale Polish CLARIN Heterogeneous Lexical ResourcesLexical resources can be applied in many different Natural Language Engineering tasks, but the most fundamental task is the recognition of word senses used in text contexts. The problem is difficult, not yet fully solved and different lexical resources provided varied support for it. Polish CLARIN lexical semantic resources are based on the plWordNet - a very large wordnet for Polish - as a central structure which is a basis for linking together several resources of different types. In this paper, several Word Sense Disambiguation (henceforth WSD) methods developed for Polish that utilise plWordNet are discussed. Textual sense descriptions in the traditional lexicon can be compared with text contexts using Lesk’s algorithm in order to find best matching senses. In the case of a wordnet, lexico-semantic relations provide the main description of word senses. Thus, first, we adapted and applied to Polish a WSD method based on the Page Rank. According to it, text words are mapped on their senses in the plWordNet graph and Page Rank algorithm is run to find senses with the highest scores. The method presents results lower but comparable to those reported for English. The error analysis showed that the main problems are: fine grained sense distinctions in plWordNet and limited number of connections between words of different parts of speech. In the second approach plWordNet expanded with the mapping onto the SUMO ontology concepts was used. Two scenarios for WSD were investigated: two step disambiguation and disambiguation based on combined networks of plWordNet and SUMO. In the former scenario, words are first assigned SUMO concepts and next plWordNet senses are disambiguated. In latter, plWordNet and SUMO are combined in one large network used next for the disambiguation of senses. The additional knowledge sources used in WSD improved the performance. The obtained results and potential further lines of developments were discussed.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 4.

Tytuł:: Evaluation of automatic updates of Roget’s Thesaurus
Autorzy:: Kennedy, A.
Szpakowicz, S.
Tematy:: lexical resources
Roget’s Thesaurus
WordNet
semantic relatedness
synonym selection
pseudo-word-sense disambiguation
analogy; Pokaż więcej
Wydawca:: Polska Akademia Nauk. Instytut Podstaw Informatyki PAN
Powiązania:: https://bibliotekanauki.pl/articles/103921.pdf Link otwiera się w nowym oknie
Opis:: Thesauri and similarly organised resources attract increasing interest of Natural Language Processing researchers. Thesauri age fast, so there is a constant need to update their vocabulary. Since a manual update cycle takes considerable time, automated methods are required. This work presents a tuneable method of measuring semantic relatedness, trained on Roget’s Thesaurus, which generates lists of terms related to words not yet in the Thesaurus. Using these lists of terms, we experiment with three methods of adding words to the Thesaurus. We add, with high confidence, over 5500 and 9600 new word senses to versions of Roget’s Thesaurus from 1911 and 1987 respectively. We evaluate our work both manually and by applying the updated thesauri in three NLP tasks: selection of the best synonym from a set of candidates, pseudo-word-sense disambiguation and SAT-style analogy problems. We find that the newly added words are of high quality. The additions significantly improve the performance of Roget’s-based methods in these NLP tasks. The performance of our system compares favourably with that of WordNet-based methods. Our methods are general enough to work with different versions of Roget’s Thesaurus.
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 5.

Tytuł:: Lodowa kurtyna. Globalny dyskurs medialny o konfliktach w Arktyce
Ice Curtain. Global Media Discourse on Conflicts in the Arctic
Autorzy:: Maltseva, Daria
Opis:: Najważniejszym zadaniem oraz przedmiotem badań jest globalny dyskurs medialny o konfliktach na terenie Arktyki. W pracy zostały wybrane anglojęzyczne, rosyjskie, azjatyckie, skandynawskie oraz zachodnioeuropejskie gatunki prasowe w celu kreowania opinii wybranych mediów na temat szóstego kontynentu. Podejmowane są tematy wojennych i politycznych konfliktów w krainie wiecznych śniegów oraz są podane możliwe rozwiązania omawianych sporów. W pracy zostały przeprowadzone badania metodą frekwencyjnej analizy zawartości wybranych akapitów z różnych gatunków prasowych.
The most important issue and subject of research is the global media discourse about conflicts in the Arctic. In the work, English-speaking, Russian, Asian, Scandinavian and Western European press were selected in order to create opinions about conflicts on the sixth continent.In the presented text, I discuss the topics of military and political conflicts in the land of eternal snows and possible solutions to the disputes. The study was conducted with the use of frequency analysis of the content of selected paragraphs from various press genres.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Skocz do pozycji: 6.

Tytuł:: Language status and the size of user’s mental vocabulary in the context of educational requirements
Status języka a zasobność słownika mentalnego w kontekście wymagań edukacyjnych
Autorzy:: Seretny, Anna
Opis:: A language may have a different status for its users. This fact significantly affects the size and shape of their mental dictionary, as well as its flexibility, which, in turn, determines access time to its data. In the text, apart from the quantitative and qualitative characteristics of the mental lexicon depending on the status which a language has for its users, strategies of developing lexical competence resonating with the status requirements will be presented.
Język może mieć różny status dla swoich użytkowników. Fakt ten w istotny sposób wpływa na wielkość i ukształtowanie ich słownika mentalnego, a także na jego elastyczność, warunkującą dostęp do znajdujących się w nim danych. W tekście poza ilościowo-jakościową charakterystyką leksykonu mentalnego zależną od funkcji, jaką język ma pełnić dla użytkowników, przedstawione zostaną również strategie kształtowania kompetencji leksykalnej przystające do wymagań określonego statusu danego kodu.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Artykuł

na półce

Skocz do pozycji: 7.

Tytuł:: Bulgarian-Polish Language Resources (Current State and Future Development)
Autorzy:: Dimitrova, Ludmila
Koseska-Toszewa, Violetta
Tematy:: digital bilingual resources
parallel corpus
aligned corpus
lexical data base
paper and digital dictionary
online dictionary
digital entry classifiers; Pokaż więcej
Wydawca:: Polska Akademia Nauk. Instytut Slawistyki PAN
Powiązania:: https://bibliotekanauki.pl/articles/677220.pdf Link otwiera się w nowym oknie
Opis:: Bulgarian-Polish Language Resources (Current State and Future Development)The paper briefly reviews the first Bulgarian-Polish digital bilingual resources: corpora and dictionaries, which are currently developed under bilateral collaboration between IMI-BAS and ISS-PAS: joint research project “Semantics and contrastive linguistics with a focus on a bilingual electronic dictionary”, coordinated by L. Dimitrova (IMI-BAS) and V. Koseska (ISS-PAS).
Dostawca treści:: Biblioteka Nauki

Artykuł

na półce

Skocz do pozycji: 8.

Tytuł:: Extensive reading as a way of developing learners’ lexical competence
Czytanie ekstensywne, czyli sposób na efektywne rozwijanie kompetencji leksykalnej uczących się
Autorzy:: Seretny, Anna
Wydawca:: Uniwersytet Śląski w Katowicach
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Artykuł

na półce

Skocz do pozycji: 9.

Tytuł:: Dwa oblicza nowomowy – w teorii Orwella i sowieckiej rzeczywistości
Two faces of Newspeak – in the theory of Orwell and Soviet reality
Два обличья новояза - в теории Оруэлла и советской действительности
Autorzy:: Fatuła, Wojciech
Opis:: Niniejsza praca magisterska jest poświęcona analizie dwóch wariantów języka totalitarnego – modelu sowieckiego, rozwijającego się na przestrzeni 70-letniego okresu i angielskiego, przedstawionego w powieści George’a Orwella. Materiał do analizy новояза – sowieckiej wersji nowomowy – był wyekscerpowany ze słownika: В.М. Мокиенко и Т.Г. Никитина, Толковый словарь языка совдепии, Санкт-Петербург 1998. Zasady newspeak’a – nowomowy stworzonej przez angielskiego pisarza George’a Orwella, zostały przedstawione w aneksie załączonym do jego najwybitniejszego utworu pt. Rok 1984.Założeniem pracy było wskazanie charakterystycznych cech dwóch systemów językowych, mogących dać jednoznaczną odpowiedź na pytania, czy badane przez nas dwa warianty nowomowy są do siebie tylko podobne, czy może są to dwie realizacje tego samego zjawiska? I czy możliwe było, aby któraś z tych wersji była wzorowana na drugiej?Praca składa się ze Wstępu, dwóch rozdziałów i Zakończenia.We Wstępie zaprezentowane zostały dwa warianty nowomowy – angielska i sowiecka. Przy ich omówieniu zwrócono szczególną uwagę na przyczyny powstania i interesujący rozwój tych osobliwych systemów językowych.Rozdział pierwszy poświęcono życiu i twórczości George’a Orwella. Ta część pracy została podzielona na trzy podrozdziały. Pierwszy z nich zawiera krótką biografię angielskiego pisarza. Dwa następne podrozdziały to kolejno: streszczenie powieści Rok 1984, a później zasady newspeak’a, nakreślone przez George’a Orwella w aneksie załączonym do antyutopii.Rozdział drugi niniejszej pracy to analiza zebranego materiału, poprzedzona krótkim ekskursem do historii rozwoju języka sowieckiego. W toku badań wyekscerpowanego materiału porównywano dwa języki będące przedmiotem analizy.Do cech łączących wyżej wymienione wersje nowomowy zaliczyliśmy: polityzację neutralnej leksyki, minimalizację zasobów leksykalnych, pojawienie się różnego rodzaju skrótowców (inicjałowych, sylabowych itp.), obecność eufemizmów, nadzwyczaj częste użycie haseł propagandowych, sloganów i dewiz, związanych z ideologią państwową.Ponadto już na początku analizy okazało się, że język sowiecki jest o wiele bardziej rozbudowany i posiada elementy leksykalne nie występujące w strukturze newspeak’a. Po pierwsze, słowa-symbole epoki komunistycznej, zawierające w sobie treści ideologiczne. Po drugie, leksykalne „fantomy” – wyrażenia tak naprawdę nic nie znaczące, pozbawione swojego denotatu.Trzecią, charakterystyczną cechą sowieckiego języka propagandy, są bardzo często pojawiające się w badanym materiale nazwy własne powstałe na skutek ideologizacji społeczeństwa. Wydzieliliśmy dużą grupę antroponimów i toponimów.Osobliwości występujące w badanym materiale, pozwoliły nam dać odpowiedź na postawione na początku pracy pytania. Newspeak i новояз posiadają pewne elementy wspólne, lecz z całkowitą pewnością możemy powiedzieć, że obydwa systemy językowe, będące obiektem naszych obserwacji, rozwijały się bez wzajemnego kontaktu i oddziaływania na siebie.
This Master Thesis entitled "Two faces of Newspeak- in the theory of Orwell and Soviet reality" is devoted to showing the phenomenon of creating a special language by two totalitarian countries which corresponded to propagandistic needs of the authorities. These two regimes dominated by the total dictatorship was Oceania- the country imagined by George Orwell and The Union of Soviet Socialist Republics- the country that really existed. The reference for the analysis was based on two resources. The rules of Newspeak(created by an English writer George Orwell ) were presented in the appendix of his best writing entitled "1984".On the other hand, the reference for the analysis of новояз- the soviet version of Newspeak was taken from V. M. Mokienko, T. G. Nikitina, Tolkovyj slovar': jazyka sovdepii, Sankt-Peterburg 1998.The main aim of the MA thesis was to show the characteristic features of the two language systems to find out whether the two types of newspeak are only similar or maybe they are two realizations of the same phenomenon. Is it possible that one version was based on the other?The thesis is divided into 5 parts: introduction, two chapters, summary and bibliography.In the introduction two types of newspeak are presented: The English and the Soviet one.While describing them it was pointed out how the two types of newspeak were created and how they developed. The first chapter was devoted to life and the output of George Orwell. This part of the thesis is divided into three subsections. The first of them is a short biography of an English writer. The second part summarizes the novel "1984". The third subsection describes the rules of newspeak, which was shown by Orwell in the appendix of antiutopia.The second chapter is the analysis of the collected material followed by a short excursus of the history of the development of Soviet Language.
Настоящая работа посвящена рассмотрению двух проявлений тоталитарного языка – советской модели, развивающейся в СССР на протяжении 70-летнего периода, и английской, отраженной в художественном произведении – романе Джорджа Оруэлла. Источником материала, иллюстрирующим основные характеристики советского новояза, являлся словарь В.М. Мокиенко и Т.Г. Никитиной: Толковый словарь языка совдепии, Санкт-Петербург 1998. Принципы же построения английского newspeak’а, как известно, изложены в романе 1984 Джорджа Оруэлла.Целью настоящей работы являлось определение отличительных свойств двух языковых систем, способствующих дать однозначный ответ на вопросы: тождественны ли эти системы или только похожи? Если различаются, то в чем наблюдается их разница? Могли ли создатели новояза и newspeak`а равняться друг на друга, учитывать опыт, накопленный иной стороной? Работа состоит из Введения, двух глав и Заключения.Во Введении представлениы две разновидности новояза – английский и советский. При их обсуждении мы обратили особое внимание на причины возникновения и интересное развитие этих своеобразных языковых систем.Первая глава дипломной работы посвящена освещению жизни и творчества Джорджа Оруэлла. Она состоит из трех частей.Первая заключает в себе биографию английского писателя. Две следующие части первой главы освещают последовательно: содержание романа 1984, а потом и Приложения к нему, в котором представлена оруэлловская языковая теория, раскрывающая структуру политического языка Океании и его специфику.Вторая глава дипломной работы рассматривает материал советского новояза, анализируются языковые особенности – и постоянные на протяжении всего его бытования, и динамично изменяющиеся по мере развития. Производимый анализ сопровождается сопоставлением новояза и newspeak`а, выявлением сходств и различий между исследуемыми языковыми системами.Среди черт, объединяющих два проявления тоталитарного языка, нами выделяются и иллюстрируются: политизация нейтральной лексики, минимализация словарного состава, обилие аббревиатур, наличие эвфемизмов, активность лозунгов.Помимо совпадений в характеристиках newspeak`а и новояза можно заметить также различия, причем специфические черты проявляются исключительно в языке Совдепии как более детально разработанном на практике. Своеобразие новояза предопределяет присутствие в нем: идеологем, лексических фантомов,имен собственных, маркированных идеологией.Отчетливые свойства, выступающие в исследованном материале, позволили нам дать ответ на поставленные в начале работы вопросы. Newspeak и новояз обладают некими сходными элементами, но безусловно можем сказать, что обе языковые системы развивались без взаимного контакта и влияния друг на друга.
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

na półce

Informacja

Wyszukujesz frazę "lexical resources" wg kryterium: Temat