Language Corpora Annotation and Processing

eBook

185,95 €
(inkl. MwSt.)
E-Book Download

Download

Bibliografische Daten
ISBN/EAN: 9789811629600
Sprache: Englisch
Umfang: 0 S., 10.08 MB
Auflage: 1. Auflage 2021
E-Book
Format: PDF
DRM: Digitales Wasserzeichen

Beschreibung

This book addresses the research, analysis, and description of the methods and processes that are used in the annotation and processing of language corpora in advanced, semi-advanced, and non-advanced languages. It provides the background information and empirical data needed to understand the nature and depth of problems related to corpus annotation and text processing and shows readers how the linguistic elements found in texts are analyzed and applied to develop language technology systems and devices. As such, it offers valuable insights for researchers, educators, and students of linguistics and language technology.


Autorenportrait

Dr. Niladri Sekhar Dash is Professor and Head, Linguistic Research Unit, Indian Statistical Institute, Kolkata (The Institute of National Importance, Govt. of India). For the last 28 years, he is working in corpus linguistics, language technology, computational lexicography, computer-assisted language teaching, language documentation, translation, clinical linguistics, and digital ethnography. To his credit, he has published 18 research monographs and more than 285 research papers in indexed and peer-reviewed research journals, anthologies, and conference proceedings. As an invited speaker, he has delivered lectures at more than 50 universities and institutes in India and abroad. He acts as a Research Advisor for several multinational organizations that work on language technology, artificial intelligence, lexicography, digital humanities, and language resource development. He acts as Principal Investigator for several LangTech projects funded by the Govt. of India and corporate houses. He is the Chief Editor of the Journal of Advanced Linguistic Studiesa reviewed international journal of linguistics. He is an Editorial Board Member for several international journals. He is also a member of several linguistic associations across the world. He is a British Academy International Visiting Fellow (2018), Visiting Research Fellow of School of Psychology& Clinical Language Sciences, University of Reading, UK (2018-2021), and Visiting Scholar of Language and Brain Laboratory, University of Oxford, UK (2019). At present, he is heading 5 projects: (a) Upgradation of Bengali WordNet funded by the Ministry of Statistics and Programme Implementation (MoSPI), Govt. of India; (b) Sound Imitative Words in Bengali in collaboration with the Dept. of British and American Studies, Faculty of Arts, P.J. ¦afárik University, Slovakia; (c) Bilingual Dementia of Patients with Brocas Aphasia in collaboration with the School of Psychology and Clinical Language Sciences, University of Reading, UK; (d) Public Announcement System at Airports and Railway Stations in Indian Sign Language with Animation in a consortium-mode project headed by the Dept. of Computer Science, Punjabi University, Patiala, India, and (e) Dictionary for Sabar Speech Community an endangered tribe of West Bengal, India.

Inhalt

Introduction.- Chapter 1. Corpora Annotation: Definition and Types.- Chapter 2. Maxims, Principles,& Rules of Text Annotation.- Chapter 3. Extratextual Documentative Annotation.- Chapter 4. Etymological Annotation.- Chapter 5. Concordance, KWIC, LWG and Collocation.- Chapter 6. Morphological Processing of Words.- Chapter 7. Part-of-Speech Tagging.- Chapter 8. Lemmatization of Inflected Nouns.- Chapter 9. Decomposition of Inflected Verbs.- Chapter 10. Parsing Sentences in a Text. 

Informationen zu E-Books

Herzlichen Glückwunsch zum Kauf eines Ebooks bei der BUCHBOX! Hier nun ein paar praktische Infos.

Adobe-ID

Hast du E-Books mit einem Kopierschutz (DRM) erworben, benötigst du dazu immer eine Adobe-ID. Bitte klicke einfach hier und trage dort Namen, Mailadresse und ein selbstgewähltes Passwort ein. Die Kombination von Mailadresse und Passwort ist deine Adobe-ID. Notiere sie dir bitte sorgfältig. 
 
Achtung: Wenn du kopiergeschützte E-Books OHNE Vergabe einer Adobe-ID herunterlädst, kannst du diese niemals auf einem anderen Gerät außer auf deinem PC lesen!!
 
Du hast dein Passwort zur Adobe-ID vergessen? Dann kannst du dies HIER neu beantragen.
 
 

Lesen auf dem Tablet oder Handy

Wenn du auf deinem Tablet lesen möchtest, verwende eine dafür geeignete App. 

Für iPad oder Iphone etc. hole dir im iTunes-Store die Lese-App Bluefire

Für Android-Geräte (z.B. Samsung) bekommst du die Lese-App Bluefire im GooglePlay-Store (oder auch: Aldiko)
 
Lesen auf einem E-Book-Reader oder am PC / MAC
 
Um die Dateien auf deinen PC herunter zu laden und auf dein E-Book-Lesegerät zu übertragen gibt es die Software ADE (Adobe Digital Editions).
 
 

Andere Geräte / Software

 

Kindle von Amazon. Wir empfehlen diese Geräte NICHT.

EPUB mit Adobe-DRM können nicht mit einem Kindle von Amazon gelesen werden. Weder das Dateiformat EPUB, noch der Kopierschutz Adobe-DRM sind mit dem Kindle kompatibel. Umgekehrt können alle bei Amazon gekauften E-Books nur auf dem Gerät von Amazon gelesen werden. Lesegeräte wie der Tolino sind im Gegensatz hierzu völlig frei: Du kannst bei vielen tausend Buchhandlungen online Ebooks für den Tolino kaufen. Zum Beispiel hier bei uns.

Software für Sony-E-Book-Reader

Wenn du einen Sony-Reader hast, dann findest du hier noch die zusätzliche Sony-Software.
 

Computer/Laptop mit Unix oder Linux

Die Software Adobe Digital Editions ist mit Unix und Linux nicht kompatibel. Mit einer WINE-Virtualisierung kommst du aber dennoch an deine E-Books.