Мови

  • English
  • Українська

Пошук

Синдикація

RSS-матеріал

2-а Міждисциплінарна майстерня Фізика і гуманітарні науки

2-а Міждисциплінарна майстерня Фізика і гуманітарні науки


Verba et numeri (кількісні підходи до  аналізу мови і тексту)

Конференц-зал Українського католицького університету (Львів, вул. Козельницька 2а), 28 березня 2017 р., 15:30-19:00

Афіша події

Мета майстерень Фізика і гуманітарні науки - продемонструвати можливість застосування концепцій і методів природничих наук в соціальній і гуманітарній сферах. В серії оглядових лекцій і коротких повідомлень 2-ї майстерні ви почуєте про нові підходи до аналізу мови і тексту, про спроби теоретичного опису еволюції мови, про складність графічної форми знаків у нещодавно створених системах письма та про історичний контекст і кількісні характеристики класичних літературних творів. Майстерня планується як місце зустрічі між науковцями і студентами різних фахів. Окрім популяризації наукових ідей, майстерня також сприятиме пошуку спільних міждисциплінарних підходів до вивчення актуальних проблем аналізу мови і тексту.

Програма:

Кількісні методи та моделі в лінгвістиці.

Олексій Васильєв (Київський національний університет ім. Тараса Шевченка)
У сучасній науці все частіше виникають задачі, розв’язання яких вимагає застосування методів та підходів різних наукових галузей. Лінгвістика не є винятком. Насамперед, йдеться про залучення математичного апарату в лінгвістичних дослідженнях. Серед задач, які розв’язуються математичними методами, є "класичні", на кшталт побудови частотних словників і визначення законів рангового розподілу. Разом із тим, з’являються й нові виклики. Важливим чинником для цього став бурхливий розвиток комп’ютерних технологій. Це, з одного боку, відкрило широкі можливості щодо застосування потужних комп’ютерних систем для аналізу й обробки значних масивів даних, якими є корпуси текстів. З іншого боку, сам розвиток комп’ютерних технологій ставить перед дослідниками цікаві задачі. Важливого прикладного значення набули проблеми машинного перекладу, створення систем з елементами штучного інтелекту, розробка технологій військового призначення, побудова різноманітних експертних систем та багато інших. Арсенал методів, що знаходять застосування в лінгвістиці, включає теорію ймовірностей й математичну статистику, теорію множин, теорію диференціальних рівнянь, теорію графів, моделювання на основі нейронних мереж і деякі інші. Міждисциплінарний характер розв’язуваних задач вимагає залучення фахівців різних профілів: лінгвістів, математиків, програмістів, психологів, істориків, соціологів, фізиків.
Мета доповіді - проілюструвати можливості сучасних математичних методів у лінгвістиці та окреслити шляхи співпраці дослідників різних наукових галузей у розв’язанні комплексних задач.

Презентація доповіді

 
 

Концепція складних мереж  у аналізі мови і тексту.

Юрій Головач (ІФКС НАН України, м. Львів).
Мабуть найвідомішим законом кількісної лінгвістики є закон Зіпфа, що встановлює зв’язок між частотою слів та їх рангом. Однак, цей закон не стосується організації слів у речення, утворені в результаті взаємодії між словами. Останнім часом частішають спроби
описати таку організацію за допомогою науки про складні мережі. Мета доповіді – ознайомити слухачів з цією наукою продемострувати її використання для аналізу мови і тексту.
1. Yu. Holovatch, R. Kenna, S. Thurner.   Complex systems: physics beyond physics. Eur. Journ. Phys. 38 (2017) 023002 (19pp)
2. Yurij Holovatch, Vasyl Palchykov.   Complex Networks of Words in Fables. In: Maths Meets Myths: Complexity-science approaches to folktales, myths, sagas, and histories. R. Kenna, M. Mac Carron, P. Mac Carron (Editors), Springer, 2016, pp. 159-175
3. Ю. Головач, В. Пальчиков. Лис Микита і мережі мови. Журн.Фіз.Досл. 11 (2007) 22-33
4. Ю. Головач, К. фон Фербер, О. Олемской, Т. Головач, О. Мриглод, І. Олемской, В. Пальчиков. Складні мережі. Журн. Фіз. Досл.  10 (2006) 247-291

Презентація доповіді

 
 

Кількісний аналіз систем письма: алфавіт Нко.

Андрій Ровенчак (Львівський національний університет ім. Івана Франка).
Алфавітну писемність нко створив у 1949 році ґвінейський просвітник Соломана Канте для мов манден у Західній Африці [1,2]. Її дослідження було зроблено в різних аспектах, які відображаються кількісними параметрами. Зокрема, можна прослідкувати, чи складність графічної форми знаків корелює з їх частотністю [3]. На підставі кількісних лінгвістичних законів (як-от закон Менцерата–Альтмана) вдається отримати підказку про те, як коректніше визначити поняття мори в мові манінка [4,5], для якої нко найбільше використовують. Частотний аналіз також може слугувати додатковим обґрунтуванням деяких орфографічних принципів у нко [5].
[1] Dalby, David (1969). Further indigenous scripts of West Africa: Manding, Wolof and Fula alphabets and Yoruba ‘holy’ writing. African Language Studies 10: 161–181.
[2] Vydrine, Valentin (1999): Manding–English Dictionary (Maninka, Bamana). Vol. 1: A, B, D–DAD, supplemented by some entries from subsequent volumes. (St. Petersburg: Dimitry Bulanin Publishing House).
[3] Rovenchak, Andrij & Vydrin, Valentin (2010). Quantitative properties of the Nko writing system. In P. Grzybek, E. Kelih, J. Mačutek (eds.), Text and Language: Structures - Functions - Interrelations. Quantitative perspectives (Wien: Praesens), 171–181.
[4] Rovenchak, Andrij (2015). Quantitative studies in the corpus of Nko periodicals. In A. Tuzzi, M. Benešová and J. Mačutek (eds.), Recent Contributions to Quantitative Linguistics (Berlin–Boston: Mouton de Gruyter), 125–138.
[5] Rovenchak, Andrij (2011). Phoneme distribution, syllabic structure, and tonal patterns in Nko texts. Mandenkan: Bulletin semestriel d'études linguistiques mandé 47: 77–96.

Презентація доповіді

 
 

Кількісний аналіз і якісні висновки (оцінка пуризму Б. Грінченка).

Орест Друль (Портал Збруч).
http://zbruc.eu/node/57752

Презентація доповіді

 
 

Окремі кількісні характеристики творів західноукраїнських письменників.

Ігор Кульчицький (Національний університет Львівська політехніка).

Презентація доповіді

 
 

Аналіз методів побудови векторних представлень слів на основі малого україномовного корпусу.

Андрій Романюк (Український католицький університет).
Лінгвістичні моделі на основі векторних представлень слів зараз широко використовуються для вирішення багатьох лінгвістичних задач [1, 2]. Точність таких моделей залежить від розміру текстових даних на основі яких вони створюються [3, 4]. Мета доповіді полягає в ознайомленні з методами побудови векторних представлень слів та результатами аналізу моделей, які отримані на основі малого за обсягом корпусу текстів.
1. Learning Sentiment-Specific Word Embedding for Twitter Sentiment Classification
Duyu Tang, Furu Wei, Nan Yang, Ming Zhou, Ting Liu, Bing Qin
Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, pages 1555–1565
2. Word Embedding techniques for Content-based Recommender Systems: an empirical evaluation
Cataldo Musto, Giovanni Semeraro, Marco De Gemmis, Pasquale Lops
RecSys 2015 Poster Proceedings
3. Comparative study of LSA vs Word2vec embeddings in small corpora: a case study in dreams database
Edgar Altszyler, Mariano Sigman and Diego Fernández Slezak
4. Word Embeddings for the Construction Domain
Antoine J.-P. Tixier, Michalis Vazirgiannis, Matthew R. Hallowell

Презентація доповіді

 

Архів майстерні

Організатори:
Український католицький університет
Інститут фізики конденсованих систем НАН України