Институт информатики Академии наук
Республики Татарстан
English
Сайт создан и поддерживается отделом компьютерного моделирования Института информатики Академии наук Республики Татарстан — ИИ АН РТ (г. Казань, РФ, директор: Фарид Мансурович Аблаев) — при частичной финансовой поддержке ООО «Яндекс», РФФИ и РГНФ.
Сайт и коллектив разработчиков входят в состав международной ассоциации «Textual heritage» («Письменное наследие»), объединяющей лингвистов, историков, библиографов и программистов.
Ознакомительная информация об отделе
компьютерного моделирования ИИ АН РТ
Применение методов искусственного интеллекта для моделирования языковой эволюции позволяет получать результаты, важные для развития поисковых систем, аналитических и интерфейс-технологий, использующих подходы теории искусственного интеллекта.
Содержание:
1. Направления деятельности отдела компьютерного моделирования
- Технологии стандартизации и интеграции информации в области культурного наследия;
- Математические и компьютерные модели языковой эволюции;
- Создание корпуса русского языка XVIII века, позволяющего исследовать лингвистические, социальные и другие процессы в период культурной и языковой революции.
Технологии стандартизации и интеграции информации в области культурного наследия предоставляют возможность производить широкие исследования объектов культурного наследия: от древних текстов до музейных предметов и архитектурных памятников. Изучение эволюции языка полезно не только в гуманитарных и просветительских целях, но, в перспективе, на базе построенной модели развития речи, позволит сблизить искусственные языки с естественными и разработать алгоритмы самообучающегося человеко-машинного интерфейса. Перспективность проводимых исследований оценена регулярной поддержкой с стороны государственных фондов РФФИ и РГНФ, а также со стороны коммерческих организаций: ООО «Яндекс» (yandex.ru), ICL (Fujitsu Limited), Logic Systems и др.
В частности, для исследований представляет интерес русский язык XVIII века, поскольку в XVIII веке русский язык переживал революцию и, благодаря интенсивным изменениям, представил собой для исследователей яркий образец языковой эволюции. В ходе текущих проектов созданы корпуса русского языка XVIII века (совместно с Филологическим факультетом КФУ, а также ИжГТУ, УдГУ и ИРЯ РАН) и настольные программные средства для работы с ними (от клавиатурной раскладки до интегрируемых инструментов офисных приложений, при помощи которых осуществлялось распознавание текстов, генерация словарей и т.д.). Перечисленные средства позволяют осуществлять текстовый поиск на языке XVIII века в оффлайн и в онлайн-корпусах, а разработанная поисковая система – поиск с учётом морфологии русского языке XVIII века по всем Интернет-ресурсам, содержащим тексты в орфографии XVIII-XIX веков. Поиск реализован посредством API- и GET-запросов к индексной базе «Yahoo». Разрабатываемые средства позволят продолжить построение модели языковой эволюции.
Посредством квантитативных вычислений и формальных преобразований доказано, что языковые признаки эволюционируют не только по классическому циклу Шлейхера-Крофта (изолированные – агглютинативные – флективные – изолированные), но и соответственно относительно новой гипотезе Эстена Даля (2004 год), согласно которой определённая доля языковых признаков развивается поступательно, наращивая сложность языка за счёт его самостоятельного развития и упрощая язык благодаря заимствованиям. Таким образом, проводимые проф. В.Д.Соловьёвым квантитативные исследования позволили опровергнуть существующую парадигму исключительно циклического развития языков и математически доказать справедливость парадигмы циклически-поступательного развития. Это служит примером того, как математическое и компьютерное моделирование, осуществлённое одним сотрудником института, позволило решить задачу из прикладной области (в данном случае – из филологии) над которой длительное время работали специалисты из этой прикладной области (филологи).
Деятельность коллектива вызывает отдельный интерес как социальный показатель. В последнее время в Татарстане имел место ряд митингов и сообщений в средствах массовой информации о якобы происходящем в республике притеснении русского языка, выражающемся, в частности, в сокращении в школах числа уроков русского за счёт числа уроков татарского языка. Негативное впечатление придаёт и произведённый сепаратистами в Казани, в 2012 году, теракт. Тот факт, что в рамках работы Института информатики Академии наук Республики Татарстан проводятся (необходимые для развития информационных технологий и гуманитарных задач) исследования не только русского, но и старорусского, языка, подчёркивает позитивность сложившихся межэтнических отношений в республике, которую поддерживает республиканская власть. Это утверждает город Казань в качестве межнационального научного и культурного центра России.
2. Публикации последних лет, избранные для ознакомления с деятельностью группы в области интеллектуальных информационных систем
- Solovyev V.D., Bochkarev V.V. Average word length dynamics as indicator of cultural changes in society // Cornell University Library. – (Engl.). – 2013.
- Solovyev V.D., Gareev R.M., Ivanov V.V. Dictionary and pattern-based recognition of organization names in Russian news texts // To be published in AWERProcedia – Information Technology and Computer Science. – (Engl.). – 2013.
- Соловьёв В.Д., Булыгина Е.А. Генетическое и лингвистическое разнообразие четырнадцати популяций Евразии // Учён. зап. Казан. ун-та / Сер. Естественные науки. – (Рус.). – Казань: Изд-во Каз. ун-та, 2012. – Т.154. – Кн.4. – С.175-187.
- Соловьёв В.Д. Google Books & НКРЯ – новые возможности квантитативных исследований в гуманитарных дисциплинах // Труды конф. «Системный анализ и семиотическое моделирование». – (Рус.). – Казань: Фэн, 2011. – С.12-17.
- Соловьёв В.Д. Частотность как объект корпусных исследований // Труды межд. конф. «Корпусная лингвистика – 2011». – (Рус.). – С-Пб: С-Пб ГУ, 2011. – С.328-323.
- Баранов В.А., Маргулис И.С. Современные информационные технологии и письменное наследие // Российский научный электронный журнал «Электронные библиотеки» (elbib.ru). – Москва: ИРИО, посл. обновл. 26 апреля 2011. – Т.12. – Вып.4. – 41 С.
- Valery Solovyev. The Problem of Interpretation of Phylogenetic ASJP Trees // Proceedings of the 1st ALP conference. – (Engl.). – Leipzig: EVA Max Plank Institute, 2010.
- Valery Solovyev, Venera Bayrasheva, Renat Faskhutdinov. Comparative Analysis of Phylogenic Algorithms (& презентация) // International Journal «Information Technologies and Knowledge». – V.4, №3. – (Engl.). – 2010. – P.233-241.
- Соловьев В.Д. Типологическая схожесть языков как метод изучения языковой эволюции // Вестник РГГУ. – №16(59)/10. – (Рус.). – РГГУ, 2010. – С.177-187.
- Соловьев В.Д., Байрашева В.Р. Морфосинтаксический метод извлечения семантической информации из корпусов // Учён. зап. Казан. ун-та / Сер. Гуманитарные науки. – (Рус.). – Казань: Изд-во Каз. ун-та, 2010. – Т.152. – Кн.2. – С.247-260.
- Соловьев В.Д. Новый метод кладистики, опирающийся на грамматическую информацию // Труды семинара по компьютерной и когнитивной лингвистике. – Вып.12. – (Рус.). – Казань: Фэн, 2010. – С.127-141.
- Solovyev V., Janda L. What constructional profiles reveal about synonymy: A case study of Russian words for «sadness» and «happiness» // Cognitive linguistics. – V.20. – №2. – (Engl.). – 2009, P.367-393.
- Solovyev V., Polyakov V., Wichmann S., Belyaev O. Using WALS and Jazyki mira // Linguistic Typology. V. 13. – (Engl.). – 2009. P.135-165.
- Solovyev V., Wichmann S. Studying global language dynamics through large typological lexical databases // Proc. of the intern. conf. «Cognitive and Functional Perspectives on Dynamic Tendencies in Languages». – (Engl.). – Tartu: University of Tartu, 2008. – P.193.
- Solovyev V., Janda L. Constructional profile as a measure of Synonymy/antonymy: «happiness» and «sadness» in Russian (& handout) // Proc. of the intern. conf. «Cognitive and Functional Perspectives on Dynamic Tendencies in Languages». – (Engl.). – Tartu: University of Tartu, 2008. – P. 225-226.
- Solovyev V., Janda L. Are Emotions Metaphorical Objects? Constructional Profiles and Russian words for «Sadness» // Proceedings of CSDL. – (Engl.). – Ohio: Ohio University, 2008. – P.178.
- Solovyev V., Bajrasheva V. Modelling the Evolution of Language Features // Proc. of the intern. conf. «Cognitive and Functional Perspectives on Dynamic Tendencies in Languages». – (Engl.). – Tartu: University of Tartu, 2008. – P.198-199.
- Соловьёв В.Д. Методика анализа семантических репрезентаций: на пути к естественно-научной парадигме // Проблема представления (репрезентации) в языке. Типы и форматы знаний. – М.: ИЯ РАН, 2007. – С.80-85.
- Ivanov V. Integrating heterogeneous museum descriptions using linguistic resources // In proceedings of CIDOC-2007 Conference. – (Engl.). – Vienna, Austria, 2007.
- Соловьёв В.Д., Маргулис И.С. Организация поиска в текстовых коллекциях на русском языке XVIII века // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П.И.Браславский]. – (Рус.). – Екатеринбург: Изд-во Урал. ун-та, 2007. – С.191-199.
- Соловьёв В.Д., Маргулис И.С. Классификация ошибок распознавания символов печатных изданий в старинной орфографии // Вестник Тамбовского государственного технического университета. – (Рус.). – Тамбов: Изд-во ТГТУ, 2007 – Ч.13. – №3. – С.715-727.
- Соловьёв В.Д., Добров Б.В., Лукашевич Н.В. Тезаурус по архитектуре и искусству как средство формализации описаний музейных предметов // Web Journal of Formal, Computational & Cognitive Linguistics (fccl.ksu.ru). – (Рус.). – 2006. – Issue 8.
- Ivanov V. Integration of thesaurus and ontology for the use in the information resource on the culture heritage // Proceedings of First Workshop on Intelligent Technologies for Cultural Heritage Exploitation at the 17th European Conference on Artificial Intelligence. – (Engl.). – Trento, 2006. – P.31-36.
- Маргулис И.С. Проект расширения диапазонов славянских языков в кодировке Unicode (& подробнее) // Сб. тр. IV ежегод. научн.-практ. конф. «Инфокоммуникационные технологии глобального информационного общества» (6-7 сен. 2006 г., г.Казань). – (Рус.). – Казань: Изд-во Центра инновационныхых технологий, 2006. – С.408-411.
- Solovyev V. Electronic Library of Russian Books of the XVIII Century: Problems and Perspectives // Proc. International conf. London-EVA"05. – (Рус., Engl.). – London, 2005. – P.329-335.
3. Международные конференции, в организации которых отдел принимал наиболее активное участие
- Две международные конференции «El'Manuscript – Современные информационные технологии и письменное наследие: от древних текстов к электронным библиотекам» (Казань: 25-30 авг. 2008 / Уфа: 25-28 окт. 2010);
- Серия XI-XIII международных конференций «Когнитивное моделирование в лингвистике» (Констанца, Румыния: 7-14 сент. 2009 / Дубровник, Хорватия: 7-14 сент. 2010 / Корфу, Греция: 22-29 сент. 2011).
4. Сведения о руководителе направления, профессоре В.Д.Соловьёве
Руководитель научной группы, проф. В.Д.Соловьёв, является автором ряда трудов в области дискретной математики и теории вычислимости, соавтором решений, вошедших в анналы математической логики и в учебники по данной дисциплине. В настоящее время В.Д.Соловьёв занимается когнитивными и квантитативными исследованиями с использованием лингвистических данных. Хобби: проф. В.Д.Соловьёв имеет звание гроссмейстера игры Го (Бадук) и является многократным чемпионом Европы в командном зачёте.
Некоторые факты о профессоре В.Д.Соловьёве:- Первый человек в Татарстане и один из немногих в России, удостоенных звания «Man of the Year – Человек года» по версии Американского биографического института (ABI, Вашингтон, США) в 2002 году, в одном ряду с такими соотечественниками как художники Никас Сафронов (в 2004 году) и Флориан Юрьев (в 2000 году), скуптор Зураб Церетели (в 1996 году), композитор Михаил Марутаев (в 1995 году), физики Автандил Ануашвили (в 2005 году), Михаил Доломатов (в 2011 году), Игорь Шаманин (в 2012 году), Негмат Низамов (в 2012 году), химик Анатолий Авдеенко (в 2010 году), конструктор Владимир Уткин (в 2001 году), фармаколог Михаил Бушма (в 2010 году), микрохирург Владимир Байтингер (в 2010 году), стоматолог Мурат Букаев (в 2006 году), историки Юрий Афанасьев (в 2002 году) и Давид Зельвенский (в 2002 году), педогог Виктор Виноградов (в 2002 году), экономист Анатолий Ежов (2012), актёр Владимир Кулич (в 2010 году) и др.;
- Главный редактор международного электронного журнала «Web Journal of Formal, Computational and Cognitive Linguistics»;
- Член экспертного совета РФФИ;
- Гроссмейстер игры Го (Бадук), имеет 6 дан;
- Третий призёр чемпионатов Европы по игре Го в 1988–1989 гг, чемпион Европы в составе сборной СССР и России в 1988, 1990, 2001 гг., чемпион России в 1987 г.;
- Главный тренер сборных команд России по игре Го до 1994 г.;
- Президент РФГ (Российской Федерации игры Го) в период 1994–1997 гг., почётный член РФГ.