Цзинь Ифан
-
Развитие межъязыковых больших данных и корпуса китайского языкаВестник Московского Университета. Серия 22. Теория перевода. 2018. № 3. c.44-50подробнее832
-
В данной статье рассматриваются межъязыковые большие данные, которые в последние годы привлекли внимание китайских и россий ских исследователей. Исследуются платформа анализа межъязыковых больших данных YeeSight и создание корпуса китайского языка. Цель статьи — рассмотреть преимущества и недостатки платформы YeeSight и продемонстрировать развитие корпуса китайского языка в последние годы. Основное внимание уделено выяснению и описанию основного на бора тэгов частеречной разметки корпусов китайского языка.
Ключевые слова: межъязыковые большие данные, платформа YeeSight, создание корпуса китайского языка
-
-
Корпуса межъязыковых больших данных и переводВестник Московского Университета. Серия 22. Теория перевода. 2019. № 1. c.3-14подробнее902
-
Корпуса больших данных на сегодняшний день являются универсальным средством обработки, анализа и поиска необходимой информации. Если раньше для проведения научных исследований требовалось проделать большой объём работы: подобрать материал, проанализировать и обработать большие текстовые объёмы с целью выявления некоторых языковых закономерностей, то в настоящее время благодаря методам компьютерного анализа текста значительно сокращается время на работу и обработку объёма полученных данных. Кроме того, компьютерный анализ текста помогает избежать неточностей и ошибок в подсчётах, способствует установлению языковых закономерностей, основанных не на теоретических, а на эмпирических данных. Благодаря использованию технических средств происходит формирование новых межъязыковых корпусов, что представляет собой сложную задачу, часто с множественными проблемами.
Ключевые слова: перевод, переводческие технологии, межъязыковые большие данные.
-