Развитие межъязыковых больших данных и корпуса китайского языка

Цзинь И. (МГУ имени М.В.Ломоносова)

Аннотация

В данной статье рассматриваются межъязыковые большие данные, которые в последние годы привлекли внимание китайских и россий ских исследователей. Исследуются платформа анализа межъязыковых больших данных YeeSight и создание корпуса китайского языка. Цель статьи — рассмотреть преимущества и недостатки платформы YeeSight и продемонстрировать развитие корпуса китайского языка в последние годы. Основное внимание уделено выяснению и описанию основного на бора тэгов частеречной разметки корпусов китайского языка.

Литература

Гарбовский Н.К. Теория перевода. М.: Издательство Московского университета, 2004. С. 10.

Перцов Н.В. О роли корпусов в лингвистических исследованиях // Труды международной конференции «Корпусная лингвистика–2006». СПб.: Издво С.Петерб. унта, 2006. 319 с.

Садовничий В.А. Большие данные в современном мире. Доклад. М., 2017. 4 с.

Levy S. In the plex. How Google thinks works and shapes our lives M. Simon and Schuster, 2011. 51 p.

Mayer-Schönberger. Big Data: A Revolution Tat Will Transform How We Live, Work, and Tink Viktor, 2012. 33 p.

Min Chen, Shiwen Mao, Yin Zhang, Victor C.M. Leung. Big Data. Related Technologies, Challenges, and Future Prospects. Spinger. 2014. 4 p.

Yu Yang. Yeesight, Big Data EcosystemGTCOM, 2014. 14 p.

Скачать в формате PDF

Поступила: 01.09.2018

Принята к публикации: 01.10.2018

Дата публикации в журнале: 30.10.2018

Ключевые слова: межъязыковые большие данные, платформа YeeSight, создание корпуса китайского языка

Доступно в on-line версии с: 30.12.2018

Для цитирования статьи:

Цзинь И. Развитие межъязыковых больших данных и корпуса китайского языка. // Вестник Московского Университета. Серия 22. Теория перевода. 2018. № 3. c.44-50