Развитие межъязыковых больших данных и корпуса китайского языка
Аннотация
В данной статье рассматриваются межъязыковые большие данные, которые в последние годы привлекли внимание китайских и россий ских исследователей. Исследуются платформа анализа межъязыковых больших данных YeeSight и создание корпуса китайского языка. Цель статьи — рассмотреть преимущества и недостатки платформы YeeSight и продемонстрировать развитие корпуса китайского языка в последние годы. Основное внимание уделено выяснению и описанию основного на бора тэгов частеречной разметки корпусов китайского языка.
Литература
Гарбовский Н.К. Теория перевода. М.: Издательство Московского университета, 2004. С. 10.
Перцов Н.В. О роли корпусов в лингвистических исследованиях // Труды международной конференции «Корпусная лингвистика–2006». СПб.: Издво С.Петерб. унта, 2006. 319 с.
Садовничий В.А. Большие данные в современном мире. Доклад. М., 2017. 4 с.
Levy S. In the plex. How Google thinks works and shapes our lives M. Simon and Schuster, 2011. 51 p.
Mayer-Schönberger. Big Data: A Revolution Tat Will Transform How We Live, Work, and Tink Viktor, 2012. 33 p.
Min Chen, Shiwen Mao, Yin Zhang, Victor C.M. Leung. Big Data. Related Technologies, Challenges, and Future Prospects. Spinger. 2014. 4 p.
Yu Yang. Yeesight, Big Data EcosystemGTCOM, 2014. 14 p.
Поступила: 01.09.2018
Принята к публикации: 01.10.2018
Дата публикации в журнале: 30.10.2018
Ключевые слова: межъязыковые большие данные, платформа YeeSight, создание корпуса китайского языка
Доступно в on-line версии с: 30.12.2018