The approach to the decision of a problem of plagiarism search in different languages
Наукові журнали Національного Авіаційного Університету
View Archive InfoField | Value | |
Title |
The approach to the decision of a problem of plagiarism search in different languages
Подход к решению проблемы поиска плагиата на разных языках Підхід до рішення проблеми пошуку різномовного плагіату |
|
Creator |
Ланде, Д. В.; Інформаційний центр «Електронні вісті»
Жигало, B. B.; Інформаційний центр «Електронні вісті» |
|
Subject |
—
УДК 004.912:82-995 — УДК 004.912:82-995 — УДК 004.912:82-995 |
|
Description |
The approach to search of documents duplicates (or their parts), submitted on different languages is described. In a basis of the approach use of frequency morphological dictionaries, and also dictionaries of translations is necessary. Search of duplicates is spent by supporting of the selected basic words which are determined with the help of empirical and statistical rules, uses of frequency dictionaries and their translations. The given approach is realized in content-monitoring system InfoStream. Also as a result of duplicates search procedure realizationthe bilingual parallel corpus of documents has been created
Описан подход к поиску дубликатов документов (или их частей), представленных на разных языках. В основу подхода положено использование частотных морфологических словарей, а также словарей переводов. Поиск дубликатов проводится с помощью выделенных опорных слов, которые определяются с помощью емпирико-статистических правил, использования частотных словарей и их переводов. Данный подход реализован в системе контент-мониторинга InfoStream. Также в результате реализации процедуры поиска дубликатов был создан двуязычный параллельный корпус документов Описано підхід до пошуку дублікатів документів (або їх частин), наведених різними мовами. В основу підходу покладено використання частотних морфологічних словників, а також словників перекладів. Пошук дублікатів проводиться за допомогою виділени опорних слів, які витягаються за допомогою емпірико-статистичних правил, використання частотних словників та їх перекладів. Даний підхід реалізовано в системі контент-моніторингу InfoStream. Також у результаті виконання процедури пошуку дублікатів було створено двомовний паралельний корпус документів |
|
Publisher |
Національний авіаційний університет
|
|
Contributor |
—
— — |
|
Date |
2008-06-01
|
|
Type |
—
|
|
Format |
application/pdf
application/pdf |
|
Identifier |
http://jrnl.nau.edu.ua/index.php/PIU/article/view/6801
|
|
Source |
Problems of Informatization and Management; Том 2, № 24 (2008); 125-129
Проблемы информатизации и управления; Том 2, № 24 (2008); 125-129 Проблеми iнформатизацiї та управлiння; Том 2, № 24 (2008); 125-129 |
|
Language |
uk
|
|