Record Details

The approach to the decision of a problem of plagiarism search in different languages

Наукові журнали Національного Авіаційного Університету

View Archive Info
 
 
Field Value
 
Title The approach to the decision of a problem of plagiarism search in different languages
Подход к решению проблемы поиска плагиата на разных языках
Підхід до рішення проблеми пошуку різномовного плагіату
 
Creator Ланде, Д. В.; Інформаційний центр «Електронні вісті»
Жигало, B. B.; Інформаційний центр «Електронні вісті»
 
Subject
УДК 004.912:82-995

УДК 004.912:82-995

УДК 004.912:82-995
 
Description The approach to search of documents duplicates (or their parts), submitted on different languages is described. In a basis of the approach use of frequency morphological dictionaries, and also dictionaries of translations is necessary. Search of duplicates is spent by supporting of the selected basic words which are determined with the help of empirical and statistical rules, uses of frequency dictionaries and their translations. The given approach is realized in content-monitoring system InfoStream. Also as a result of duplicates search procedure realizationthe bilingual parallel corpus of documents has been created
Описан подход к поиску дубликатов документов (или их частей), представленных на разных языках. В основу подхода положено использование частотных морфологических словарей, а также словарей переводов. Поиск дубликатов проводится с помощью выделенных опорных слов, которые определяются с помощью емпирико-статистических правил, использования частотных словарей и их переводов. Данный подход реализован в системе контент-мониторинга InfoStream. Также в результате реализации процедуры поиска дубликатов был создан двуязычный параллельный корпус документов
Описано підхід до пошуку дублікатів документів (або їх частин), наведених різними мовами. В основу підходу покладено використання частотних морфологічних словників, а також словників перекладів. Пошук дублікатів проводиться за допомогою виділени опорних слів, які витягаються за допомогою емпірико-статистичних правил, використання частотних словників та їх перекладів. Даний підхід реалізовано в системі контент-моніторингу InfoStream. Також у результаті виконання процедури пошуку дублікатів було створено двомовний паралельний корпус документів
 
Publisher Національний авіаційний університет
 
Contributor


 
Date 2008-06-01
 
Type
 
Format application/pdf
application/pdf
 
Identifier http://jrnl.nau.edu.ua/index.php/PIU/article/view/6801
 
Source Problems of Informatization and Management; Том 2, № 24 (2008); 125-129
Проблемы информатизации и управления; Том 2, № 24 (2008); 125-129
Проблеми iнформатизацiї та управлiння; Том 2, № 24 (2008); 125-129
 
Language uk
 

Технічна підтримка: НДІІТТ НАУ