Компьютерную программу по борьбе с плагиатом создали новосибирские учёные
Разработчики ─ интернациональная команда ученых из Новосибирска, Китая и Эфиопии. В основе ─ аппарат математической статистики. Программа учитывает множество параметров текста, к примеру, частоту букв, слов, их сочетание; выявляет закономерности, затем особым образом обрабатывает текст и делает вывод, кто автор. Разработчики научили ее распознавать разные языки: русский, английский, китайский и амхарский, на котором говорят в Эфиопии. Минимальный необходимый объем для лингвистической детективной работы ─ четыре килобайта ─ примерно две страницы русскоязычного текста. Это инвариант для всех языков, пояснил профессор факультета информационных технологий НГУ Борис Рябко.
Сюжеты с поиском автора, порой, бывают лихо и неожиданно закручены. К примеру, историки и лингвисты не раз спорили о принадлежности ряда произведений перу Шекспиру. Немало загадок скрывает и отечественная литература. Так, одну тайну команда Бориса Рябко уже разгадала: ученые доказали авторство некоторых текстов середины XIX века, которые были опубликованы в литературном журнале Николая Некрасова.
Для обучения программы разработчики использовали тексты известных авторов из классической художественной литературы. Если говорить о текстах на русском языке, среди авторов были такие известные имена, как Достоевский, Чехов, Булгаков, Пушкин.
В перспективе программа может применяться в борьбе с плагиатом, в научной диссертации распознавать отрывки текстов других авторов и даже куски, сгенерированные искусственным интеллектом. А еще программа подскажет, насколько хорош тот или иной перевод, в том числе машинный.
«При переводе с одного языка на другой переводчики должны сохранять авторский стиль, и чем точнее он передан, тем лучше переводчик», ─ рассказал соавтор разработки, аспирант НГУ (Эфиопия) Йешевас Гетачеу Лулу.
Пока возможности программы ограничены количеством авторов, на которых она была обучена. Но ученые доказали главное: их литературно-детективный метод работает.