Как мы ищем плагиат
Мы не скрываем свои алгоритмы. Узнайте шаг за шагом, как наша система анализирует смысл предложений, находит скрытый рерайт и следы нейросетей.
Этап 1: Синтаксис
Метод шинглов
Поиск жесткого копипаста. Разбиваем текст на пересекающиеся цепочки по 4 слова и ищем их в 50+ миллионах документов.
Этап 2: Семантика
Векторный анализ
Детектор рерайта. Превращаем абзацы в математические координаты (эмбеддинги), чтобы понять, была ли украдена сама мысль.
Этап 3: Происхождение
Детектор генерации (AI)
Анализ ритма текста (Burstiness) и предсказуемости (Perplexity) для выявления следов ChatGPT и других нейросетей.
Этап 4: Вердикт
Математика оценки
Как мы взвешиваем нарушения. Почему за точный копипаст мы штрафуем сильнее, чем за рерайт, и как отфильтровываем «воду».