Как мы ищем плагиат
Здесь нет скрытых алгоритмов и «черных ящиков». Узнайте шаг за шагом, по каким принципам проверяется смысл предложений, как обнаруживается скрытый рерайт и распознаются следы нейросетей.
Метод шинглов
Поиск жесткого копипаста. Разбиваем текст на пересекающиеся цепочки по 4 слова и ищем их в 50+ миллионах документов.
Векторный анализ
Детектор рерайта. Превращаем абзацы в математические координаты (эмбеддинги), чтобы понять, была ли украдена сама мысль.
Детектор генерации (AI)
Анализ ритма текста (Burstiness) и предсказуемости (Perplexity) для выявления следов ChatGPT и других нейросетей.
Математика оценки
Как мы взвешиваем нарушения. Почему за точный копипаст мы штрафуем сильнее, чем за рерайт, и как отфильтровываем «воду».