Линки доступности

«Дело Коробковой – это классический кейс, когда преступник приходит на место преступления в маске»


Даниил Скоринкин, компьютерный лингвист (фото из личного архива Д. Скоринкина)
Даниил Скоринкин, компьютерный лингвист (фото из личного архива Д. Скоринкина)

Интервью Даниила Скоринкина, соавтора расследования о доносчице «Анне Коробковой», корреспонденту «Голоса Америки»

Антрополог Александра Архипова опубликовала пост в Facebook о том, что ей удалось вычислить человека, скрывающегося под именем Анны Коробковой. Начиная с февраля 2024 года от ее имени были написаны сотни доносов на российских правозащитников, ученых, журналистов и других людей, выступавших против российского вторжения в Украину или дававших комментарии СМИ-«иноагентам» и «нежелательным организациям».

«Коробкова» обращалась в различные органы власти и правоохранительные органы, а также напрямую к своим жертвам. Известно о случаях, когда после ее доносов люди получали статус «иностранного агента».

По результатам собственного расследования, Александра Архипова утверждает, что под именем Анны Коробковой скрывался журналист из Екатеринбурга Иван Абатуров. Эту версию подтвердили журналисты Русской службы Би-би-си. Сам Абатуров сказал журналистам, что они «ошиблись», но по существу расследование не прокомментировал (подробнее о его реакции — тут).

Вместе с Архиповой это расследование вел компьютерный лингвист из университета Потсдама в Германии Даниил Скоринкин. В интервью Русской службе «Голоса Америки» он рассказал о том, как шло расследование, как по стилистическим маркерам можно разгадать автора текста и какие зацепки привели к деанонимизации Абатурова.

Голос Америки: Вы – компьютерный лингвист. Что это значит? Как ваша специальность пригодилась в расследовании?

Даниил Скоринкин: Я занимаюсь автоматической обработкой текста. Компьютерные лингвисты делают всякие штуки, связанные с автоматической обработкой естественного языка, с тем, что происходит внутри поисковика, внутри машинного перевода, внутри ChatGPT – все, что находится на стыке информатики и естественного языка. Когда компьютеру нужно обрабатывать естественный язык, есть моменты, где требуется компьютерная лингвистика.

– Александра Архипова написала, что в расследовании вы использовали метод стилометрии. Что это такое?

Это как раз довольно простой метод анализа текстов. В какой-то момент ученые чисто эмпирически выяснили, что частотности самых частотных слов, если их взять не по отдельности, а все вместе, они содержат в себе некоторые элементы авторского сигнала. Например, если анализировать сто разных романов, то это будут слова типа «и», «в», «на» и прочие служебные слова, союзы, предлоги и междометия

Это очень техническая вещь. Если мы сравниваем людей, которые пишут более-менее в одном жанре, более-менее в одно время, и у нас нет других искажений, то оказывается, что я могу взять пять романов Толстого и пять романов Достоевского, вы завяжете мне глаза, и я смогу их отличить друг от друга по частностям ста самых частотных слов. То есть не я, а компьютер.

По совокупности, наибольший вклад в анализ вносят именно такие служебные слова. Вероятно, причина в том, что они отражают некоторые особенности индивидуального стиля. Я не задумываюсь, говорю я «о чем-то» или «про что-то». Есть какая-то вариативность в том, как я строю фразы, какой у меня синтаксис, какие у меня предпочтительные обороты с конкретными союзами.

И вот оказывается, что на большом объеме текста эти штуки не то, чтобы совсем индивидуальны, но они отличают одного автора от другого.

– Но поймали вы «Коробкову» не на таких словах? То есть, тут не было чего-то специфического?

Я бы вообще сказал, что поймали ее не на лингвистике. Это такой классический кейс, когда преступник приходит на место преступления в маске. Ключевой вещью, которая позволила поймать Коробкову/Абатурова, стало то, что он сам пришел и написал вики-статью про Коробкову же. Он для этого сделал новый аккаунт в Википедии, но люди, которые помогали Саше [Архиповой] со стороны Википедии, догадались посмотреть, кто из активных википедистов перестал в этот момент писать.

Анализ текста помог его немножко лучше пригвоздить, есть очень хорошие зацепки. Но ключевой момент, который позволил выцепить именно Абатурова и связать его с «Коробковой», вообще был не лингвистический. Он был связан с метаданными Википедии и с тем, что Абатуров пришел на место преступления и решил написать статью про себя.

Если бы даже тут не было никакой стилометрии и лингвистики, все равно эта статья выглядела бы подозрительно. Этот клубок все равно начали бы распутывать – кто ее написал и что мы про него знаем – и вышли бы на Абатурова. Конечно, лингвистическая составляющая здесь интересна, и она добавляет аргументов. Меня лично она убеждает. Даже лингвистикой мы его можем пригвоздить. Но именно тот момент, когда стало понятно, куда смотреть, он не про язык все-таки.

– С чего для вас началось расследование? Как вы к нему присоединились?

Я познакомился с Сашей больше года назад. Мы преподавали в одной школе. Она вела, как водится у Саши, антропологию, а я рассказывал как раз про количественные методы определения авторства, про стилометрию. Это не то, чтобы моя основная специальность, но это были занятия для школьников, и мне показалось, что для школьников это что-то такое интересное и детективное.

И Саша как-то очень уцепилась за это. Я слышал про «Коробкову» и раньше, но Саша сказала: вот смотри – я с ней переписываюсь, и другие люди с ней переписываются, вот у нас есть целый корпус. Изначальная идея была попробовать понять: один это человек или несколько.

Гипотеза была в том, что за этим может стоять отдел ФСБ. Мы задались вопросом – а что, если выяснится, что эти тексты подписаны Коробковой, но на самом деле хорошо кластеризуются на трех разных людей? Я покрутил какие-то эксперименты и ничего такого не увидел. Мне показалось – ну, не похоже, что это разные люди.

В процессе я немножко загрустил, поскольку у нас не было никаких зацепок. И я просто сел и решил: дай-ка я их просто почитаю и посмотрю, какие там есть интересные, цепляющие приметы стиля. И я понял, что стиль очень приметный.

И Саша это тоже поняла, мы с ней параллельно в этот момент двигались. Я говорю: она [Коробкова] пишет, как будто это бюрократический стиль, доведенный до абсурда, как будто читаешь Зощенко. Там есть какие-то потрясающие нагромождения причастных оборотов, нагромождения придаточных предложений: который X, который Y — вот эти цепочки из «которых».

Я сначала думал, что это юмористическое сгущение бюрократического стиля: «действия президента, которые привели к дискредитации специальной военной операции» — вот это все. Но на этом все заглохло.

У меня сохранился документик с интересными приметами языка Коробковой. У нас была гипотеза, что письма пишут одни люди, а доносы другие. Но как раз эти яркие приметы были и в письмах, и доносах. И стало понятно, что это один человек пишет и письма, и доносы.

Летом мы на этом остановились. А потом мне пишет Саша и говорит: «Смотри, есть статья в Википедии про Коробкову. Можешь ли ты стилометрически посмотреть на нее, насколько она близка?».

Я смотрю, она действительно выглядит довольно близкой к письмам. Но это меня не убеждает, потому что она не очень длинная, для стилометрии нужны большие тексты, лучше всего это работает на романах.

Но я начинаю читать эту статью и понимаю, что это тот же самый стиль. Эти прекрасные бюрократические обороты, типа «со слов Коробковой известно, что данное лицо проживает в городе-миллионнике». Но нормальный человек скажет: «Она проживает»! Первое же предложение в этой вики-статье начиналось с фразы «...который… который…» Сейчас уже переписали эту статью, теперь она посвящена Абатурову, а не Коробковой.

Википедисты – быстрые люди, они уже забанили Абатурова навечно. Пользователь под ником «Аркадий2023», который написал статью, довольно быстро идентифицируется с Иваном Абатуровым. И это, по-моему, самое надежное звено в расследовании. Совпадает марка фотоаппарата, статьи в Википедии, которые редактировали Аркадий2023 и Абатуров.

– В расследовании Би-би-си говорится, что Абатуров пользуется очень редкой маркой фотоаппарата, которой практически нет в России. Это какая-то уникальная камера?

Ну, у кого вообще в России остался фотоаппарат? Я в последний раз держал в руках цифровой фотоаппарат, который не был бы интегрирован в смартфон, лет десять назад. Думаю, в России есть условно тысяча людей, которые снимают на такие камеры. В принципе, в Википедии есть фотографии, загруженные людьми с такого фотоаппарата, но всего два из них находятся в России. Один — это «Аркадий2023», а второй — это Иван Абатуров.

Мы видим, что фото загружено с одного фотоаппарата, и совпадают многие другие вещи. «Аркадий2023» редактировал статьи про акции «Стратегии-6» в Екатеринбурге. Это такая местная акция протеста, и про нее всегда писал в Викиновости только Иван Абатуров. У него есть полтора десятка репортажей про эту «Стратегию-6». И если мы сейчас посмотрим в Википедии, кто редактировал статьи в новостях про «Стратегию-6», окажется, что это был человек под ником «Аркадий2023».

– Что теперь будет со статьями, которые редактировал Абатуров? Они подвергнутся какой-либо проверке?

Мне это тоже очень интересно. У меня есть список этих статей, и если вдруг с ними что-то случится, у меня они все равно останутся для исследования. Это вопрос к вики-сообществу, частью которого я не являюсь. Там очень активная, бурная жизнь. Русская Википедия – огромное сообщество, в некотором смысле гордость нашей свободной интеллектуальной науки. Там идет большое обсуждение сейчас по Абатурову.

Я так понимаю, что они решили его забанить, в том числе его альтернативные аккаунты. Человек в принципе честно писал вики-репортажи. На мой взгляд, он несколько абьюзил эту систему, потому что некоторые его вики-репортажи напоминают личные жалобы. Он там пишет: «корреспондента Викиновостей избили на таком-то мероприятии» – и имеет в виду себя. С другой стороны, по-моему, он единственный активный вики-репортер из Екатеринбурга.

– В вики-статьях, которые Абатуров писал или редактировал, прослеживается ли его политическая позиция?

Его политическая позиция совершенно четко прослеживается в выборе тем и в том, с какого угла он эти темы освещает. Одна из тем, которые он любит, – это всяческое доносительство. Например, у него есть статья, которую он назвал как-то вроде «Евросоюз предложил шесть критериев хорошего доносчика».

Очень тенденциозная подача этой новости. Действительно была новость о том, как некоего европейского гражданина вознаградили за вистлблоуинг. Это очень в его духе, у него есть идея, что доносительство — это такая общественно полезная функция, лучше всего это работало при Сталине, и вот сейчас хорошо бы вернуть так, как было тогда.

Он себя видит неким миссионером в этом смысле. С другой стороны, он, например, очень любит тему коммунальных платежей и всякого рода попыток от них освободиться. Он пишет про всякие суды на эту тему, и известно, что сам он тоже пытался не платить коммунальные платежи и судился по этому поводу.

Сами поводы часто были связаны с ним лично. Есть новости из серии «"Яндекс район" отмодерировал статью корреспондента Викиновостей о встрече с гадюкой без объяснения причин». По сути, он написал заметку, инфоповодом для которой стало то, что «Яндекс район» удалил его пост. Это очень смешно!

И очевидно, сталинская эпоха его очень интересует. Он писал, что в Екатеринбурге пустили поезд с портретом Сталина. Это опять же отражает его личный интерес.

Я прямо сейчас смотрю на текст этой новости, она у меня не вызывает какого-то ощущения адской пропаганды, по сравнению с z-телеграмами, к которым мы все привыкли за эти 2,5 года. Тут все написано практически по учебнику журналистики, очень спокойно.

Там есть какие-то нотки типа «возмущения Сталин не вызвал, никаких недовольных высказываний корреспондент Викиновостей от участников форума не слышал. Наоборот, некоторые пассажиры с видимым удовольствием фотографировались у портрета Сталина». Видно, что ему [Абатурову] нравится происходящее, но он не Дмитрий Медведев.

Ну и плюс его любовь/ненависть к мероприятиям Ельцин-центра, на которые он многократно ходил. На чем он отчасти и спалился. Потому что «Аркадий2023» загрузил довольно много фотографий мероприятий Ельцин-центра, на которых, мы точно знаем, был Абатуров, потому что там была видеосъемка, и его просто видно. Вот он пишет: корреспондент Викиновостей посетил две секции в Ельцин-центре и увидел, что на форуме обучают «стулья». Он пишет, что около половины мест в зале пустые.

– Тут довольно явно видно мнение автора...

Там нет какой-то z-шизы, он все-таки в Викиновостях старался держаться видимости того, что он наблюдатель. Более того, позиция наблюдателя доведена до абсурда! Он однажды написал репортаж о суде над собой и описал себя в третьем лице: корреспондент Викиновостей сходил на суд, не уточнив, что на суд он ходил в роли обвиняемого. У него была идея, что он сейчас корреспондент, и он отстраняется. Может быть, он так научился раздвоению личности, а потом создал «Коробкову»? – Я не знаю. Это уже вопрос к психотерапевтам.

Мне кажется, он видит себя общественным журналистом, ревизором, и ощущает некоторую миссию, в связи с чем старается очень официально выражаться.

– Русская служба Би-би-си сравнила IP-адреса «Аркадия2023» и Абатурова, и пришла к выводу, что это один и тот же адрес. Вы в своем расследовании их не сверяли?

Я такое не умею. Эту часть делали Би-би-си в программе «Глаз Бога». Там есть адреса, которые, судя по всему, были в какой-то момент выделены провайдером конкретно в квартиру или домовой стояк. Опять же, я плохо понимаю, как устроена архитектура сети в Екатеринбурге, но, очевидно, этот адрес был достаточно статичным и через него ходили письма только с одного компьютера, с двух почтовых ящиков - Анны Коробковой на list.ru и Ивана Абатурова на rambler.ru.

– Выбраны исключительно российские почтовые хостинги?

Мне кажется, Иван Абатуров вообще завязан на российские сервисы. У него очень живой ВК. Я его скачал, читал и исследовал довольно долго.

Первое, что меня удивляет – он не закрыл ВК, хотя он уже очевидно в курсе всей этой истории. До него уже несколько раз дозвонились, и его ВК по-прежнему остается открытым. Раньше он писал туда оригинальные тексты. Сейчас репостит свои материалы из других СМИ.

Последнее – от пятого сентября. Это ссылка на его материал в «Вечерних ведомостях», где он был внештатным автором, про японского генерала. Его сначала осудили в Советском Союзе в 50-е, потом реабилитировали в 90-е, а сейчас Абатуров добился своими бесконечными жалобами в прокуратуру, чтобы его дереабилитировали.

– Вы пытались связываться с Абатуровым?

Я лично нет, я оставил это журналистам. Я знаю, что ему звонила журналистка Би-Би-Си, он не ответил. До него достучались ребята из «Вечерних ведомостей», потому что они имеют с ним более теплый контакт. Он сказал: «Я сейчас не хочу это комментировать, пусть уляжется пена».

– Как вам кажется, эта история повлияет на него?

Я даже не знаю. Я не знаток человеческих душ, я больше количественным анализом его текстов занимался. Ну, надеюсь, на какой-то момент ему станет неуютно. Судя по всему, ему не очень удобно писать доносы под своим именем, он ведь начинал. Это тоже стало одним из важных факторов расследования: у нас есть доносы, которые Иван Абатуров написал от своего имени, и доносы, которые он написал от имени Коробковой. И они просто близнецы-братья.

Вот это Саша Архипова блестяще показала. Там все вот эти его магические формулы про то, что он «против любой дискриминации», «против любой дискредитации», «против любой вражды». И эта, по-моему, потрясающая симметрия очень хорошо его выдает. Мы знаем, что после того, как случился скандал с одним из его ранних доносов, написанных под своим именем на издательство «Нестор-История», он решил писать доносы под чужим именем.

Значит, ему мешает та публичность, которую ему придал первый скандал с доносами. Я надеюсь, что сейчас ему тоже это отчасти помешает. При этом, естественно, у меня нет никаких иллюзий, что он одумается, исправится, вступит на путь истинный, эмигрирует в Казахстан и станет оппозиционным журналистом.

Может быть, он не будет больше заниматься публичным сопровождением доносительства. Ведь все, что мы про него знаем, стало известным благодаря его собственному тщеславию и его собственному желанию сделать личность «Коробковой» публичной. В этом не было совершенно никакой необходимости.

Опять же, он спалился на том, что загрузил в Википедию документы, которые Коробкова лично получала от Генпрокуратуры и нигде публично не появлялись. Точно также можно придумать какую-нибудь очередную Светлану Михайловну Иванову и от ее имени, и от имени озабоченной общественности, писать доносы в прокуратуру, просто ничего об этом не говоря.

Возможно, он потеряет пару друзей, которые имели на его счет какие-то иллюзии, и ему будет менее комфортно выходить на улицу в Екатеринбурге, поскольку мы знаем, что это город свободолюбивый, и протестная активность даже сейчас иногда бывает в этом городе.

Но боюсь, что до радикальной трансформации политического режима в России для него мало что поменяется. Ну и в Википедию, наверное, не сможет писать.

– А лично вам что дало участие в этом расследовании?

– Ну, во-первых, мне было интересно, я все-таки исследователь, у меня есть склонность к любопытству, к разгадыванию загадок. Во-вторых, когда занимаешься довольно отвлеченной наукой, в какой-то момент можешь терять чувство, зачем это все нужно.

Ну да, я выступил на конференции перед еще пятью людьми, которым это тоже интересно. Немножко свою релевантность теряешь. У меня это особенно обострено, потому что до войны я преподавал в России, а теперь не преподаю и живу в эмиграции. Хочется делать вещи, про которые понятно, что это кого-то волнует.

Вот я сегодня весь день ощущаю, что это кого-то волнует. Для меня это было такое интеллектуальное приключение. Мой мотив исключительно такой — это приключения духа.

На вопрос корреспондента Би-би-си о том, действительно ли он пишет доносы под именем «Анны Коробковой», Абатуров ответил во ВКонтакте: «Здравствуйте. Вы ошиблись». После этого он перестал отвечать на сообщения, дозвониться до него не удалось.

В беседе с изданием из Екатеринбурга «Вечерние ведомости» Абатуров сказал, что не будет давать комментарии СМИ, признанным в России иноагентами. Он не прокомментировал расследование по существу, но сказал, что «коротко я на этот вопрос уже ответил: «Вы ошиблись». Я не вижу никакого смысла публиковать длинный ответ».

Форум

XS
SM
MD
LG