Выборы – 2016: испытание математической статистикой
БОРОДАТЫЕ ВЫБОРЫ С ХВОСТОМ
19.09.2016
У "Единой России" – 40% при явке в 37%, согласно статистическому анализу и экспертной оценке Сергея Шпилькина
Сергей Шпилькин, независимый электоральный аналитик, с 2007 года математическими методами исследует официальные результаты голосования в России и обнаруживает странные отклонения, которые лучше всего объясняются подтасовками и вбросами.
Шпилькин – выпускник физфака МГУ, лауреат премии "ПолитПросвет" 2012 года – так описывает, почему начал заниматься статистическим анализом результатов выборов: "На выборах 2007 года, услышав несколько чисел, мысленно построил по ним кривую, получил прямую, а дальше сработал эффект полковой лошади, которая при звуке трубы рвется в бой. Набрал точек, построил графики, начал на них смотреть". Шпилькин гордится открытым им понятием "бороды Чурова", о котором мы будем говорить позже. В интервью Радио Свобода он рассказал об используемом им методе статистического анализа и о том, к каким выводам это приводит на нынешних выборах:
– Результаты нынешних выборов в Госдуму были сфальсифицированы на уровне думских и президентских выборов 2011, 2008 и 2007 годов, наиболее фальсифицированных за постсоветскую историю, насколько ее можно проследить, анализируя подобные данные, то есть примерно с 1996 года. На этих выборах, по моим оценкам, масштаб фальсификаций в пользу "Единой России" составляет примерно 12 миллионов голосов. Это меньше, чем на выборах 2011 года. Но на выборах 2011 года была более высокая явка. Поэтому с точки зрения влияния на конечный результат это примерно сравнимо. По моим оценкам, без фальсификаций "Единая Россия" получила бы примерно 40% по федеральному списку вместо 54,2%, которые сейчас заявлены на сайте ЦИК по результатам подсчета 108,9 млн зарегистрированных избирателей.
– Как с помощью статистики можно выявить масштабы фальсификаций? Правильно я понимаю, что главным инструментом является соотнесение явки на отдельных участках с голосами, поданными на этих участках за различные партии?
– Именно так. И базовый факт состоит в том, что, на самом деле, явка – вещь очень стабильная и мало зависящая от региона. У нас очень однородная страна. На этих выборах это хорошо заметно, потому что из-за низкой явки этот главный пик голосования выделился вокруг типичной явки в 36% и стоит отдельной вершиной, слева от фальсификата (см. график ниже). Самый дешевый способ фальсификации, технически дешевый в смысле затрат и интеллектуальных усилий со стороны фальсификаторов, – это просто добавление голосов в пользу нужной партии или нужного кандидата. А добавление голосов ведет к тому, что явка смещается от типичного значения в большую сторону. И у нее вырастает такой правый хвост. Размер этого хвоста довольно элементарным образом пересчитывается в количество добавленных голосов. Характерная особенность этих выборов в том, что, кажется, здесь почти не применялось перекидывание голосов от одной партии к другой. Может быть, это благотворное действие Эллы Памфиловой (новый председатель ЦИК, сменившая на этом посту Владимира Чурова. – РС), может быть, еще что-то. Потому что перекидывание голосов труднее распознается. Но в этот раз ситуация выглядит так, будто это чистый вброс.
– Я правильно понимаю, что вы рисуете график, на котором внизу – явка, и на участках с одинаковой явкой вы смотрите, сколько было подано голосов за разные партии, и рисуете график? В принципе, распределение должно быть таким: есть пик наиболее популярной явки, и в обе стороны идет снижение. Но мы видим, что есть пик в районе 36%, потом идет снижение, а потом снова довольно резкий рост. И на участках, где очень высокая явка, как назло, все голосуют за "Единую Россию".
– Не то чтобы все, но подавляющее большинство. Чем выше явка, тем больше голосов подано за "Единую Россию". По "утиному принципу" – это выглядит как вброс, вычисляется как вброс.
– Что такое "утиный принцип"?
– Если нечто крякает как утка, ходит как утка и выглядит как утка, то это утка. Это классический принцип программирования.
– Давайте попробуем представить, что я функционер "Единой России" и пытаюсь найти контраргументы. Если я скажу: страна разнородная, есть места, где люди очень любят президента и правительство. Они мотивированы и ходят голосовать. И именно эти люди дают такой второй хвост.
– Тут возникает сразу два вопроса. Во-первых, субъектом голосования является все-таки не избирательный участок, а избиратель. А избирательный участок – это некоторое объединение избирателей, который их в каком-то смысле усредняет. Если бы у меня были избиратели двух типов – любящие "Единую Россию" и не любящие "Единую Россию", то они бы каким-то образом смешивались. А у меня между двумя типами голосования, наоборот, глубокий и довольно широкий провал. И выглядит это так, как будто субъектом является не избиратель, а участок. У нас участки делятся на два типа, а не избиратели. И такое несмешивание, такая сегрегация по двум типам голосования хорошо объясняется подтасовками. В 2011 году в Москве на том самом голосовании, которое вызвало протесты (на выборах в Госдуму. – РС), подобные участки встречались в одном районе, буквально в двух частях одного жилого комплекса.
В районе Раменки две симметричные половины коммерческого жилого комплекса, построенного женой Юрия Лужкова, голосовали: одна за "Единую Россию" – 30%, а другая – 70%. А в 2012 году все эти различия куда-то пропали, и все голосовали одинаково с совершенно однородной явкой и с очень однородным результатом, с точностью до объяснимых социологических различий. Я думаю, что в этом году (хотя пока разбираться в этом еще не было времени) таких примеров найдется очень много. По крайней мере, в предварительных результатах, например, в Кемеровской области, которая отличается редкостным уровнем фальсификаций с определенного времени, встречались участки, на одном из которых в полдень явка была 11%, а в соседнем – 68%. Если бы это дело было региональной особенностью, то тогда не было бы такого перемешивания. Результаты были бы однородны внутри региона. А опыт показывает, что в регионах с хвостами соседствуют участки с высокими и низкими результатами. В этот раз я, например, вижу, что в Мордовии, которая всегда показывала фантастические цифры явки и голосования, есть несколько участков с совершенно типичными среднероссийскими результатами явки и голосования за "Единую Россию". Будет интересно посмотреть, что это такое. Еще одна важная вещь. На этих выборах мы очень много знаем об избирательных участках, в том числе, например, из каких домов они состоят, сколько квартир в каждом доме. Это может быть полезно для дальнейшего глубокого анализа.
– А что дает такое знание?
– Это, например, дает знание о том, что этот участок не деревня, а город или что эти два участка похожи по составу домов. Если эти два участка состоят из пятиэтажек, то можно предполагать, что в них примерно одинаковое население, и для объяснения радикально разных, в два раза отличающихся результатов нужны будут дополнительные обоснования.
– И ваше объяснение, что там, где такая внезапно высокая явка, – это вбросы.
– Вбросы и приписки.
– Вы не учитываете такие регионы, как Чечня? Известно, что в Чечне, например, очень высокая явка и результаты, как правило, очень высокие. Это некая однородность. Там все такие участки, я думаю. Там нет соседних домов, где один так, а другой сяк. Может быть, что этот хвост дают такие регионы?
– Голосование в Чечне – вещь трудно наблюдаемая. Но есть, например, Дагестан, где похожие результаты. И в Дагестане в 2012 году люди сидели и отсматривали видеозаписи с камер на избирательных участках, просто считали избирателей, появляющихся в кадре, подходящих к урнам. Из этих видеозаписей видно, что явка в Дагестане на самом деле не 90% и не 80%, как она заявляется официально в протоколах, а где-то 38%, то есть ниже среднероссийской. И никакой однородности результатов там тоже нет. Про Чечню в этом смысле сказать что-нибудь труднее, потому что это очень закрытая территория. Про Чечню вообще трудно сказать что-нибудь, но время от времени на разных выборах в разных кавказских республиках точечно встречаются вполне среднемосковские результаты голосования. То ли это отдельные председатели избирательных комиссий принципиальные, то ли это какие-то районы, подчеркивающие свою автономию от центрального правительства. Но это всегда сохраняется. И позволяет хотя бы гипотетически говорить, что голосование в таких местах не очень отличается от среднероссийского. А то, что мы видим в официальных протоколах, – это скорее иллюзия. И тогда эти регионы действительно образуют хвост высокой явки, высокого голосования, но если их рассматривать на общероссийском фоне, то они дают вклад в ту же оценку лишних голосов. Да, это некоторая гипотеза, но это лучшее, что мы можем сделать с имеющимися данными.
– Вы строите некую математическую модель, с помощью которой оцениваете реальную ситуацию. С этим можно пойти в суд?
– Нет.
– Почему?
– Потому что никакой суд не примет экспертной оценки – а это все-таки экспертная оценка, – и, скорее всего, не примет математические аргументы. Что касается математических аргументов, то был такой замечательный феномен под названием "борода Чурова", когда количество участков с уровнем явки, кратным 10 и 5, почему-то больше. "Борода Чурова" или "пила Чурова" существовала до 2011 года и, кажется, видна на этих выборах тоже. Этот феномен можно оценить достаточно строго математически. У нас с соавторами как раз в этом году вышла статья в журнале The Annals of Applied Statistics по поводу того, что математическая вероятность этого явления астрономически мала.
– Речь идет о том, что число участков, где явка представляет собой круглое число, больше, чем участков с явкой, близкой к ним, но не круглой?
– Да, нравится людям голосовать на участках с целой явкой.
– И вы это объясняете тем, что главам участков просто нравятся круглые числа.
– Да. При этом важно понимать, что явка вообще не является официальным параметром. Ее нет ни в одном протоколе. И чтобы сделать ее круглой, надо специально подогнать некие числа в протоколе или взять калькулятор и посчитать.
– Весь мир основан на математике. Все процессы вокруг нас рассчитаны на основе математики. Почему тогда с этой базой нельзя пойти в суд и сказать – смотрите, есть модель, которая очень хорошо описывает выборы. Есть нарушения в этой модели, которые однозначно указывают на то, что были вбросы, фальсификации, подтасовки. Почему это не принимает суд?
– Я не специалист в судебной практике и плохо знаю, как обращаются суды с математическими аргументами. В вашем вопросе ключевое слово – "модель". На всякую модель можно предложить контрмодель. Поэтому, я думаю, суд на этом и закончится. Он скажет: а вы докажите, что это единственная модель. Больше того, насколько я помню по вчерашним сообщениям, Элла Памфилова сказала, что для нее не являются доказательством вбросов видео, снятые наблюдателем. В некотором смысле она юридически права, потому что видеокамера наблюдателя не является сертифицированным прибором. Думаю, что на этом уровне практики никакие аргументы такого рода не пройдут. Мы прекрасно помним, как документированные официальной системой видеонаблюдения в 2012 году вбросы были массово проигнорированы судами. В Казани группа наблюдателей подавала сотни таких исков о расхождениях между подсчетом избирателей по видео и результатами в протоколах и получила сотни отказов. На мой взгляд, важность этой модели в другом. Она помогает, в том числе и властям, потому что они (с тех пор как в 2007 году такие оценки появились) начали на них реагировать, то есть некоторые вещи начали меняться. Например, стало меньше участков с круглыми результатами. Модель позволяет понять, что происходит на самом деле. Потому что система выборов многоуровневая, непрозрачная, и не все уровни друг с другом хорошо коммуницируют. Я совершенно не уверен, что Элла Памфилова хорошо себе представляет действия руководителей избирательных участков на местах, как они ведут протоколы, заполняют данные и сдают их в ТИК (территориальные избирательные комиссии. – РС). Тем более она вряд ли себе представляет агрегированные результаты – сколько всего дописали голосов на этих 96 тысячах участков.
– Это благородная цель – дать Элле Памфиловой представление о том, что происходит на самом деле. С помощью вашей модели вы посчитали количество голосов, вброшенных на этих выборах за "Единую Россию", опираясь на официальные данные. Какова тогда реальная картина голосования?
– Явка вместо официальных 47,8% составляет где-то 36,5%, что очень хорошо соответствует тому самому главному пику на распределении. И голосов за "Единую Россию", соответственно, вместо 54,2% получается где-то 40% с учетом нашей точности.
– А остальные партии?
– Ничего принципиально не меняется. У всех партий количество голосов увеличивается, поскольку мы уменьшаем знаменатель, на который делим, то есть общее количество голосов, поданных избирателями. Но единственный принципиальный результат в этой истории, возможно, это то, что партия "Коммунисты России" с некоторой вероятностью проходила бы трехпроцентный барьер и могла бы рассчитывать на федеральное финансирование. Для остальных партий фактически ничего не меняется. Может быть, по окончательным результатам будет выглядеть чуть иначе. Когда мы сложим одномандатников с пропорциональной частью списка "Единой России", мы получим, возможно, 68% голосов у "Единой России", а возможно – 75. На мой взгляд, это все-таки довольно существенная разница.
– Кстати, одномандатники. Их касаются ваши модели?
– С одномандатниками сложнее, поскольку там считать приходится на уровне избирательного округа, а он относительно невелик по численности. Там статистические разбросы больше. Я еще не пробовал заниматься одномандатниками. Естественно, если вбросы происходят, то они, вероятно, происходят и в пользу одномандатников. У меня есть ощущение, что многие нарушения, о которых сообщалось вчера, были обусловлены активностью каких-то местных влиятельных одномандатников. Например, скандал с подвозом голосов в Алтайском крае. Там были отмечены активные "круизные голосования", подвозы. Надо сказать, что круизное голосование не всегда обеспечивает голосование за нужную партию. Например, в Москве круизные голосования были, а видимых следов фальсификаций в пользу "Единой России" нет. Возможно, эти подвезенные из Подмосковья, условно, строители подняли процент за ЛДПР.
– Давайте посмотрим на всю эту историю с точки зрения оппозиции. Для нее, я так понимаю, ничего хорошего вы сказать не можете. По большому счету, она с треском проиграла.
– Да, это правда. Возможно, какие-то изменения могли бы быть видны на локальном уровне где-нибудь в Москве или Питере как раз на уровне одномандатных округов. Но на уровне федерального списка положение оппозиции выглядит вполне безнадежным.
– А это отличается от опыта прошлых парламентских выборов?
– Отличается двумя вещами. Видимо, здесь не было отбора голосов у оппозиции, в то время как, кажется, в 2007 году у "Яблока", например, голоса отбирали. И "Яблоко" тогда проходило барьер. В этом году не отбирали, видимо, ни у кого, в том числе у коммунистов, что довольно экзотическая ситуация. Возможно, это благотворное влияние Памфиловой.
– Пять лет назад подтасовки на выборах в Думу привели к массовым протестам. Тогда это людей интересовало. Я помню, как ваши статистические наблюдения расходились, как люди ими оперировали. Люди начали разбираться в математической статистике, что уже хорошо. Сейчас ощущение, что это ушло. Интерес падает в том же процентном соотношении, насколько уменьшается база оппозиции, что странно, учитывая, что существует разделение на условные 86% и противостоящие им 14%. Но сейчас, глядя на результаты, мы не видим 14 оппозиционных процентов, мы даже 10% никаких не видим.
– Я не политолог. Я, глядя на эти самые цифры, обратил бы внимание на ЛДПР. Пока по тем подсчетам, которые у меня есть, ЛДПР идет вровень с коммунистами или даже обходит их. А в Забайкальском крае, например, если отбросить приписки в сторону "Единой России", которые при этом не очень большие, она почти достает "Единую Россию". И вот это, на мой взгляд, для власти гораздо более серьезная проблема, чем проблема какого-нибудь ПАРНАСа. Потому что ЛДПР – это такой стихийный запрос на справедливость. Это место, куда можно пойти и сказать правду Жириновскому. И то, что это место становится настолько популярным, – серьезная проблема, выявленная этими выборами, гораздо более серьезная, чем провал ПАРНАСа или окончательный провал "Яблока". Запрос остался. Он просто переформатировался. В 2011 году этот запрос отразился в высоком результате "Справедливой России". А поскольку "Справедливая Россия" показала свою полную никчемность за прошедшее время, а КПРФ всем надоела, он сместился в сторону ЛДПР. Так что вопрос, на самом деле, остается. Лозунг "Вы нас даже не представляете", с которым ходили в 2011 году, остался. Большая часть населения чувствует себя не представленной. И это далеко не только те 14%, о которых все так любят говорить, это гораздо больше.
– Это движение "Вы нас даже не представляете" на нынешних выборах, можно было бы предположить, должно было бы голосовать за партии типа ПАРНАСа. Я пытался увидеть в этом распределении, где те самые 10-14%, которые сочувствовали пять лет назад этому движению, и не нашел.
– Видимо, они решили остаться дома. Они остались в тех самых 64 фактических или 52 официальных процентах, которые не пошли на выборы. Это тоже вопрос, потому что такой жесткий однопартийный парламент, выбранный при очень низкой явке, на мой взгляд, – проблема для всех, для власти в том числе. Я не знаю, как она будет из нее выбираться, как мы будем из этого выбираться. Я думаю, что запрос на справедливые выборы теперь пойдет с другой стороны. Может быть, это произойдет каким-то образом через одномандатников, которые лучше ощущают свою связь с местными жителями, своими избирателями, чем люди, выбранные по партийному списку. Возможно, будет что-то происходить внутри фракции "Единая Россия", которая фактически представляет собой целый парламент
– У вас лично оппозиционные взгляды? Можно сказать, что вы сочувствуете оппозиции и поэтому занимаетесь статистическим анализом результатов выборов? Или это из любви к математике и нелюбви к тому, что жизнь не соответствует правильным математическим моделям?
– И то, и другое справедливо, но с мотивацией скорее все-таки к любви к числам, чем сочувствия оппозиции. Одно с другим плохо совмещается. Возникает соблазн что-нибудь подогнать или подкрутить. А так делать нельзя. Числа так числа. При выборе между числами и оппозицией я выбираю числа.
– А можно сказать, что в вашем окружении люди все-таки оппозиционно настроены?
– Скорее – да, но это ничего не означает. Это скорее те самые 14%. Это не люди, которые ходят на митинги или как-то оппозиционно настроены, это скорее люди, которые не смотрят телевизор.
– Пять лет назад ваши подсчеты пользовались популярностью в кругах, которые составили тогда движение "За честные выборы". У вас есть ощущение, что сейчас что-то изменилось?
– Я не принадлежу к оппозиционным кругам. Поэтому не могу ничего на эту тему сказать. Я думаю, что меняются поколения. Все-таки пять лет – большой срок. Кто-то обзавелся семьей, пришло много новых людей. Нынешние студенты тогда заканчивали школу. Это сильное изменение. Я не знаю, какое отношение имеют мои подсчеты к оппозиции, они просто тогда попали в какую-то общую точку напряжения. Напряжение возрастало независимо от каких бы то ни было цифр и прорвалось тогда. А то, что эти расчеты оказались в правильном месте в правильное время, – просто случай.
– Раньше существовала прослойка людей, то, что называлось научно-технической интеллигенцией, которая, может, и не ходила на митинги, но составляла важную часть независимого общественного движения. Как вы думаете, у таких людей изменились ощущения за последние 5–10 лет?
– Я наукой больше не занимаюсь и не могу судить о настроениях. Другой вопрос, что вот эти подсчеты, как ни странно, лучше всего воспринимались физиками, пусть и ушедшими из физики. Это довольно забавный эффект. Притом что это работа на уровне физпрактикума второго курса. Там нет ничего сложного. В отличие от них, например, математики были более скептичными. Это было такое точечное попадание. Возможно, это был тот слой обобщенных физиков, который как раз и пошел тогда на митинги. Может быть, было совпадение.
– Это мне как раз понятно – физики оперируют математическими моделями, которые они прикладывают к реальному миру. Нет у вас ощущения, что жизнь в России совсем разошлась с моделями и становится все более непредсказуемой?
– Есть. В предыдущий раз такое ощущение было где-то начиная с года 2010-го. Есть такое состояние перед фазовым переходом, когда минимальное внешнее воздействие вызывает огромные флуктуации. В последний раз это было в 2010 году. По моему ощущению, сейчас это все тоже очень напряжено. Любая минимальная история вызывает резкую бурную реакцию, по крайней мере, в некоторых слоях общества. Наверное, это означает, что что-то назревает. Я не знаю – что.
**
«Свобода». 20:18 18.9.2016
Сергей Добрынин
В данных по явке нашли математические свидетельства фальсификаций
Физик Сергей Шпилькин опубликовал несколько графиков, связывающих явку избирателей и число участков, где такая явка была достигнута. Автор утверждает, что в этих графиках есть математическое свидетельство завышения явки на многих избирательных участках, в частности, в Кемеровской области (именно здесь, по данным ЦИК, избиратели голосовали в этот раз особенно активно).
На это указывает характер графиков: при отсутствии фальсификаций, они должны выглядеть как так называемое нормальное распределение - достаточно плавная и симметричная линия с одним ярко выраженным горбом. Однако, данные ЦИКа выглядят совсем не так.
"Ад творится почти везде", - резюмирует автор.
Шпилькин с группой соавторов аналогичным образом изучал данные голосования и в 2011. Авторы опубликовали статью с математическим доказательством наличия в них аномалий, которые можно объяснить только массовыми фальсификациями.
**
См. также в «Новой газете»:
- «Реально "Единую Россию" поддержали 15% избирателей»
Физик Сергей Шпилькин объясняет, как аномальные скачки явки выдают фальсификаторов на прошедших выборах