June 29th, 2010

portret

Математика на службе демократии

Очень интересная история приключилась на сайте DailyKos.org. Этот сайт хостит большое количество преимущественно лево-либеральных блогов, из которых на главную страницу попадают "избранные" посты. Будучи сайтом, посвященным в основном политике, гда полтора назад DailyKos решили не удовлетворяться обсуждением опросов общественного мнения, проведенными другими организациями. Они взялись оплачивать еженедельные опросы, организуемые довольно известной компанией Research2000. При этом они каждую неделю задавали одни и те же вопросы, и все результаты (в отличие от многих других организаций), включая разбивку на подгруппы, выкладывали в открытый доступ.
Недавно три специалиста по статистике обратились в DailyKos с серьезным обвинением. Они проанализировали выложенные результаты и обнаружили в них зависимости, которые не должны появляться в настоящих случайных опросах общественного мнения. В частности было обнаружено:

  1. Совпадение четности и нечетности цифр для мужчин и женщин. То есть если "за" Обаму был нечетный процент мужчин, то в 99,9% "за" Обаму был и нечетный процент женщин (и наоборот).

  2. Некоторое время назад количество опрашиваемых каждую неделю было уменьшено, но вариация в числах осталась прежней.

  3. Случайные колебания цифр от недели к неделе были очень близки к нулю, но собственно нулю почти никогда не были равны.

(технические детали и подробности можете прочитать в исходном посте на dailykos.org)
DailyKos предоставило время Research2000 для того, чтобы объяснить эти странности, но Research2000 так и не смогли этого сделать за последние 3 недели.

История, кстати, очень напоминает историю с найденными podmoskovnik странными зависимостями (преобладанием круглых цифр) в результатах российских выборов пару лет назад (сейчас ссылку уже не найду).

Это к пользе открытого доступа к данным. Как в науке, так и в политике. Хотя, конечно, жулики со временем хитрее станут.