Опросы: Рейтиг вранья

Опросы - рейтинг вранья

Предсказывать будущее, зная прошлое

В связи с захлестнувшей нас перед выборами волной опросов, мне захотелось провести сравнение и узнать, кому из социологов можно доверять, а кому совсем наоборот. Это можно сделать, сравнив прошлые опросы с результатами выборов. Неплохо, чтобы в опросах рядом с названием фирмы публиковалась статистика: сколько прогнозил, сколько попал, средняя ошибка и т.д.
Как в НБА, когда Коби бросает штрафные, мы заранее про него знаем, сколько он забивает в среднем, какой рукой, сколько ему еще осталось забить и какая вероятность.
Логично, если бы рейтинг социолога, его зарплата и частота мелькания в медиапространстве зависели бы от этих данных.
Ведь странно, что у в Израиле главной по опросам до сих пор считается Мина Цемах, хотя вся страна знает, что Мина стабильно ошибается на 5% влево. Может быть кто-то прогнозит лучше?

В общем, если до сих пор этого никто не сделал, я решил что пора сделать :)

Основы              

Для начала, разберемся с основными терминами.
Социологическая погрешность - обычно в пределах 3-5%, зависит от размера выборки (количество опрашиваемых). То есть, если кандидат на самом деле набирает 40%, хорошими можно признать все опросы, дающие ему 37-43%, с погрешностью 3%. И наоборот, если в опросе мы имеем 40%, с той же погрешностью, мы вправе ожидать, что кандидат наберет от 37 до 43%. Интервал 37-43 называется доверительным интервалом.
Но не все так просто. Погрешность зависит и от самого полученного показателя - в формулу входит х*(100-х). Понятно, что максимальный результат будет, если х=50%, и по видимому именно это значение указывают в качестве максимальной погрешности опроса. Для кандидата, набирающего в районе 10% погрешность примерно вдвое меньше максимальной, для 5% - еще вдвое меньше.
Уровень доверия (доверительная вероятность) - какой процент опросов попадет в границы доверительного интервала. Доверительная вероятность также влияет на погрешность и наоборот - понятно, что чем выше погрешность, тем выше вероятность попадания. Опросам с погрешностью 100% доверять можно всегда, но пользы от них не много. В соц.опросах уровень доверия обычно берется 95%.
Это значит, что в одном из каждых 20 опросов социолог может выходить за пределы погрешности и нести любую чушь, и ему за это ничего не будет. В общем, еще одна отмазка для социологов :)

Вот тут про это все подробно и достаточно понятным языком объясняется.
А тут можно даже скачать калькулятор погрешностей и почувствовать себя социологом.
То же самое с кучей умных формул: Доверительный интервал Стандартное отклонение

Методика подсчета

Поскольку проверить качество опросов можно только зная правильный ответ, т.е. результаты выборов, все остальное время социологи могут нести любой бред, и мы их не можем поймать за руку (как в случае с итнаткутом, по которому так и не было референдума).
Для сравнений я брал опросы за последнюю неделю до выборов, если у конторы несколько опросов - брался последний.
Учитывались только опросы сделанные до голосования, не экзит-поллы. В отличие от последних, результаты опросов, публикующиеся до выборов влияют на наше мнение перед голосованием и давно стали средством пропаганды.

Плавающие голоса. В некоторых опросах любят указывать процент неопределившихся. Понятно, что к выборам неопределившиеся исчезают - либо они становятся определившимися, либо не идут голосовать (но проценты явки нас сейчас не интересуют). Значит их можно не учитывать, и нужно умножить результаты опроса на некий коэфициент, в сумме дающий 100%. (Если в опросе сказано, что кандидаты А и Б набирают по 40% и еще 20% не определились, мы будем считать, что реальная ситуация между кандидатами 50-50).

Мандаты, Надя, мандаты. Социологи получают данные в процентах, газеты публикуют опросы в мандатах, делая весьма произвольные округления (или указывая интервал от-до), не учитывая соглашения об остаточных голосах и т.д. В случае интервала мной бралось среднее значение (например, для партий на грани проходного барьера, и набирающих 0-2 мандата берется 1) и переводил обратно в проценты.
Естественно, все эти преобразования еще больше увеличивают погрешность вычислений, но других данных нет.
Ну и последнее - опросы находил в интернете, считал почти на коленке, указывайте на ошибки - буду благодарен :)


1.ПАРТИИ


В крайней левой колонке - правильный ответ, в крайней правой - среднее по палате.
  • Видно, что по большинству партий отклонение в 1-2 мандата, что можно признать более-менее нормальным.
  • в 2006-м бросается в глаза, что все дружно ошиблись примерно на 5 мандатов с Кадимой, и примерно на столько же но в другую сторону с пенсионерами. Учитывая, что на следующий день виновники торжества объединились в одну фракцию, можно сказать, что и не ошибка вовсе. К тому же, если мы отмотаем чуть назад, тенденцию падения Кадимы предсказывали все опросы, а значит тут случай особый - каждый новый день со страшной силой отбирал мандаты, и за оставшиеся 2 дня ситуация для Кадимы могла еще больше ухудшиться.
    Прогнозящий для газеты для альтернативно думающих людей "Диалог" сумел отличиться и на этом фоне, даже за 2 дня до выборов давая Кадиме 36 мандатов. Отметим также, что Геокартография и Шваким давали Кадиме 33-34 мандата за 6 дней до выборов, и более поздних их опросов нет, тогда как другие (Дахаф, Диалог, Телесекер) в то время еще радовали Кадиму, давая ей 36-37. К сожалению, тот факт что опросы проводятся в разные дни, невозможно отразить в статистике и это вносит дополнительные неточности. Остается надеяться, что при большом количестве опросов в среднем все утрясется равномерно.
    Также отметим, что с упомянутой троицей Дахаф-Диалог-Телесекер сотрудничают три основные печатные газеты, и их опросы в последние четверг-пятницу до выборов (а это как раз 5-6 дней) видит вся страна, тогда как у остальных аудитория гораздо меньше - радиостанции, секторальный Макор Ришон, англоязычный JPost и т.д.
  • в 2003-м все дали в среднем на 6.5 мандатов меньше Ликуду (и тут уже никаких тенденций не видно, просто тупо ошиблись), а в 99-м примерно на столько же ШАСу.
  • С ШАСом вообще всегда проблема, они во всех опросах получают меньше, чем на самом деле (обычно не так явно, как в 99-м, но ошибка в 1-2 мандата в их случае почти всегда со знаком минус.
  • С НДИ в 2006-м самы большой разброс мнений, от +4 до -4, но в среднем как раз все хорошо (7 мандатов им Диалог давал - ничего личного). В прошлые годы такая же проблема была с ИБА - то недолет, то перелет, но всегда сюрприз.
    В общем, секторальные партии загадочны и плохо поддаются научным исследованиям.
  • В 96-м опросы трагически обрываются в конце апреля, поэтому в дальнейшем не учитываются. Но видно, что и там ошибка влево. Судя по данным по опубликованным рядом опросам Перес-Нетаниягу, за оставшийся месяц существенных изменений не было.
  • В 84-м летописи донесли до нас лишь частичные данные, поэтому они тоже в дальнейшем не учитывались. Но радует, что и отмотав на четверть века назад, мы опять встречаем те же лица.
    Что еще сказать о партиях не знаю, поэтому перейдем к блокам и премьерам.


    2. ОБЩИЕ ВЫБОРЫ - ПРЕМЬЕРЫ И БЛОКИ

    Работа над ошибками

    Кроме ошибки по каждому кандидату считалась суммарная ошибка опроса - сумма всех ошибок по кандидатам. Понятно, что чем больше участников, тем больше суммарная ошибка и сравнения не совсем корректны (это относится только к праймериз, на общих выборах всегда было по 2 кандидата). Другой вариант - сравнивать средние значения ошибок тоже не решает проблему: чем больше участников, тем меньше будет средняя ошибка. Например, на последних праймериз в Кадиме здорово облажались почти все социологи, но если мы разделим на 4 (результат двух аутсайдеров мог угадать даже ребенок) средняя ошибка выглядит вполне приемлемой.
    Поэтому отдельно сравнивалась разница между основными конкурентами (1-2-е место) и ее отклонение от реальной.

    Правые, левые, прочие

    Кроме того, считалась ошибка вправо/влево. Для этого все партии были поделены на блоки - правые и левые. Кандидаты также были поделены на правых и левых, там где это казалось возможным. Понятно, что такое деление весьма условно, и можно было делить как-то иначе.
    К правым отнесены все партии коалиции Нетаниягу, включая ИБА и Третий путь, а также возникшие позже ИЛ, Либерман, и прочие Хазиты и Атиквы, все кандидаты на пост ПМ от Ликуда, Биби и Фейглин на праймериз в Ликуде, Фуад в Аводе и Мофаз в Кадиме.
    К левым - все партии коалиции Рабина плюс возникшие позднее Шинуй, Кадима и прочие пенсионеры зеленые, голубые и розовые пнины розенблюм, кандидаты Аводы на пост ПМ, Шарон и Шалом на праймериз в Ликуде, Бург, Мицна и Рамон в Аводе, Ципа в Кадиме.
    Некоторые вообще никуда не относятся, поэтому суммарная ошибка и ошибка вправо/влево не всегда совпадают.

    Примечания:
    По поводу 96-го года, на одном из форумов приводится ссылка на два опроса в Маариве и Йедиот, в одном из которых (йедиотском) вел Нетаниягу. Речь идет о газетах, вышедших в понедельник (27.05). Для Йедиот у нас прогнозит Мина Цемах, в опросе Дахафа, который я нашел, сделанном 28.05 вечером перед выборами Перес снова ведет 3%

    Насчет опроса Маарива - не совсем понятно, кто его делал - скорее всего Геллап. На картинке, в газете за неделю до выборов видно, что в Маариве публиковалось сразу три опроса, по всем вел Перес (отсюда)
    Википедия также сообщает нам о перевесе Переса в обоих газетных опросах перед выборами.
    Еще приводилась ссылка на ликудовский опрос за 5 дней до выборов, по которому Нетаниягу впереди на 1%.
    Непонятно, кто его делал и где это было опубликовано, поэтому в дальнейшем опрос не учитывался. Но можно отметить, что внутренний ликудовский опрос оказался абсолютно точным, в отличие от "объективных" газетных, хотя казалось бы, должно быть наоборот.


    3. ПРАЙМЕРИЗ + РЕФЕРЕНДУМ


    Примечания:
    Последние колонки: суммарная ошибка, ошибка вправо/влево, разница между 1-м и 2-м местом, ошибка по 1-2 месту.
  • К ликудовским праймериз 2007 я нашел только один опрос, и хотя он был сделан за 2 недели до выборов, опрос абсолютно точный, я решил его включить.
  • К ликудовским праймериз 99-го года (их там было 2 штуки) опросов вообще не нашел, что само по себе показательно.
  • На праймериз в Аводе в 2001-м было два результата: сначала выиграл Бург, потом часть друзских урн решили переголосовать, друзы не пришли и выиграл Фуад. Опросов тоже два - в одном ведет Бург, в другом Фуад. Я считал наиболее близкий результат, в итоге оба угадали, оба молодцы.
  • На ликудовских праймериз в 2007-м и в некоторых других мы всречаем двойные опросы - для всех избирателей и для тех кто наверняка придет голосовать. В том конкретном случае цифры тех кто наверняка оказались ближе к правильным, но если посмотреть дальше - никакой зависимости нет (либо недостаточно данных). Фактически, социолог подстраховывается и продает нам два варианта опроса по цене одного, чтобы потом у него всегда была возможность сказать, что нужно было читать маленькие буквы, на последней странице, по диагонали. В общем, я считал лучший вариант (он выделен болдом).
  • В праймериз N14 (Авода-2006, 1 тур) на имре второй опрос приписан Маагару Мохот, во всех прочих местах это Шваким Панорама.
  • В опросе N18 (праймериз в Ликуде-2002) триумфально появляется с перекосом на 13% влево фирма Market Watch, которую мы больше нигде не встречаем. Что за контора такая? Вот как раз недавно тут о ней писали.
  • На тех же ликудовских праймериз была такая добрая традиция не публиковать результаты Фейглина, как будто кандидатов всего двое. Ну, раз не публиковали, считал 0. Может они чего-то другое имели в виду - я между строк читать не умею.
  • На ликудовском референдуме (опрос N17) все угадали результат и все ошиблись с цифрами влево. Вроде бы хуже всех нашаманили И.Кац и Мина Цемах, но нужно отметить даты опросов - число противников размежевания росло с каждым днем и эту тенденцию верно уловили почти все конторы. Последний опрос Каца от 28.04, у двух других 01.05. Если посмотреть на опрос Телесекера от 28.04 - там дела еще хуже.
    Отличилась же Мина Цемах - старушка единственная обнаружила тенденцию роста сторонников размежевания.


    Сухой остаток

    "Системы - бессистемные, стандарты - нестандартные,
    Пространство - неэвклидово, хрен знает, чьё оно."

    (Шаов)
    Подведем итоги.
    Всеобщие выборы (партии и премьеры): 31 опрос, средняя ошибка 4.6%
    Но влево ошибаются чаще (17 против 10 вправо) и больше: средняя ошибка левых опросов - 6.3%, средняя ошибка вправо - 3.5%, почти вдвое меньше.
    Итого: каждый опрос в среднем ошибается на 2.3% влево.
    Это подтверждает истину, известную каждому ребенку: опросы подрисовывают пару мандатов левым партиям, но стараются при этом оставаться в каких-то рамках.
    Отдельно по партиям и по премьерам картина примерно одинаковая.
    На праймериз веселее:
    35 опросов, 20 левых, всего 4(!) правых, средняя ошибка 12.1%
    Левые ошибаются в среднем на 11%, правые - на 5.9%. В среднем каждый опрос прибавляет 5.6% левым.
    В сумме все вместе:
    66 опросов, средняя ошибка 8.6%, влево - 8.8%, вправо - 4.2%, в среднем 4.1% влево.


    Старуха процентщица и другие

    Теперь отдельно по опрос-конторам (выписывал только тех, кто давал больше одного прогноза):

    Инст. Смита: 6 прогнозов, ср.ошибка 4.49%, (0.72% влево)
    Шваким Панорама (Й.Вадана): 5 прогнозов, ср.ошибка 5.74% (0.53% вправо)
    Геокартография (А.Дгани): 5 прогнозов, 4.37%, 2.35% влево
    эти - самые объективные, дальше - хуже.
    Маагар Мохот (И.Кац): 4 прогноза, 5.91%, 7.63% влево
    этот тоже относительно неплохо, из-за малого числа опросов сильно тянет вниз ошибка на референдуме, когда опрос был сделан раньше других.
    Геллап: 4 прогноза, 6.86% (столько же влево)
    Галь хадаш: 4 прогноза, 9.79% (9.37 влево)
    Галь хадаш - это бывший Геллап, видно, что смена вывески не изменила концепцию. Из 8-и опросов 7 ошибаются влево. Стабильность - признак класса!
    Дахаф (М.Цемах): 15 прогнозов, 7.26%, 4.63% влево.
    Из 15-и опросов 10 ошибок влево, 3 вправо. Вот он профессионализм - все в пределах стат.погрешности и в то же время ошибки почти всегда в нужную сторону.
    Диалог (К.Фукс): 9 прогнозов, 10.22%, 5.35% влево
    Газета для думающих людей помогает думать в нужном направлении. (но на общих выборах все не так плохо - 2 прогноза, ср.ошибка 1.25% влево)
    Телесекер: 9 прогнозов, 10.27%, 2.04% влево
    Эти считать не умеют, но объективные, чушь несут направо и налево.

    Отдельно можно выделить т.н. сложные выборы - когда разница между 1 и 2-м местом составляла меньше 10%. Их, включая 84-й год, было 9 (N3,5,6,9,11,13,14,16,20), 24 опроса.
    7 раз конторы угадывали победителя, 13 раз промахивались.
    Отличилась тут Мина Цемах - из 7-и попыток 6 неугаданных победителей.


    Вы вдумайтесь в простые эти цифры, за каждой вижу чью-нибудь судьбу...

    Персональная статистика - некоторые наиболее интересные персонажи:
    (в первых двух случаях я считал разницу между кандидатом и его ближайшим конкурентом)

    Нетаниягу фигурирует в 17 опросах (ПМ+праймериз, не считая 2007-го года, когда соперничества фактически не было), 13 раз ошибка влево, в среднем каждый опрос ошибается на 5.23% не в его пользу.
    Перес (сюда также посчитал 1984, хотя там фигурируют партии) - 10 опросов, все(!) в его пользу, в среднем ошибка 9.3%
    Фейглин участвовал в 12 опросах, в среднем в каждом получал на 1.66% меньше, чем на самом деле. Учитывая, что всего он набирал в среднем 8.86%, т.е. в каждом опросе на 19% меньше реального результата.
    Партия ШАС за последние 12 лет (вместе с 96-м годом - данные за апрель) появляется в 17 опросах, 13 дают ей меньше чем на самом деле, всего один - больше. В среднем получают в каждом опросе на 2.26% меньше, т.е. на 2-3 мандата.
    Кадиму и лично Ципи Ливни не считал, т.к. они успели отметиться только в одних выборах, но видно, что у Ш.Переса появились достойные конкуренты.

    Парадокс Марзеля. Партия Баруха Марзеля (Херут, потом Хазит) участвовала в выборах 2003-го и 2006-го года, оба раза набирая более одного мандата, но не проходя ахуз хасима. Тем не менее, мы мало где встретим ее в опросах. Зато мы там часто встречаем зеленых, Але ярок, Тафнит, Пнину Розенблюм, пенсионеров (в их непроходные годы) и кого только не. (http://www.politicsnow.co.il/ele2003sk.html, http://www.uzit.co.il/poll2006.html)
    О важности попадания в опросы перед выборами свидетельствует успех партии пенсионеров: стоило им в 2006-м году появиться в 6-и из 7-и последних предвыборных опросов, создав ощущение проходимости, как народ массово побежал за них голосовать, принеся 7 мандатов.



    Как это работает

    Поскольку я начал собирать данные еще осенью, 17 сентября, в день праймериз в Кадиме, передо мной была таблица с цифрами в графе праймериз: средняя ошибка 11.4%, средняя ошибка влево - 10%. Не могу сказать, что сильно удивился, узнав на следующее утро, что все три мидгама ошиблись на 10% в пользу Ливни.
    Интересно также, кого позвали делать мидгам: 10 канал - К.Фукс (на праймериз ср.ошибка 12.8%, средняя влево - 7%), 2 канал - Мина Цемах (9.64%, 6.84% влево), 1 канал - Мано Гева (не знаю кто такой, нет данных). Есть конторы, которые, мягко говоря, угадывают получше (у Шваким Панорама до тех праймериз средняя ошибка была 5.82% и их прогноз наиболее близок к реальности.
    Наиболее же точным следует признать прогноз Мофаза (43.7%), правда счастья ему это не принесло.





    Некоторые ссылки:

    экселевский файл со всеми вычислениями - здесь.
    Последние опросы (2009) - тут.

    Сайты с опросами:
    http://www.imra.org.il
    http://www.bicom.org.uk/background/opinion-polls
  • Выборы-2009
    http://www.uzit.co.il/poll2009.html
    http://www.bhirot2009.co.il/home.yecms/סקרים
  • Выборы-2006
    http://www.uzit.co.il/poll2006.html
  • Выборы-2003
    http://www.politicsnow.co.il/ele2003sk.html
  • Выборы-1996 - The Elections in Israel, 1996
  • Выборы-1992 - подробное исследование

    Зеэв Гейзель: Партии, движения, блоки и списки за последние 25 лет.
    Государство Израиль. Политическая жизнь, партии. История выборов - http://israel2006.zahav.ru/History.aspx.
    Праймериз в партии Авода: http://www.idi.org.il/breakingnews/pages/breaking_the_news_10.aspx

    Статьи про опросы (иврит):
    http://www.idi.org.il/ResearchAndPrograms/Elections_2006/Pages/Research_and_Programs_elections_2006_5.aspx
    http://www.idi.org.il/BreakingNews/Pages/Breaking_the_News_87.aspx

    Как это делается (статья в Маариве)
    Про Маарив и Телесекер: http://www.likudnik.co.il/article.aspx?articleID=5821

    Лекции Камиля Фукса в ТАУ:
    http://www.tau.ac.il/~fuchs/Survey%20Sampling%20and%20Public%20Opinion.html
  • В частности, тут любопытная дискуссия с участием нобелевского лауреата проф.Аумана ("опросы - лженаука и средство влияния") и ответ проф.Фукса ("опросы - это наше всё и ошибаются не так уж сильно").
    Данное исследование показывает, что ошибаются в среднем действительно не так уж сильно, правда опросов самого Фукса (10.22%) это не касается.
    Хостинг от uCoz