Новости

Как работает прогноз конверсии в оптимизаторах ставок

Автор Дата 06.05.2017

Меня многие спрашивают, в качестве кого оптимизаторы ставок считают вероятность конверсии на малых данных? И по образу при нескольких кликах на ключевое слово дозволяется оценить конверсию? Постарался ответить на эти вопросы в статье.

Пропедевтика

Сами по себе клики с рекламы уже много с тех пор воды утекло не интересуют рекламодателей. В самом простом случае рекламодателей интересует мера конверсий. Поэтому перед тем как выставить ставки, нужно придать значение какая доля кликов по ключевику закончится конверсией.

Понятно, есть и рекламодатели, которых интересует не только пи конверсий, но и доход. Но ожидаемый доход для клик рассчитывается примерно по таким же принципам, ровно и конверсия.

Мы, конечно, можем просто взять степень конверсии ключевика, однако это довольно неточная отметка. Например, если мы монетку подкинем 10 разок, то не всегда у нас будет 5 орлов и 5 решек. Как и и показатель конверсии довольно сильно колеблется из недели к неделе в силу случайности.

Объективная возможность конверсии

Показатель конверсии и вероятность конверсии – сие две большие разницы. Например, при 1 клике и 0 конверсий признак нулевой. Но это не значит, что риск. Ant. невозможность конверсии тоже нулевая, и никто никогда не конвертируется.

Смертность – это некоторое число, которое позволяет нам отдать справедливость вероятность конверсии. Чем больше у нас кликов, тем компаратив показатель конверсии. Далее мы будем называть маза конверсии просто «конверсией».

Наша назначение максимально точно оценить конверсию. Чем точнее автор этих строк это сделаем, тем больше конверсий сможем унаследовать за те же деньги.

Комбинация оценок

Чуть (было все современные алгоритмы машинного обучения используют тезис взвешенного голосования. Он довольно прост и хорошо вы знаком по некоторым видам спорта, КВН и конкурсам прелести.

Несколько судей выставляет оценки участнику, после что считается итоговая оценка – как среднее между оценками судей. (пред)положим, 3 судьи поставили 7, 8 и 9, вычисляется средняя кларк (7+8+9)/3= 24/3=8.

Судьи, не всегда объективны, и их оценки без- точны. Но с ростом числа судей повышается честность. Ant. необъективность (точность) оценки. Допустим, объективная оценка участника 7 баллов. Служитель законности с вероятностью в 50% снижает оценку на 1 балл. С маза в 50% завышает на 1 балл. Средняя ошибка равна 1 баллу.

Разве что у нас есть 2 судьи, то возможны 4 равновероятных комбинации

Рефери 1

Судья 2

Итого

Ошибка

6

6

6

1

6

8

7

0

8

6

7

0

8

8

8

1

В итоге средняя ошибка сократилась пополам до 0,5 баллов. Другими словами, увеличение числа судей повышает добросовестность итоговой оценки.

Веса

Все люди разные, и Вотан судья может давать более точные оценки, нежели другой. Это также можно учесть. Нужно к примеру не простое среднее, а средневзвешенное, где вес каждого судьи зависит с его объективности. Например, голос первого судьи подсчёт за 2 голоса.


  • E – финальная оценка
  • E – оценки судей
  • w – веса судей
  • n – величина и круг судей

Свойства

При взвешивании итоговая оценка закругляйся между исходными оценками, не больше максимальной и безлюдный (=малолюдный) меньше минимальной.

Если мы правильно подберем веса, ведь это повысит качество оценки. При хорошем подборе финальная эвальвация будет лучше, чем ее составляющие. Даже на случай если множество оценок не намного лучше случайных, в таком случае финальная оценка будет намного лучше случайной.

Перепрофилирование

Другое преимущество взвешенного голосования – отсутствие переобучения. Пока лет 15 назад в машинном обучении наблюдался противоречие: вычислительные мощности росли, но машины от сего не становились умнее. После некоторого уровня продление сложности алгоритма ухудшало качество прогноза. Этот отклик называется переобучением.

Однако, в конце 90-х обнаружили размер выработки. Оказалось, что взвешенное голосование, снижает переобучение. Ввиду этого сейчас почти все алгоритмы машинного обучения используют взвешенное аккламация.

Надежность

Но самое важное в нашем случае – сие высокая надежность. Если одна из оценок имеет высокую просчет, то это решается автоматически – просто снижением веса. Близ правильном подборе весов, взвешенное голосование будет дозволять адекватный результат, даже когда почти все оценки «выйдут изо строя».

Даже если у ключевика нет кликов и не имеется показателя конверсии, у нас есть показатель конверсии объявления и сайта.

Мысль Марковича

Многие из вас слышали о портфельной теории Марковича. Симпатия рассказывает о том, как подбирать оптимальный инвестиционный сумка, обладающий самой высокой доходностью при заданном риске.

В первый взгляд, нужно все вложить в самую быстрорастущую компанию. При всем том этот вариант очень рискованный – если она разорится, так мы все потеряем. Нужно диверсифицировать портфель, с намерением снизить риск.

Я против использования т.н. портфельной теории в контекстной рекламе, которая с теорией Марковича маловыгодный имеет ничего общего. Однако в теории Марковича лупить довольно примечательный парадокс.

Допустим есть 2 типа ценных бумаг, биб Б явно хуже А: меньшая доходность и выше риск. В общем случае приемлемый инвестиционный портфель будет содержать обе ценные бумаги (естественным путем, доля бумаги А будет выше). Это происходит, потому как общий риск снижается из-за диверсификации портфеля.

Взять хоть такой же парадокс существует и при взвешивании. Благо есть две оценки: очень хорошая А и очень плохая Б, так оптимальный вес Б не будет равен нулю.

Сии два парадокса объясняются одной и той же формулой. Равным образом происходит что-то вроде диверсификации рисков.

Контекстная кинореклама

Вернемся к контекстной рекламе. Как я уже говорил, примета конверсии – оценка конверсии. Т.е. можно сказать что маза конверсии примерно равна показателю конверсии. Обозначим рейтинг как r, а вероятность как p:


Также мы можем провещать, что вероятность конверсии примерно равна показателю конверсии сайта (m).


Изо чего получаем взвешенную оценку:


Веса (w) подбираются беспричинно, чтобы снизить погрешность итогового прогноза:

  • вес показателя ключа зависит ото числа кликов. Если число кликов нулевое, в таком случае он равен нулю и формула сводится просто к конверсии сайта.
  • цена конверсии сайта зависит от того, насколько разная пересчет ключевых слов. Чем более разные ключевые словоизвержение, тем меньше вес m.

ПББ

Один из методов решения нашей задачи в матстатистике – сие бета-биномиальная модель с определением априорной дисперсии после методу наибольшего правдоподобия. Для краткости мы будем его наименовывать ПББ (Простейшая Бета-Биномиальная модель).

Это метода известен уже лет 50. Также он упомянут в патенте Marin Software. Даром что, возможно, в Marin Software сейчас использует другой алгорифм.

Бета-биномиальная модель

Случайные величины подчиняются некоторым законам распределениям. Вера говорит о том, какие значения встречаются чаще, а какие – реже. Скажем так, людей среднего роста больше, чем очень высоких. Предвидя закон, мы можем сделать некоторые выводы. Вот хоть, если мы возьмем случайного человека, то с вероятностью в 95% его нарастание будет ниже двух метров.

У закона распределения пожирать 2 основных момента:

  • Матожидание. Грубо говоря, среднее. К примеру сказать, средний рост человека.
  • Дисперсия – говорит о том, елико разный рост у разных людей.

Из теории вероятностей всеизвестно, что число конверсий подчиняется биномиальному распределению с параметрами p (секьюритизация) и n (число кликов). Это записывается так:


Если пишущий эти строки возьмем случайный ключевик с сайта (о котором мы в большинстве случаев ничего не знаем), то его конверсия перестань подчиняться некоторому закону. Как ни трудно попасть в яблочко, в бета-биномиальной модели считается конверсия подчинятся бета-распределению.


Идеже m – матожидание (средняя конверсия у ключевиков на сайте). Параметр A – сие некоторая мера «одинаковости» конверсии у ключевиков. Он назад зависит от дисперсии. Чем более разная превращение у ключей, тем меньше А.

Допустим, мы знаем, аюшки? у ключевика было n кликов и s конверсий. Используя теорему Байеса, немного погодя долгих расчетов получим, что конверсия этого ключевика имеет следующее разделение:


Это наше представление о конверсии ключевика, сделанное сверху основе его данных и распределения ключевиков на сайте.

Матожидание сего распределения будет равно:


Эта формула говорит о средней конверсии ключевого треп, имеющего s конверсий и n кликов. Это искомая оценка конверсии.

Параметр А вычисляется методом наибольшего правдоподобия. Нужно втянуть такой А, который лучше всего соответствует данным сайта. Сей расчет довольно сложен и даже на компьютере занимает (целый) короб времени. Для него нужно вычислить по 90 специальных математических функций (палитра и полигамма) на каждый ключевик.

Среднее взвешенное

Трюизм из прошлой главы это среднее взвешенное показателя сайта и ключевого фразы с весами:


Чем более однородные ключи на сайте, тем более учитывается показатель сайта. Чем больше кликов, тем мощнее в ней учитывается показатель ключа. При 0 числе кликов, наша отметка равна m, а при бесконечном – r.

Примеры

Допустим, у нас пожирать m=1%, посмотрим, какую оценку мы дадим.

Клики

Конверсии

Пропорция

A=1

A=2

A=3

0

0

нет

1%

1%

1%

1

0

0%

0.99%

0.995%

0.997%

1

1

100%

1.98%

1.49%

1.33%

10

0

0%

0.91%

0.95%

0.97%

10

1

10%

1.82%

1.43%

1.29%

10

10

100%

10%

5.7%

4.19%

100

0

0%

0.5%

0.66%

0.75%

100

1

1%

1%

1%

1%

100

2

2%

1.5%

1.33%

1.25%

100

10

10%

5.5%

4%

3.25%

1000

0

0%

0.09%

0.16%

0.23%

1000

10

1%

1%

1%

1%

1000

20

2%

1.9%

1.83%

1.77%

Как мы видим, на больших данных оценки безлюдный (=малолюдный) сильно отличаются от показателя. Но при малых данных взвешенные оценки адекватнее показателя конверсии.

Просчет

Можно сравнить ошибки показателя конверсии и взвешенной оценки:


Рядом малом числе кликов взвешенная оценка обладает в серия раз меньшей погрешностью, но с ростом числа кликов аккуратность обоих оценок становится примерно одинаковой.

Прибыль

Аккуратность в швейцарский банк не положишь, поэтому смоделируем полномочие погрешности на прибыль:


100% максимальная прибыль (при идеальном прогнозе). Как бы мы видим, при использовании взвешенной оценки дифференция всегда выше, чем при использовании показателя конверсии alias выставлении одинаковых ставок.

MREM

Это небольшое исправление ПББ, этот алгоритм работает в бесплатном онлайн калькуляторе конверсии.

Уплата m

Основная проблема ПББ в том, что m должно состоять оценкой конверсии среднего ключевика, а не оценкой конверсии до сайту. Это разные вещи, поскольку у разных ключевых слов – всякая всячина число кликов.

Например, у нас есть 11 ключевых слов. В 10 изо них по миллиону кликов, и показатель конверсии равен 2%, а в 11-ом 10 миллионов кликов и пропорция конверсии равен 1%. Показатель конверсии сайта равен 1,5%, хотя конверсия среднего ключевика в районе 1.9%.

Эта проблема усугубляется единаче и тем, что есть корреляция между числом кликов и конверсией. Т.е. перевод зависит от частотности ключевика. Низкочастотники, обычно имеют большую конверсию. В силу что m обычно занижен.

Даже если корреляции изначально пропал, то она появляется при адекватной расстановке пруд, поскольку число кликов зависит от ставки, которая в свою караван зависит от вероятности конверсии по ключевику.

В итоге, изо-за этого оценка m методом ПББ обладает махина погрешностью, даже на очень больших данных, аж при бесконечном числе кликов и ключевых слов. Такие оценки в статистике называют несостоятельными. Такая грубая ошибка в m приводит к тому, что точность оценки, особенно, низкочастотных ключевых слов снижается.

REM

Затем чтобы улучшить расчет m, обычно в матстатистике используют двухпараметрическую конверсив, когда методом наибольшего правдоподобия ищется не лишь только А, но еще и m. Однако такая модель нестабильна получай малых данных.

В качестве компромисса мы использовали REM (Random Effect Model) изо Мета-анализа (раздела теории вероятностей). В MREM m будто по сложной формуле, в которой учитывается дисперсия. Сие повышает точность вычисления m и стабилизирует расчет на малых данных.

Рядом 100 ключевиках:


Как мы видим, после какого-так порога число кликов не улучшает оценку m числом ПББ. Это связано с тем, что корреляция посереди кликами и конверсией рождает систематическую ошибку.

При 1000 ключевиках оный эффект еще заметнее:


Как мы видим, ошибка Marin перестает зависеть от объема данных. Ибо эта ошибка в основном связана не с малым объемом данных, а с проблемами модели.

Ценность m

При использовании REM вес m теперь зависит не просто-напросто от A и m, но еще и числа ключевиков на сайте, числа кликов у сайта, а опять же характера распределения кликов между ключевиками.

Например, (не то у нас мало кликов на сайте, то сие повышает ошибку в вычислении m, и мы снижаем вес m. Если нет клики распределены неравномерно, например, в основном находятся у одного ключевика, ведь это тоже снижает точность m, и мы снижаем пурка этой оценки.

Более точный прогноз ошибки повышает прочность расчета А и точность оценки на малых данных.

Иные улучшения

Кроме использования REM модели есть еще следующие улучшения ПББ.

Размежевание

В качестве m лучше использовать REM-оценку взятую не объединение всем ключевым словам, а по всем, кроме текущего. Вследствие этому мы не учитываем дважды одни и тетунька же данные. Также это избавляет от завышения оценки А у небольших клиентов.

Впрочем дифференциация повышает время расчета вдвое. Она требует расчета 180 полигамма цель на 1 ключевик против 90 в случае ее отсутствия.

Пучность апостериори

А что если на сайте очень бедно ключевых слов? В этом случае при вычислении А закругляйтесь большая погрешность.

Как и в случае конверсии, при оценке А позволено сделать среднее взвешенным двух оценок: того А, кто получается максимумом правдоподобия, и того А, который в среднем наблюдаем у других клиентов.

Предположим у клиентов А в среднем равен 1,5. Если у клиента не вдаваясь в подробности нет данных, то можно сказать, что у него А рядом 1,5.

В теории мы можем дать неплохую оценку А, аж если у клиента вообще нет данных. На практике, понятно, нам нужен еще и m, для вычисления которого нужны и так-бы 10–30 конверсий в статистике за несколько месяцев.

В побольше продвинутых версиях движков при оценке А используется в довершение всего данных текущего клиента, распределение А у других клиентов. Сие называется максимумом апостеори. В итоге на небольших данных возрастает константность вычислений А, на больших данных оценки этими двумя методами почти что не отличаются.

Два периода

В оптимизаторах есть юстирование период сбора статистики. Чем он выше тем паче у нас данных и тем меньше погрешность и выше нажива. На первый взгляд этот период нужно понизить.

Однако конверсия ключевых слов меняется во времени. Сие происходит из-за сезонности, погоды, экономической ситуации, улучшений держи сайте, рекламных акций и множества других факторов. Нежели оперативнее мы реагируем на это, тем более прибыли получим. Чтобы повысить оперативность, нужно укоротить период сбора статистики.

Поэтому нужно искать компромиссную длину периода. Разве что период слишком короткий, то точность оценки бросьте невысокой. При слишком длинном периоде, система хорошенького понемножку реагировать на изменения с очень большой задержкой.

В некоторых оптимизаторах став есть 2 периода. Благодаря основному (более длинному) наш брат получаем много данных, а благодаря вспомогательному (более короткому) автор этих строк оперативно реагируем на изменения.

Для больших сайтов дозволяется выставить вспомогательный период в несколько недель, а основной – в полгода. Вследствие чему прогноз будет одновременно и точным, и оперативным.

Степень

Мы довольно легко можем сделать Бета-биномиальную натурщица иерархической. Чтобы она учитывала данные группы объявлений и кампании.

Вначале мы оцениваем конверсию кампании:


Потом вычисляем оценку конверсии группы объявления, используя в (обмен m оценку кампании.


После чего вычисляем оценку ключевого краснобайство, используя оценку группы:


В конечном счете, эти формулы сводятся к средневзвешаному 4-х оценок: за сайту, кампании, группе и самому ключевику. Причем потому как групп и кампаний намного меньше, чем ключевых слов, ведь ресуркоемкость расчета практически не увеличивается, если пишущий эти строки не будем использовать дифференциацию.

Однако иерархическая образец имеет и свои проблемы:

  • Конверсия кампании и средняя переработка ключевого слова кампании – это разные вещи. REM в рамках этой модели безлюдный (=малолюдный) решает проблему.
  • Должна быть четкая иерархия. Пишущий эти строки не можем учитывать какие-то другие оценки вовне иерархии, например по URL.
  • Расчет A на последних уровнях становится безвыгодный стабильным уже у средних клиентов.

Чтобы решить подобные проблемы надлежит более сложная модель, которая требует уже очень большего объема вычислений.

Показатель отказов

В теории ещё прогноза по группам мы можем использовать и кое-кто оценки. Самая важная из них это квалиметрия по показателю отказов. Например, пусть b – это рейтинг отказов. Чем выше показатель отказов, тем не в такой степени. Ant. более конверсия. Вот самый простой метод:



Например, m = 1%, а бонитет отказов по сайту равен 60%, тогда k = 1%/(1-60%)=1%/40%=0,025=2,5%.

Пусть, у ключевика 80% отказов, тогда мы можем сойтись следующую оценку конверсии:


Допустим, у другого ключевика 30% отказов, тем временем мы можем дать следующую оценку конверсии:


Эту муляж можно понять благодаря воронке из трех шагов. Наперво идут клики, часть из них становится отказами. Оставшиеся клики (маловыгодный отказы) с некоторой вероятностью (k) превращаются в конверсии.


Чтобы выгнать вес этой оценки, нужно оценить ее ошибка. Она состоит из двух компонентов. Пусть B сие вероятность отказа, тогда


  • Погрешность данных. Возникает изо-за того, что вероятность отказа не равна показателю отказов. Присутствие увеличении числа кликов снижается вплоть до нуля бери бесконечном объеме данных. Обычно в 5–20 раз ниже, нежели у показателя конверсий.
  • Систематическая погрешность возникает из-вслед за того, что наша модель не абсолютно точна. Изо-за того, что k у разных ключевых слов разные разности. Эта погрешность не зависит от объема данных. Присутствие бесконечном объеме данных суммарная погрешность была бы равна систематической.

Дозволительно использовать более сложную модель, в которой есть паки (и паки) и скрытые отказы, в ней систематическая погрешность невелика. Каста модель очень точно предсказывает промежуточные цели нав добавления товара в корзину.

Ошибка данных тоже невелика. Обыденно вероятность отказов в районе 50%, а конверсия 1%. В этом случае, в противном случае бы систематическая ошибка была нулевой, то наша калема при 10 кликах была бы такой но точной, как и показатель конверсии при 1000!

Если у ключевого пустословие будет очень мало кликов, то оценка по части отказам будет хуже оценки по группам. Да с ростом числа кликов она будет быстро рационализоваться (намного быстрее, чем показатель отказов) до тех пор, до ((сего не достигнет систематической ошибки.


Обычно основная толпа кликов у клиента приходится как раз на тетечка ключевики, у которых не сильно много и не усильно мало кликов. У таких ключевиков лучше всего работает рецензия по отказам, и поэтому оценка по отказам существенно повышает качество итоговой оценки.

В общем, несмотря в то что оценка по отказам только одна изо многих, ее вклад в увеличение прибыли довольно высок.


Ни дать ни взять мы видим, при не сильно большом числе кликов, эскомпт отказов значительно повышает прибыль.

Заключение

Оптимизаторы пруд оценивают конверсию по множеству факторов. Показатель конверсии Водан из них, но при маленьком числе кликов у ключевика его взнос в общую оценку будет незначительным.

Показатель конверсии по обыкновению играет существенную роль только у высокочастотных ключевых слов, рано ли он довольно достоверно отражает конверсию.

При расчете конверсии используется среднее взвешенное нескольких оценок. Буде какая-то из оценок имеет высокую ляпсус (как показатель при малом числе кликов), в таком случае она просто берется с очень маленьким весом. Сие не ухудшает оценку.

Источник: www.seonews.ru