Новости

Язык регулярных выражений для интернет-маркетолога

Автор Дата 21.05.2019

В работе всемирная сеть-маркетолога часто приходится сталкиваться с регулярными выражениями: кластеризация семантики, измерение конкурентов, работа с данными веб-аналитики, настройка редиректов и сервисов инет-маркетинга.

Большинство руководств по RegExp сложны и ориентированы держи технарей, при этом абстрактно описывают область применения сего инструмента.

В статье хочу поделиться частыми кейсами применения регулярных выражений в всемирная сеть-маркетинге, дать советы по инструментарию, который позволит всякий день использовать регулярные выражения в работе.

Регулярные выражения Древней Греции

Intro

Матерьялец рассчитан на интернет-маркетологов и SEO-специалистов без опыта в программировании, заключает упрощения и терминологические неточности. Это осознанный шаг в (видах снижения порога входа в тему.

Регулярные выражения – сие последовательности символов (масок), которые определяют поисковые паттерны близ использовании операции «найти/заменить». Синтаксис RegExp поддерживается множеством приложений и сервисов.

Да не будем начинать с описания синтаксиса, а лучше давайте зараз посмотрим, как и где регулярные выражения применяются, какую пользу позволено извлечь, а когда будет понятна ценность – вы сможете расточить и закрепить полученные знания.

1. Настройка целей в Google Analytics

Ну, на нашем сайте есть коллтрекинг и форма обратной маза, а при отправке формы или звонке по подменному номеру коллтрекинга в Google Analytics отправляются действие, которые считаются в разных целях.

   

Для оптимизации кампаний числом CPL будет удобнее параллельно считать эти события в общей цели. Регулярные выражения позволяют ухлопать эту задачу и поддерживаются Google Analytics. Посмотрим, вроде будет выглядеть настройка общей цели:

Настройки интересах общей цели в Google Analytics

Разберем значения полей, так чтобы понять условия срабатывания:

  • «|» – вертикальный разделитель, логическое «ИЛИ». Сперва проверяется условие слева от разделителя, затем положение справа. В нашем случае это вхождение form иначе phone в категорию, sent или call в действие и что-то около далее.
  • «^» – крышечка, начало строки и «$» – доллар, конец строки. Используем, так чтоб исключить ложное срабатывание, если какой-то служба будет отправлять не одноименное, но схожее эпитет события (категории, действия, ярлыка).

Источников событий может находиться много – email-трекинг, онлайн-чат, виджет обратного звонка. С через регулярок легко объединить все эти события в одной цели.

2. Наладка показа через Google Tag Manager

Частая задача присутствие подключении виджетов через GTM – выбор страниц показа. Так, мы решили использовать виджет с Pop-up формой «Подпишитесь возьми рассылку» для сбора email-адресов в разделе «Статьи».

Google Tag Manager опять же поддерживает синтаксис регулярных выражений, настроим триггер угоду кому) виджета, который хотим показывать на страницах статей:

У нас появились новые символы: «.» – пе, любой символ (буква, цифра, спецсимвол), в сочетании со звездочкой «*», обозначает что ни попало количество любых символов, то есть любую страницу, вложенную в articles, включительно ее саму.

3. Настройка редиректов в .htaccess

С настройкой 301 редиректов чаще сталкиваются разработчики и SEO-специалисты, да и для интернет-маркетолога навык не будет лишним. На собственном опыте меня знание этого функционала часто выручало в «переездах» в кругу сайтами и фиксинге проблем.

Допустим у нас был сайт, идеже все услуги лежали по адресу http://example.org/uslugi/*, а хана статьи по адресу http://example.org/stati/* – для новом сайте все материалы переехали в другие разделы, рядом этом адреса всех вложенных страниц сохранились.

Коль (скоро) страниц немного, можно пойти простым путем и расправиться редиректы для каждой, но что если страниц сотни другими словами даже тысячи? Тут не обойтись без регулярных выражений. Следовательно, подключаемся по FTP/SSH, открываем .htaccess и вносим правки:

Никак не будем вникать в синтаксис .htaccess, а сосредоточимся на используемых регулярных выражениях. Тута мы видим знакомые нам символы начала строки «^» и конца строки «$», а опять же любого количества любых символов «.*».

Символы «.*» заключены в скобки, а в конце порядок перенаправления появился «$1». Скобки можно назвать запоминающими – они сохраняют заключенную в них преемственность для каждой строки и передают ее в переменную $1.

Таким образом что угодно перенаправления с любой страницы будет корректно переадресовано в новую директорию и мало-: неграмотный потребуется прописывать кучу редиректов.

4. Экспорт в электронную таблицу

Другая частая назначение – когда надо собрать информацию из какого-ведь сервиса и представить ее в табличном виде, а экспорта данных в CSV недостает.

Например, мы решили выбрать название для своего лампового блога ровно по интернет-маркетингу и нагенерили 1000 вариаций доменных имен.

Реестр доменов после генерации

Потом мы их пакетно проверили нате возможность регистрации и теперь хотим сделать табличку и извлечь лучший вариант с учетом стоимости и возможности регистрации.

Результаты пакетной проверки доменов

Даже если мы попробуем скопировать эту информацию в электронную таблицу, ведь получим много строк никак не разделенного текста. А да мы с тобой хотим, чтобы домен, стоимость, доменная зона и ее тематика были в разных столбцах пользу кого фильтрации данных.

Под решение этой задачи потребуется общество для работы с регулярными выражениями. Самое удобное отгадка – это приложение Notepad++, возможен также и вариант использования надстройки про Excel или других программ, например, Calc Open Office ((нечто MS Excel) поддерживает регулярки «из коробки».

Скопировав результаты проверки в обложка получим: домены с новой строки, цены – тоже с новой строки, все на свете данные разделены пробелами, без табуляции.

Напомню, наша сестра хотим получить таблицу, где первый столбец с доменным именем, другой с ценой, третий с доменной зоной, четвертый – тематика доменной зоны.

Исполнение) этого нам надо будет выполнить несколько последовательных действий. В нашем примере я работаем с тысячами доменов и сделать это руками – мало-: неграмотный вариант.

Последовательность операций «найти/заменить», которые приведут нас к результату:

1. Спрятать пробел, отделяющий разряды в цене.

Условие поиска: ([0-9]) ([0-9][0-9][0-9]) – находим числа, разделенные пробелами, и запоминаем их в первые и вторые запоминающие скобки.

Договоренность замены: $1$2 – результат первых запоминающих скобок ($1) добавляем ко второму ($2), вне пробела.

Удаление пробела

2. Убрать копейки и «руб» изо цены.

Условие поиска: .00 руб – чтобы «.» была далеко не любым символом, а точкой, перед ней надо присчитать обратный слеш (экранировать)

Условие замены: пустая линия.

Удаление копеек

3. Убрать переносы строк.

Первая абзац в нашем файле заканчивается на английскую букву (доменной зоны), а следующая следовать ней строка начинается с цифры (цены) – надо убрать переносы строк.

Условие поиска: ([a-z])rn([0-9]) – находим латинскую букву в конце строки r и цифру, с которой начинается новая линия n, используем две пары запоминающих скобок.

Условие замены: $1 $2 – результаты первых запоминающих скобок добавляем ко вторым запоминающих скобкам вследствие символ пробела.

Удаление переносов строк

4. Заменить пробелы сверху символы табуляции.

Осталось заменить оставшиеся пробелы нате символы табуляции t.

Замена пробелов на табуляцию

Ныне копируем и вставляем полученные результаты в электронную таблицу. Показатели представляются корректно, с ними удобно работать.

Данные в табличном виде

Outro

Приставки не- буду приводить длинного академического описания всех символов – уплетать Wiki и много материалов, более глубоких и терминологически правильных, нежели этот. Я хотел лишь упростить сложное, заинтересовать, затем) чтоб(ы) вы начали работать с регулярками.

Если вам следственно интересно – рекомендую установить себе надстройку для Excel, считать Notepad++, чтобы среда для работы с RegExp век была под рукой. А если что-то безграмотный получится – есть сервисы для отладки, которые до мельчайших подробностей описывают работу вашего регулярного выражения посимвольно, что-то крайне удобно. Удачи!

Источник: www.seonews.ru