В этот четверг, 31 марта, собираемся на туториал по регулярным выражениям от Дмитрия Колодезева.

Регулярные выражения - швейцарский нож для обработки текста. Примеры, решаемые регулярными выражениями:

  • проверка текста на совпадение с маской
  • поиск текста по шаблону (извлечение всех адресов электронной почты из текста документа)
  • подготовка текста (замена и удаление спецсимволов)
  • анонимизация (замена телефонов, номеров кредитных карт, IP-адресов и email)
  • токенизация (разбиение на токены)
  • разбор строк по шаблонам
  • простое извлечение фактов (построение признаков)

Мы разберем использование регулярных выражений в языке python - библиотеки re и regex. Если останется время - разберем регулярные выражения в базах данных и утилитах командной строки.

Дата: 31 марта, 19:00 НСК (15:00 МСК)
Место: 247 аудитория ИМ
Трансляция: обязательно будет (запись тоже)