Вторничные анонсы: Туториал по регулярным выражениям
В этот четверг, 31 марта, собираемся на туториал по регулярным выражениям от Дмитрия Колодезева.
Регулярные выражения - швейцарский нож для обработки текста. Примеры, решаемые регулярными выражениями:
- проверка текста на совпадение с маской
- поиск текста по шаблону (извлечение всех адресов электронной почты из текста документа)
- подготовка текста (замена и удаление спецсимволов)
- анонимизация (замена телефонов, номеров кредитных карт, IP-адресов и email)
- токенизация (разбиение на токены)
- разбор строк по шаблонам
- простое извлечение фактов (построение признаков)
Мы разберем использование регулярных выражений в языке python - библиотеки re и regex. Если останется время - разберем регулярные выражения в базах данных и утилитах командной строки.
Дата: 31 марта, 19:00 НСК (15:00 МСК)
Место: 247 аудитория ИМ
Трансляция: обязательно будет (запись тоже)