10 RegEx тестер за JavaScript, Python, PHP, Golang, Ruby и др.

Изразът на Regex може да бъде болка. Е, понякога!

Нека научим за регулярните изрази и техните модели. Ще разгледаме такива модели, които изглеждат като сложна супа от герои. Ще видим какво означава всеки знак в регулярен израз.

След като прочетете тази статия, вие ще можете да създавате своите регулярни изрази и да ги използвате както желаете. В крайна сметка ще изброим някои от онлайн инструментите за тестване на RegEx, така че въз основа на изискването можете да създадете своя RegEx и да го тествате с помощта на тези инструменти.

Въведение

Регулярни изрази или както е известно – RegEx е всяка последователност от знаци, която може да се използва като шаблон за търсене на знаци или низове.

Например – за да определим дали даден низ или фраза съдържа думата „ябълка“, можем да използваме регулярния израз „/ябълка“, за да търсим в низа. Като друг пример можем да използваме „/[0-9]”, за да проверите дали даден низ съдържа число между 0 и 9.

Регулярни изрази и тяхното използване

Регулярните изрази се използват широко за различни цели в съвременните уеб операции. Валидирането на уеб формуляри, уеб търсачките, лексикалните анализатори в IDE, текстовите редактори и редакторите на документи са сред няколко примера, където често се използват регулярни изрази.

  Как да активирате мрежовия изглед на Google Meet

Всички сме използвали „CTRL + F“ много пъти, за да търсим в документ или част от код, за да намерим определена дума, фраза или израз. Тази операция може да се посочи като много често срещан пример за използване на регулярни изрази.

Преди да продължим, нека да разгледаме един много често използван регулярен израз.

Можете ли да познаете 🤔 RegEX по-долу за какво се използва?

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Не се притеснявайте, ако не можете да го познаете. Сигурен съм, че ще можете да познаете до края на тази статия.

Първо нека започнем с A, B, C на RegEx.

Токени

Като начало, нека разгледаме различните символи в регулярния израз, показан по-горе.

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Ако погледнем регулярния израз, даден по-горе, можем да видим, че той е съставен от много символи, знаци или токени. Нека разберем какво означават:

Токен

Значение

^

Този токен обозначава началото на низ.

(…)

Това означава група, в която всичко, което е дадено в рамките на (…), е уловено.

[…]

The [] обхваща знаци, всеки от които може да бъде съпоставен. Например – [abc] ще съответства или на a, или b, или c.

az

Набор от малки букви от a до z. Трябва да имаме предвид, че Regex е чувствителен към главни и малки букви.

  Интегрираната графика е на път да стане много по-добра

AZ

Набор от главни букви от A до Z.

0-9

Цифрите от 0 до 9.

_

Това ще съответства на знака _.

Това е героят за бягство.

.

Това съответства на знака „.“ буквално. Това се използва, защото символът „.“ в regex е само по себе си токен, който съответства на всеки знак

+

Това е квантификатор. Това съвпада с един или повече символи, с които се използва. Например a+ означава едно или повече срещания на символа a.

Това ще съответства на знака „-“.

@

Това ще съответства на знака „@“.

{}

Това е друг количествен показател. Използва се за обозначаване на броя на срещанията на символ. Например a{3} означава точно 3 a.

$

Това обозначава края на низ.

Разбивка на дадения модел Regex

Сега, въоръжени с тези предварителни познания за токените, нека се опитаме да декодираме горния регулярен израз:

  • ^([a-zA-Z0-9_-.]+) означава, че търсим низ, който започва с поне един или повече главни или малки буквено-цифрови знаци, долни черти, тирета или точки. Например, всичко, което изглежда подобно на user_name.01, ще съответства на модела. Трябва да помним, че тук не е необходимо да включвате всички символи, а само един знак [a-zA-Z0-9_-.] ще го направя.
  • Символът @ съвпада с едно срещане на @. Като добавим към предишния пример нещо подобно [email protected] ще пасне.
  • ([a-zA-Z0-9_-.]+) е подобен на първата точка. Това също означава, че търсим низ, който съдържа поне един или повече буквено-цифрови символи, долни черти, тирета или точки. Добавяйки към примера, [email protected] ще пасне тук.
  • Както може би вече се досещате, ние загатваме за модел на имейл. Преместване на, . съвпада с единичното „.“ характер. Ако продължим с продължаващия пример, нещо подобно [email protected]
  • ([a-zA-Z]{2,5})$ това означава, че низът трябва да завършва с 2 до 5 азбучни знака, главни или малки. Ако добавим .com към предишния пример, можем да получим [email protected]което е често срещаният модел на имейл низ.
  7 Deepfake приложения за създаване на най-добрите мемове

Комбинирайки всичко по-горе, можем да видим, че търсим низ с идентификатор на имейл. Сега можем да използваме този израз, за ​​да потвърдим всеки имейл идентификатор. Ако нашият тестов имейл идентификатор съответства на този модел, можем да кажем, че това е валиден имейл идентификатор.

PS – Това е модел за най-често срещаните имейл адреси в мрежата.

Видове токени

Много токени могат да се използват в различни комбинации в рамките на Regex, за да опишат голямо разнообразие от изрази. По-долу ще разгледаме различните видове токени, които се използват в регулярни изрази. Освен това ще разгледаме най-често използваните токени във всяка категория.

Основни токени

Да започнем с основните токени. Тези токени се използват с почти всеки регулярен израз. Следователно първо трябва да научим за тях.

Токен

Значение

r

Това съответства на знака за връщане на каретката.