Регулярний вираз: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Int ua (обговорення | внесок)
→‎Символьні класи (набори символів): Інформація про використання діапазонів для українського алфавіту з Юнікодом.
Int ua (обговорення | внесок)
Рядок 63:
 
==== Символьні класи (набори символів) ====
Набір символів у квадратних дужках {{cn|<nowiki>[</nowiki>}} {{cn|<nowiki>]</nowiki>}} іменуєтьсяназивається символьним класом і дозволяє вказати інтерпретаторові регулярних виразів, що на даному місці в рядку може стояти один із перерахованих символів.
Зокрема, {{cn|<nowiki>[абв]</nowiki>}} задає можливість появи в тексті одного із трьох зазначених символів, а {{cn|<nowiki>[1234567890]</nowiki>}} задає відповідність одній із цифр.
Можливе зазначення діапазонів символів: наприклад, {{cn|<nowiki>[0-9]</nowiki>}}.
 
Для включення усіх символів українського алфавіту можна використовувати {{cn|<nowiki>[Є-ЯҐаЯҐ]</nowiki>}}, {{cn|<nowiki>[а-їґ]</nowiki>}}.<ref>Для зручного використання послідовностей літер у деяких мовах необхідно встановити кодову сторінку, у якій ці послідовності будуть іти в порядку від і до зазначених символів. У Юнікоді деякі літери українського алфавіту знаходяться за межами діапазонів А-Я та а-я. [http://www.unicode.org/charts/PDF/U0400.pdf]</ref>
 
У Юнікоді деякі літери українського алфавіту знаходяться за межами діапазонів А-Я та а-я. [http://www.unicode.org/charts/PDF/U0400.pdf]
</ref>
 
Якщо потрібно вказати символи, які не входять у зазначений набір, то використовують символ {{cn|<nowiki>^</nowiki>}} усередині квадратних дужок, наприклад, {{cn|<nowiki>[^0-9]</nowiki>}} означає будь-який символ, крім цифр.