Класс Normalizer
(PHP 5 >= 5.3.0, PHP 7, PECL intl >= 1.0.0)
Введение
Нормализация - это процесс преобразования символов и их последовательностей
в формальное представление более низкого уровня.
Данный процесс крайне важен при сравнении строк при сортировке или
при поиске, но также используется при сохранении текста, что бы быть
уверенным в том, что он сохранился корректно.
Консорциум Unicode определил несколько форм нормализации, отражающих
разные потребности приложений.:
- Normalization Form D (NFD) - Каноническое разложение
-
Normalization Form C (NFC) - Каноническое разложение с последующей канонической сборкой
-
Normalization Form KD (NFKD) - Совместимое разложение
-
Normalization Form KC (NFKC) - Совместимое разложение с последующей канонической сборкой
Различные формы задаются в требованиях наборов преобразований текста.
Преобразования вычисляются с алгоритма и набора файлов данных.
Обзор классов
Normalizer
{
public
static
bool
isNormalized
(
string $input
[,
int $form = Normalizer::FORM_C
] )
public
static
string
normalize
(
string $input
[,
int $form = Normalizer::FORM_C
] )
}
Предопределенные константы
Данные константы задают форму нормализации, используемую нормализатором:
-
Normalizer::FORM_C
(integer)
-
Форма нормализации C (NFC) - Каноническое разложение, после которого каноническая сборка
-
Normalizer::FORM_D
(integer)
-
Форма нормализации D (NFD) - Каноническое разложение
-
Normalizer::FORM_KC
(integer)
-
Форма нормализации KC (NFKC) - Совместимое разложение, после которого каноническая сборка
-
Normalizer::FORM_KD
(integer)
-
Форма нормализации KD (NFKD) - Совместимое разложение
-
Normalizer::NONE
(integer)
-
Без разложения/сборки
-
Normalizer::OPTION_DEFAULT
(integer)
-
Обычные настройки нормализации
Содержание
There are no user contributed notes for this page.