Введение

Многие языки программирования заставляют нас мыслить на неудобном низком уровне. Вам понадобилась строка, а язык хочет, чтобы вы работали с указателем или байтовым массивом. Впрочем, не отчаивайтесь - Perl не относится к языкам низкого уровня, и в нем удо Perl проектировался для обработки текста, В сущности, в Perl существует такое количество текстовых операций, что их невозможно описать в одной главе. Рецепты обработки, текста встречаются и в других главах. ,В частности, обратитесь к главе ,6 "Поиск по ша Фундаментальной единицей для работы с данными в Perl является скаляр (scalar), то есть отдельное значение, хранящееся в отдельной (скалярной) переменной. В скалярных переменных хранятся строки, числа и ссылки. Массивы и хэши представляют собой соответстве Строка не является массивом байт; к отдельному символу нельзя обратиться по индексу, как к элементу массива - для этого следует воспользоваться функцией substr. Строки, как и все типы данных Perl, увеличиваются и уменьшаются в размерах по мере необходимос Скалярная величина может быть определенной или неопределенной. Определенная величина может содержать строку, число или ссылку. Единственным неопределенным значением является undef, все остальные значения считаются определенными - даже 0 и пустая строка. О Две определенные строки считаются ложными: пустая строка ("") и строка единичной длины, содержащая цифру "ноль" ("О"). Возможно, второе вас несколько удивит, по это связано с тем, что Perl выполняет преобразования между числами и строками по мере необходи В строковом контексте значение undef интерпретируется как пустая строка (""). В числовом контексте undef интерпретируется как 0, а в ссылочном - как нуль-ссылка. При этом во всех случаях оно считается ложным. Использование неопределенной величины там, где В программах строки записываются в апострофах или кавычках, в форме q// или qq// или "встроенных документов" (hero-documents). Апострофы используются в простейшей форме определения строк с минимальным количеством специальных символов: ' - завершает строку $string = '\n'; # Два символа, \ и n $string = 'Jon \'Maddog\' Orwant'; # Внутренние апострофы В строках, заключенных в кавычки, возможна интерполяция имен переменных (но не вызовов функций - о том, как это делается, см. рецепт 1.10). В них используется множество служебных символов: "\п" - символ перевода строки, "\033" - символ с восьмеричным кодо $string = "\n"; # Символ перевода строки $string = "Jon \"Maddog\" Orwant"; # Внутренние кавычки Операторы q// и qq// позволяют чередовать разделители строк с апострофами и кавычками. Например, строку с внутренними апострофами проще записать в следующем виде, вместо того чтобы использовать служебные символы \':28 Глава 1 o Строки $string = q/Jon 'Maddog' .Orwant/; #Внутренние апострофы В качестве разделителей могут использоваться одинаковые символы, как в этом примере, или парные (для различных типов скобок):
$string = q[Jon 'Maddog'Orwant]# Внутренниепострофы
$string=q{Jon'Maddog'O.rwant}# Внутренние апострофы
$string= q(Jon 'Maddog'Orwant)#Внутренние апострофы
$string=q #Внутренние апострофы

Концепция "встроенных документов" позаимствована из командных интерпретаторов (shell) и позволяет определять строки, содержащие большое количество текста. Текст может интерпретироваться по правилам для строк, заключенных в апострофы или кавычки, и даже ка $а = ""EOF"; This is a multiline here document .terminated by EOF on a line by itself EOF Обратите внимание: после завершающего EOF точка с запятой не ставится. Встроенные документы более подробно рассматриваются в рецепте 1.11. Предупреждение для программистов из других стран: в настоящее время Perl не обладает прямой поддержкой многобайтовых кодировок (в версии 5.006 ожидается поддержка Unicode), поэтому в тексте книги понятия байт и символ считаются идентичными.

1.1. Работа с подстроками

Введение

1.1. Работа с подстроками

Проблема

Решение

Комментарий