Определение
подпрограммы
Подпрограммы в языке Perl
играют ту же роль, что и функции в языке С, или процедуры и функции в языке
Pascal. Они выполняют две основные задачи:
позволяют разбить одну (большую
программу на несколько небольших частей, делая ее более ясной для понимания;
объединяют операторы в'одну группу
для повторного использования. В языке Perl не различаются понятия "подпрограмма"
и "функция", эти слова являются синонимами.
Подпрограмма может быть определена
в любом месте основной программы при помощи описания
sub name [(proto)] ({block}};
Здесь name имя подпрограммы;
(proto) прототип, конструкция,
используемая для описания передаваемых подпрограмме параметров;
{block} блок операторов,
являющийся определением подпрограммы и выполняющийся при каждом ее вызове.
Форма
sub name [ (proto)];
представляет собой предварительное
объявление подпрограммы без ее определения. Пользователь, предпочитающий помещать
описания всех подпрограмм в конце основной программы, должен при вызове еще
не определенной фуНКЦИИ ИСПОЛЬЗОВаТЬ Специальный СИНТаКСИС &лагае ИЛИ
name. Если же некоторое имя предварительно объявить в качестве имени функции,
то сразу после объявления к этой функции можно обращаться просто по имени без
применения специального синтаксиса.
#!/usr/bin/perl sub max {
my $maximum = shift @$_;
my $x;
foreach $x (@_) {
$maximum=$x if ($x > $maximum)
;
}
return $maximum } print "Наибольший
аргумент=", max(3,5,17,9), "\n";
В данном примере функция max ()
возвращает наибольший из своих аргументов. Об использовании функции ту() и массива
@_ будет рассказано ниже.
Данный способ определения подпрограмм
не является единственным. Существуют и другие варианты:
текст подпрограммы может храниться
в отдельном файле и загружаться в основную программу при ПОМОЩИ КЛЮЧеВЫХ СЛОВ
do, require, use;
П строка, содержащая текст
подпрограммы, может быть передана в качестве аргумента функции eval о (см.
в части 10); в этом случае компиляция кода
подпрограммы осуществляется при каждом вызове функции eval ();
анонимную подпрограмму можно
определить при помощи ссылки на нее (см.
в части
9).
Применение функции eval () и ссылки
на анонимную подпрограмму были рассмотрены ранее.
Конструкция do filename
вызывает выполнение Peri-программы, содержащейся в файле filename.
Если файл filename недоступен для чтения, функ-ция do возвращает неопределенное
значение и присваивает соответствующее значение специальной переменной $!. Если
файл filename может быть прочитан, но возникают ошибки при его компиляции
или выполнении, то функция do возвращает неопределенное значение и помещает
в переменную $@ сообщение с указанием строки, содержащей ошибку. Если компиляция
прошла успешно, функция do возвращает значение последнего выражения,
Вычисленного В файле filename.
|
Замечание
|
|
Специальная переменная $! служит
для хранения сообщения о последней системной ошибке. Такая ошибка возникает
при обращении „к операционной системе с запросом на предоставление некоторой
услуги, как, например, создание файла, чтение или запись в него. |
Специальная переменная $@ 'используется
для хранения сообщения, генерируемого при последнем обращении к функциям eval
() или do filename,
# файл "l.pl":
#!/usr/bin/perl \ do "2.pi";
\ print "ошибка: $@\n" if $@; do "3.pl"; ' . j
print "системная ошибка: $!\n" if $!;
# файл "2.pi":
$x=l;
$y=0;
$z=$x/$y;
print "z= $z\n";
Peri-программа "i.pi",
используя конструкцию do filename, пытается выполнить сценарии, содержащиеся
в файлах "2.pi" и "З.р1". Первый из них содержит в третьей
строке операцию деления на 0, вызывающую появление ошибки во время выполнения
программы, а второй вообще не существует. В результате выполнения файла "i
.pi" будут выведены следующие сообщения:
ошибка: Illegal division by zero
at 2.pi line 3. системная ошибка: No such file or directory
Ключевые слова use и require используются
для включения в текущую программу подпрограмм из других модулей.
(Директивы компилятора use
и require рассмотрены в части 12 )
Вызов
подпрограммы
Мы знаем, что принадлежность к
тому или иному типу определяется префиксом имени: $х — скалярная переменная,
@х — массив, %х — ассоциативный массив. Префиксом функции является символ "&".
К любой подпрограмме можно обратиться, указав ее имя с префиксом &:
Sname args; Sname(args); Sname;
Здесь args обозначает список аргументов
подпрограммы. Если список аргументов отсутствует, вместо него используется специальный
массив @_.
Если после имени подпрограммы
следуют скобки, префикс & можно опустить:
name (args); name();
Если до обращения к ней подпрограмма
была объявлена или импортирована, то скобки также можно опустить:
sub name {. . .}; name args;
name ;
Если подпрограмма вызывается через
ссылку на нее, префикс является обязательным:
$subref = sub (...}; Ssubref(args)
;
ssubref;
Подпрограмма может быть использована
в выражении как функция, возвращающая значение. По умолчанию значением подпрограммы
является последнее вычисленное в ней выражение. Его можно изменить, указав явно
в качестве аргумента функцию return () в любой точке подпрограммы. Возвращаемое
значение может быть скалярной величиной или массивом.
Локальные
переменные в подпрограммах
Областью видимости
или областью действия переменной мы будем называть часть программы,
где данная переменная может быть использована. В языке Perl, как мы знаем, нет
обязательного явного описания переменных. Точкой определения переменной является
место, где она впервые встречается в программе. Область действия большинства
переменных ограничена пакетом. Исключение составляют некоторые специальные
предопределенные глобальные переменные интерпретатора peri. Пакет — это механизм,
позволяющий создать свое пространство имен для некоторого отрезка программы
(этот отрезок может включать всю программу). Каждый фрагмент кода Perl-лрограммы
относится к соответствующему пакету.
(Пакеты рассматриваются в
части 12 , а специальные переменные
— в части 14 )
Таким образом, переменная, впервые
встретившаяся- в некоторой подпрограмме, становится доступной во всем пакете,
к которому эта подпрограмма принадлежит. Любая переменная в Perl по умолчанию
считается глобальной, но эта глобальность ограничена рамками пакета. Иногда
бывает необходимо ограничить область действия переменной рамками подпрограммы
или блока, в которых она определена. Такие переменные называются локальными.
В языке Perl существуют два способа описания локальных переменных: при
ПОМОЩИ ФУНКЦИЙ my() И local ()
.
Функция
ту()
Функция ту о используется для
объявления одной или нескольких переменных локальными:
my EXPR
и ограничивает их область действия:
подпрограммой;
заключенным в фигурные скобки
блоком операторов;
выражением, переданным на выполнение
функции eval ();
файлом, в зависимости от того,
в каком месте вызвана для объявления переменных сама функция my ().
Если выражение EXPR содержит список
переменных, то он должен быть заключен в скобки:
my ($myvar, @mylist, %myhash);
Одновременно с объявлением переменные
могут быть инициализированы:
my $pi = 3.14159;
ту ($pi, $exp) = (3.14159, 2.71828);
Переменные, объявленные при помощи
функции ту (), доступны в своей области действия только для подпрограмм,
определенных в этой области. Для подпрограмм, определенных за ее пределами,
они недоступны. Такие переменные называют лексическими, а саму область
видимости — лексической или статической областью видимости.
Функция lосаl ()
Функция local () также используется
для объявления и инициализации переменных:
local EXPR;
local ($myvar, @mylist, %myhash);
local $pi = 3.14159;
local ($pi, $exp) = (3.14159, 2.71828);
но, в отличие от функции ту о
она создает не локальные переменные, а временные значения для глобальных переменных
внутри:
подпрограммы;
заключенного в фигурные скобки
блока операторов;
выражения, переданного на выполнение
функции eval ();
файла;
в зависимости от того, в каком
месте вызвана для объявления переменных сама функция local (). Если функция
local () применяется для описания нескольких переменных, они должны быть заключены
в скобки. Если глобальная переменная, объявленная при помощи этой функции, ранее
встречалась до объявления и имела некоторое значение, то это значение сохраняется
в скрытом стеке и восстанавливается после выхода соответственно из подпрограммы,
блока, функции eval (} или файла. Переменная, объявленная при помощи функции
local (), или, точнее, ее временное значение, доступна для' любой функции,
вызванной внутри подпрограммы, блока, функции eval о или файла, в которых сделано
объявление. Такую переменную называют динамической, а ее область видимости
— динамической областью видимости. В • названии отражается тот факт,
что область видимости переменной динамически изменяется с каждым вызовом функции,
получающей доступ к этой переменной.
Функция ту о является относительно
новой, она появилась в версии Perl 5. Для создания действительно локальных переменных
рекомендуется использовать именно функцию ту о, а не функцию local о. Впрочем,
есть несколько исключений. О них мы расскажем ниже.
В следующем примере показано,
чем отличаются переменные, объявленные
При ПОМОЩИ функций mу ()
и local () .
sub fl{
local ($x) = "aaaa";
my($y) = "bbbb";
print("fl: x = $x\n");
print("fl: y='$y\n\n");
f 2 (} ;
print("fl: x = $x\n");
print("fl: у = $y\n\n");
} • ' ' ' sub f2{
print("f2: x = $x\n");
print("f2: y=$y\n\n");
$x = "cccc";
$y = "dddd";
print("f2: x = $x\n");
print("f2: y=$y\n\n");
I
Результатом выполнения данного
примера будет следующий вывод:
II л = aaaa
f. у = bbbb ,
2: x — aaaa
с2: у =
f2: x = cccc £2: у = dddd
fl: x = cccc fl: у = bbbb
Как видно из приведенного результата,
функция f2 () не имеет доступа к переменной $у, объявленной при помощи функции
ту о внутри функции fi () , и, напротив, имеет доступ к переменной $х, объявленной
внутри fl ()
при ПОМОЩИ функции
local () .
Передача
параметров
Информация в подпрограмму и обратно
передается через параметры (аргументы). Для передачи параметров в подпрограмму
используется специальный массив @_. Все параметры запоминаются в элементах массива
$_ [ 0 ], $_ [ 1 ] и т. д. Такой механизм позволяет передавать в подпрограмму
произвольное количество параметров.
Массив @_ является локальным для
данной подпрограммы, но его элементы — это псевдонимы действительных скалярных
параметров. Изменение элемента массива @_ вызывает изменение соответствующего
действительного параметра.
В языках программирования различают
передачу параметров по ссылке и по значению. При передаче
параметров по значению подпрограмма получает копию переменной. Изменение копии
внутри подпрограммы не влияет на ее оригинал. При передаче параметров по ссылке
подпрограмма получает доступ к самой переменной и может ее изменять.
Передача параметров через специальный
массив @_ фактически является передачей параметров по ссылке. В языке Perl можно
реализовать передачу параметров по значению, если внутри подпрограммы при помощи
функции ту о объявить локальные переменные и присвоить им значения фактических
параметров из массива @_, как это сделано в следующем примере.
#!/usr/bin/perl
# Передача в подпрограмму параметров
по значению sub f {
my($x, $y) = @_; return (++$х *
—$у); }
$val = f ^lib-print "Значение
(9+1) * (11-1) равно $val.\n"; $х = 9; $У = 11;
$val = f($x,$y);
print "Значение ($х+1) * ($у-1)
равно $val.\n"; print "Значение \$х остается равным $х, а \$у равным
$у.\п";
Результат выполнения:
Значение (9+1) * (11-1) равно 100.
Значение (9+1) * (11-1) равно 100.
Значение $х остается равным 9,
а $у равным 11.
Передача
по ссылке параметров-массивов
Итак, подпрограмма получает и
возвращает параметры через специальный массив @_. Если параметр является массивом
или хеш-массивом, его элементы также сохраняются в массиве параметров @_. При
передаче в подпрограмму нескольких параметров-массивов или хеш-массивов они
утрачивают свою целостность. Иными словами, после записи параметров-массивов
(хеш-массивов) в массив @_ из него невозможно выделить отдельный параметр-массив
(хеш-массив): все параметры в массиве @_ хранятся единой "кучей".
Для сохранения при передаче в подпрограмму целостности массива или хеш-массива
существуют два основных подхода.
Использование типа
typeglob
Первый подход, более старый, заключается
в использовании внутреннего типа данных, называемого typeglob. Принадлежность
к типу typeglob обозначается
префиксом "*". Префикс "*" можно рассматривать как метасимвол,
вместо которого может стоять любой из префиксов "$", "@",
"%", "&", обозначающих тип данных "скаляр",
"массив", "хеш-массив", "функция" соответственно.
Интерпретатор преобразует переменную типа typeglob, например, *abc, в скалярную
величину. Эта величина является ссылкой на гнездо в таблице символов, содержащее
элементы, разных типов с одинаковым именем abc, и представляет
любой из этих элементов. Например, запись *abc обозначает всю совокупность,
а также любую из следующих переменных: скаляр $abc, массив @abc, хеш %abc, функция
sabc.
(Таблицы символов обсуждаются
в части 12 )
Передача в подпрограмму вместо
параметра-массива или хеш-массива соответствующей переменной типа typeglob является
имитацией передачи параметра-массива (хеш-массива) по ссылке с сохранением его
целостности. Рассмотрим следующий пример.
sub doublargs {
local(*mylist, *myhash) = @_;
foreach $item (@mylist) { $item
*= 2;
}
foreach $key (keys %myhash) { $myhash{$key}
*= 2;
} }
@somelist= (1,2,3); /^~~- """"~\
%somehash=("one"=>5, "two"=>15, "three"=>20);
print "начальные значения:\n\@somelist=@somelist\n"; foreach $key
(keys %somehash) {
print "\$somehash{$key}=$somehash{$key}
";
}
print "\n";
doublargs(*somelist,*somehash);
print "итоговые значения:\n\@somelist=@somelist\n";
foreach $key (keys %somehash) {
print "\$somehash{$key}=$somehash{$key}
"; } print "\n";
Подпрограмма doubiargs принимает
на вход массив и хеш-массив и изменяет их элементы, умножая на 2. Вместо массива
и хеш-массива в подпрограмму передаются соответствующие переменные типа typeglob,
которые легко выделить из массива @_, так как фактически они являются скалярами.
Обратите внимание на применение функции local. Использовать вместо нее функцию
ту здесь нельзя. Переменная типа typeglob не может быть локальной, она представляет
несколько одноименных переменных разных типов из таблицы символов. Далее возникает
вопрос, каким образом изменение в подпрограмме массива @myiist влияет на изменение
фактического параметра gsomeiist. Дело в том, что операция присваивания вида
*х = *у создает синоним *х для гнезда таблицы символов *у, так что осуществление
операции над $х, @х, %х эквивалентно осуществлению этой операции над $у, @у,
%у. В результате присваивания
local(*mylist, *myhash) = @_;
создается псевдоним *myiist для
*someiist, поэтому все изменения элементов массива @myiist внутри подпрограммы
эквивалентны изменениям элементов массива @someiist. Все сказанное справедливо
и для хеш-массивов %myhash и %somehash. Результат подтверждает корректность
передачи массива и хеш-массива по ссылке:
начальные значения:
@somelist=l 2 3
$somehash{one}=5 $somehash{three}=20
$somehashftwo)=15
итоговые значения:
@somelist=2 4 6
$somehash{one}=10 $somehash(three}=40
$somehash{two}=30
Использование ссылок
Второй, более новый способ передачи
массивов в подпрограмму заключается в том, чтобы вместо собственно массивов
или хеш-массивов передавать ссылки на них. Ссылка является скалярной величиной
и ее легко выделить в массиве параметров @_. Внутри подпрограммы остается только
применить к ссылке операцию разыменования для того, чтобы получить доступ к
фактическому параметру. Поскольку ссылки появились только в версии Perl 5, то
этот способ является относительно новым. При помощи ссылок предыдущий пример
можно записать в следующем виде,
sub doublparms {
ray ($listref, $hashref) = @_;
foreach $item (@$listref} { $item
*= 2;
} .
foreach $key (keys %$hashref) {
$$hashref{$key} *= 2;
} }
@somelist=(1,2,3) ;
%somehash=("one"=>5,
"two"=>15, "three"=>20); print "начальные значения:\@somelist=@somelist\n";
foreach $key (keys %somehash) { .
print "\$somehash{$key}=$somehash{$key}
"; }
print "\n";
doublparms(\@somelist,\%somehash);
print "итоговые значения:\n\@somelist=@somelist\n"; foreach $key (keys
%somehash) {
print "\$somehash{$key}=$somehash($key}
"; } print "\n";
Здесь для описания локальных переменных
использована функция ту. Как мы выяснили ранее в этой главе, применение функции
ту в подобном случае реализует передачу параметров по значению. Другими словами,
их изменение внутри подпрограммы не влияет на фактические параметры. Каким же
образом в данном случае осуществляется передача массива и хеш-массива по ссылке?
Дело в том, что по значению передаются только ссылки, указывающие на
фактические параметры: массив @someiist и хеш-массив %somehash. Используя операции
разыменования внутри подпрограммы, мы получаем доступ непосредственно к массиву
@someiist и хеш-массиву %somehash, и изменяем их элементы. В результате выполнения
данного сценария будет выведено:
начальные значения:
@somelist=1 2 3
$somehash{one}=5 $somehash{three}=20
$somehash{two}=15
итоговые значения:
@somelist=2 4 6
$somehash{one}=10 $somehash{three)=40
$somehash{two}=30