AWK
adalah bahasa pengaturcaraan umum yang direka bagi memproses data berasaskan teks, samaada dalam file atau aliran data. Nama AWK merupakan sringkasan nama penciptanya ?
Alfred
A
ho
,
Peter
W
einberger
, dan
Brian
K
ernighan
; bagaimanapun, bukanlah kebiasaan menyebut setiap huruf secara berasingan tetapi untuk mmenyebut ejaannya sama seperti bunyi burung,
auk
(yang menjadi lambang bahasa tersebut seperti sampul buku
The AWK Programming Language
).
awk
, apabila ditulis dalam huruf kecil, merujuk kepada
Unix
atau perisian
Plan 9
yang melaksanakan aturcara yang ditulis dalam bahasa pengaturcaraan AWK.
AWK adalah contoh bahasa pengaturcaraan yang menggunakan jenis data 'String
, array berkait (iaitu array diindex oleh string utama (
key strings
)) dan gambaran biasa (
regular expression
) secara meluas. Kuasa, bentuk, dan kelemahan aturcara AWK dan skrip
sed
mendorong
Larry Wall
untuk mencipta
Perl
. Disebabkan banyak notasi, kesemua bahasa sebegini sering kali digunakan bagi menulis aturcara satu baris
one-liner program
.
AWK is one of the early tools to appear in
Version 7 Unix
and gained popularity as a way to add computational features to a Unix
pipeline
.
Satu versi bahasa AWK adalah ciri piawaian bagi kesemua sistem pengoperasian moden seperti unix yang terdapat hari ini. AWK disebut dalam Spesifikasi UNIX Tunggal - (
Single UNIX Specification
) sebagai salah satu utiliti wajib bagi sistem p[engoperasian
Unix
. Selain kerangka Bourne, AWK adalah bahasa skrip lain yang terdapat di
persekitaran Unix piwaian
. Perlaksanaan AWK wujud sebagai aturcara boleh pasang bagi hampir keseluruhan sistem pengoperasi lain.
$ yes Wikipedia | cat -n | awk 'NR % 4 == 1, NR % 4 == 3' | head -7
1 Wikipedia
2 Wikipedia
3 Wikipedia
5 Wikipedia
6 Wikipedia
7 Wikipedia
9 Wikipedia
$
Perintah
yes
dan
cat
menghasilkan siri baris bernombor sebagai contoh input.
NR
adalah nombor rekod, biasanya baris input, AWK telah baca sehingga kini, Contoh. nombor baris sekarang, bermula dari 1 bagi baris pertama input.
%
adalah operator modulo.
NR % 4 == 1
adalah betul bagi baris input pertama, kelima, kesembilan, dll.,.
Sama juga,
NR % 4 == 3
adalah betul bagi baris input ketiga, ketujuh, kesebelas, dll..
Pola julat adalah palsu sehingga padanan pertama, pada baris 1, dan kemudian kekal benar sehingga dan termasuk padanan bahagian kedua, pada baris 3.
Ia kemudian kekal palsu sehingga bahagian pertama padan sekali lagi pada baris 5.
Bahagian pertama pola julat (
range pattern
) kekal benar, contoh.
1
, boleh digunakan bagi memulakan julat pada permulaan input.
Sama juga, jika bahagian kedua kekal palsu, contoh.
0
, julat kekal sehingga akhir input.
/^--cut here--$/, 0
Cetak baris input dari baris pertama padan gambaran biasa
^--cut here--$
sehingga akhir.
Kekerapan kata, (menggunakan jujukan berkait)
BEGIN { FS="[^a-zA-Z]+"}
{ for (i=1; i<=NF; i++)
words[tolower($i)]++
}
END { for (i in words)
print i, words[i]
}
Sebagaimana kebanyakan bahasa pengaturcaraan lain, skrip AWK lengkap (
self-contained
) boleh dihasilkan dengan menggunakan sinteks yang dikenali sebagai "
shebang
".
Sebagai contoh, perintah UNIX dikenali sebagai
hello.awk
yang memaparkan "Hello, world!" boleh dihasilkan dengan mencipta fail bernama
hello.awk
mengandungi baris berikut:
#!/usr/bin/awk -f
BEGIN { print "Hello, world!"; exit }