Teori permainan
adalah salah satu cabang matematik gunaan yang mengkaji individu(pemain) membuat keputusan yang terbaik dalam sesuatu situasi.
Teori permainan
memodelkan bagaimana agen-agen (misalnya, manusia) bersaling tindak apabila hasil tindakan sesuatu agen itu bergantung kepada tindakan agen yang lain (yang diluar kawalan agen pertama). Biasanya, agen mempunyai
kepintaran
yang membolehkannya
belajar
dari keadaan dahulu dan juga merangka
strategi
.
Teori permainan digunakan dalam
sains komputer
, terutama
kepintaran buatan
, untuk misalnya, membina
permainan komputer
. Dalam
ekonomi
, ia digunakan untuk memodelkan
pembuatan keputusan
. Ia juga digunakan untuk model-model salingtindak antara unsur-unsur dalam
ekologi
. Kini teori permainan banyak digunakan dalam model-model multiagen dalam
fizik sosial
dan
ekonofizik
.
Teori permainan moden bermula dengan idea keseimbangan strategi campuran dalam permainan hasil tambah sifar dua orang dan dibuktikan oleh John Von Neumann. Bukti asal Von Neumann menggunakan teorem titik tetap Brouwer pada pemetaan berterusan ke dalam set cembung padat, yang menjadi kaedah standard dalam teori permainan dan
ekonomi matematik
. Kertas kerjanya telah dibukukan dengan tajuk
Theory of Games and Economic behaviour
pada tahun 1944. Buku beliau juga mempunyai seorang penulis bersama lain yang bernama Oskar Morgenstern, yang menganggap sebagai permainan pakatan beberapa pemain. Edisi kedua buku ini menyediakan teori aksiomatik utiliti dijangka yang membenarkan ahli statistik matematik dan ahli ekonomi menangani pembuatan keputusan di bawah keadaan ketidakpastian.
Teori permainan telah dibangunkan secara meluas pada tahun 1950-an oleh ramai sarjana. Ia digunakan secara eksplisit pada evolusi pada tahun 1970-an, walaupun perkembangan serupa berlaku sekurang-kurangnya pada tahun 1930-an. Teori permainan telah diiktiraf secara meluas sebagai alat penting dalam pelbagai bidang seperti ekonomi, perniagaan, politik dan sebagainya. Sehingga tahun 2020,
Hadiah Memorial Nobel
dalam Sains Ekonomi telah diberikan kepada pakar teori permainan iaitu Paul Milgrom dan Robert B. Wilson dan lima belas pakar teori permainan lain-lain yang memenangi
Hadiah Nobel Ekonomi
. John Maynard Smith telah dianugerahkan Hadiah Crafoord untuk aplikasi teori permainan evolusinya.
Permainan pakatan
Pemain dalam permainan ini boleh berunding dengan pemain lain untuk mengikat perjanjian bersama bagi mengambil strategi bersama.
Permainan bukan pakatan
Pemain dalam permainan ini tidak melakukan rundingan dengan pemain lain untuk mengambil strategi bersama.
Dalam sains komputer, permainan boleh dilihat sebagai
penggelintaran
ruang keadaan
(atau
graf keadaan
bila keadaan-keadaan yang dibenarkan adalah diskret), dan pergerakan diwakilkan ke atas suatu
pepohon gelintaran
.
Bagi permainan di antara dua pemain,
graf minimaks
diperolehi di mana diandaikan setiap pemain akan melakukan pergerakan yang paling menguntungkan masing-masing.
Bagi permainan satu pergerakan, di mana setiap pemain membuat pilihan serentak, kita boleh wakilkan permainan dengan suatu
matriks ganjaran
, yang memberikan ganjaran yang diperolehi sesuatu pemain bergantung kepada pilihannya dan juga pilihan pemain kedua.
Dilema banduan
. Permainan dua orang satu pergerakan di mana pemain punyai dua pilihan: kerjasama (
k
) atau belot (
b
). Jika kedua-dua pemain pilih
k
, kedua-duanya mendapat ganjaran positif, tetapi jika pemain 1 pilih
k
dan pemain 2
b
, maka pemain 2 mendapat ganjaran lebih besar, sementara pemain 1 mendapat hukuman (ganjaran negatif). Jika kedua-duanya
b
, maka kedua-duanya tidak memperolehi apa-apa (ganjaran sifar). Permainan ini telah digunakan sebagai model untuk menerangkan
evolusi kerjasama
(di sebalik ketamakan
kemandirian yang tercocok
) oleh
John Maynard Smith
.
Hanyutan salji
atau
Ayam
. Ini seperti dilema banduan, cuma apabila kedua-dua pemain belot, kedua-dua mendapat hukuman yang lebih berat daripada yang didapati oleh sipembelot dalam kes satu belot sahaja. Ini dikatakan memerihal banyak perlawanan di antara haiwan, terutama yang memanjang.
Buruan rusa
. Ini juga seperti dilema banduan, cuma di sini ganjaran kerjasama dalam kes pemain yang lain belot, adalah kurang daripada ganjaran kerjasama dalam kes kedua-duanya kerjasama.
Permainan minoriti
. Banyak pemain diberi dua pilihan. Ganjaran diperolehi apabila memilih pilihan yang paling kurang dipilih pemain lain. Permainan diperkenalkan oleh
Zhang
dan
Challet
, menjadi satu paradigma dalam ekonofizik.
Dilema penyimpang
. Ramai pemain pilih di antara "penyimpang" (
D
) dan "pseudo" (
P
).
P
untung selagi ada
D
untuk diperkudakan.
Mohd Azhar Abdul Karim
dan
Wan Ahmad Tajuddin Wan Abdullah
memperkenalkan permainan ini untuk memodel persekitaran akademik.
Batu-burung-air
. "O-zom" dalam permainan kanak-kanak, ialah permainan dua orang dengan tiga pilihan. Batu kalah kepada air, tetapi air kalah kepada burung, dan burung kalah kepada batu.