الفا زیرو۔۔۔۔وہارا امباکر

دسمبر 2017 کو ایک کمپیوٹر پروگرام نے دو الگ مقابلوں میں دوسرے کمپیوٹر پروگرامز سے فتح حاصل کی۔ یہ نتائج اس قدر حیران کن اور پریشان کن تھے کہ اسے کچھ لوگ دنیا کی تاریخ کا ایک انتہائی اہم سنگِ میل قرار دیتے ہیں۔ کمپیوٹر کی کمپیوٹر سے فتح اتنی اہم کیوں؟ اس کے لئے اس کا پس منظر۔

مئی 1997 میں پہلی بار ایک کمپیوٹر پروگرام نے شطرنج کے عالمی چیمپیئن کاسپروف کو شکست دی۔ اس شعبے میں اب کمپیوٹر پروگرامز کو اتنا برتر سمجھا جاتا ہے کہ اگر مقابلوں میں کوئی انتہائی اچھوتی چال چل دے تو شک کیا جاتا ہے کہ کہیں کمپیوٹر سے مدد تو نہیں حاصل کی۔ کمپیوٹر سے مدد حاصل کرنے کا مطلب کسی کے آئندہ کھیلنے والے پر پابندی ہے۔ کمپیوٹرز کے شطرنج کے اب الگ ٹورنامنٹ منعقد ہوتے ہیں۔

لیکن شطرنج کے مقابلے میں کئی اور ایسے کھیل ہیں جہاں پر کمپیوٹر انسان کا اچھا مقابلہ نہیں کر سکتا تھا۔ یہ وہ کھیل ہیں جہاں پر تخلیقی صلاحیت اور سٹریٹیجی کا استعمال ہو۔ ان میں سے ایک کھیل ‘گو’ ہے جو چین کی ہزاروں سال پرانی روایت ہے۔ ڈیپ مائنڈ اے آئی نے الفا گو کے نام سے پروگرام بنایا جو انسانوں سے مقابلہ کر سکتا ہو۔ اس نے گو کے چیمپیئن لی سیڈول کو 2016 میں شکست دی۔ یہ توقع تو رکھی جا رہی تھی کہ کبھی نہ کبھی گو میں بھی مشین انسان کو شکست دے دے گی لیکن اتنی جلد یہ ٹارگٹ حاصل کرنے کی کسی کو امید نہیں تھی۔

دلچسپ چیز یہاں پر لی سیڈول کے چند انٹرویو
اکتوبر 2015: میں نے اسے کھیلتے دیکھا ہے۔ اس سے جیتنا بہت ہی آسان ہے۔ یہ مقابلہ یکطرفہ رہے گا۔ اس میدان میں انسانی ذہانت تک نہیں پہنچا جا سکتا۔ یہ شطرنج نہیں۔
فروری 2016: لگتا ہے اس پروگرام پر بہت کام ہوا ہے۔ یہ اب اچھا کھیل سکتا ہے لیکن مجھے یہ اعتماد ہے کہ یہ پروگرام جیت نہیں پائے گا۔
مارچ 9، 2016: مجھے اپنی پہلی گیم ہارنے پر حیرت ہے۔ میرا نہیں خیال تھا کہ میں ہار سکتا ہوں۔
مارچ 10، 2016: میں اس وقت شاک میں ہوں اور بولنے کے الفاظ نہیں مل رہے۔ مجھے تسلیم کرنا پڑے گا کہ تیسری گیم میرے لئے خاصی مشکل ہو گی۔
مارچ 11، 2016: مجھے سمجھ ہی نہیں آ رہا تھا کہ کیا کروں۔

اس سے اگلے ایک سال میں الفا گو نے دنیا کے بیس بہترین کھلاڑیوں سے مقابلہ کیا اور کسی میچ میں شکست نہیں کھائی۔ الفا گو نے ابھی شکست کھانی تھی لیکن اس سے پہلے کچھ بات اس کھیل کے بارے میں۔

گو کھیلنے کے لئے دو چیزوں کا ہونا ضروری ہے۔ تخلیقی صلاحیت اور ایک وجدان۔ یہ 19 بائی 19 کے بورڈ پر کھیلی جاتی ہے۔ اس کی کل پوزیشنز دیکھنا ہوں تو یہ کائنات کے کل ایٹموں کی تعداد سے بھی زیادہ ہیں۔ اس لئے کمپیوٹر کی کیلکولیشن کی طاقت کا زیادہ فائدہ نہیں۔ کھیل کو پہچان کر فیصلے کرنا ہوتے ہیں۔ الفا گو کو کھیل سکھانے کے لئے جو تکنیک استعمال کی گئی تھی، وہ یہ کہ اس کو پرانے ہونے والے مقابلوں کا ڈیٹا دے کر ٹرین کیا گیا تھا جس سے اس نے یہ کھیل سیکھی تھی اور پھر اس نے اپنے آپ سے مقابلہ کر کے اس کے اصول سیکھے تھے۔ ان کی مدد سے اس نے پہچانا تھا کہ کونسی پوزیشن بہتر ہے اور کیا فیصلے لینے چاہئیں۔

اس ٹریننگ سے جو نتیجہ نکلا، وہ نہ صرف انتہائی طاقتور تھا بلکہ کچھ جگہوں پر حیران کن حد تک تخلیقی بھی۔ گو کھیلنے والوں کی ہزار سال کی دانائی یہ بتاتی تھی کہ کھیل کی ابتدا میں تیسری یا چوتھی لائن سے کھیلنا اہم ہے۔ تیسری لائن سے کھیل کر جلد بہتر پوزیشن میں آیا جا سکتا ہے جبکہ چوتھی لائن لمبی گیم میں درمیان میں آنے میں مدد کرتی ہے۔ دوسری گیم کی 37ویں چال میں الفا گو نے اس دانائی کو بالائے طاق رکھتے ہوئے پانچویں لائن میں جانے کا فیصلہ کیا۔ اس سے مبصر ششدر رہ گئے اور لی سیڈول کرسی سے اٹھ کھڑے ہوئے۔ اس سے پچاس چالوں کے بعد بورڈ کے بائیں اور نچلے کونے پر ہونے والی چال نے 37ویں چال میں رکھے گئے سیاہ پتھر سے اس کو کنکٹ کر دیا۔ یہ اس کھیل کو جیتنے والی موو تھی۔ گو کی تاریخ میں سب سے اچھوتی چال الفا گو کی یہ چال سمجھی جاتی ہے۔ ہزاروں سال کی دانائی سے سیکھ کر الفا گو نے اس کو بہتر کر لیا تھا لیکن الفا گو کی ابھی آنے والی شکست اس سے بڑی خبر تھی۔

ڈیپ مائیڈ کی ٹیم نے 2017 کے آخر تک ایک نیا پروگرام لانچ کر دیا تھا جو الفا زیرو تھا۔ اس میں ایک چیز مختلف تھی۔ اس کو وہ کئی ملین مقابلے نہیں دکھائے گئی تھے جو کہ انسانوں نے کھیلے تھے۔ اس کو صرف کھیل کے ضوابط بتائے گئے تھے اور پھر اس نے صرف اپنے آپ سے کھیل کر یہ گیم سیکھی تھی۔ الفا زیرو نے الفا گو کو شکست دے دی۔ انسانی ذہانت سے سیکھی گئے اصول الفا گو کی شکست کی وجہ بن گئے۔ الفا گو زیرو کی یہ سب سیکھتے صرف 34 گھنٹے لگے تھے۔

الفا زیرو نے اسی پر بس نہیں کی۔ اب اس نے اسی طرح شطرنج کھیلنا سیکھا۔ دو گھنٹے کی ٹریننگ کے بعد یہ بہترین انسانی کھلاڑی کو شکست دی سکتی تھی اور چار گھنٹے کی ٹریننگ کے بعد اس نے مشینوں کی شطرنج کے عالمی چیمپئن پروگرام سٹاک فش 8 کو شکست دے دی۔ یہ شکست نہ صرف شطرنج کے کھلاڑیوں کی تھی بلکہ ان تمام اے آئی پروگرامرز کی بھی جو کئی دہائیوں سے مشینوں کو بہتر شطرنج سکھانے والے پروگرامرز کی بھی ۔ ان کی سکھائی گئی منطق کو ایک مشین نے خود اسے کھیلنا سیکھ کر پچھاڑ دیا تھا۔ سٹاک فش 8 سے ہونے والے 100 مقابلوں میں 25 الفا زیرو نے جیتے۔ باقی سب ڈرا ہوئے۔ مصنوعی ذہانت خود اپنے سے بہتر مصنوعی ذہانت بنا سکتی تھی۔

مستقبل قریب میں اس کا کیا مطلب ہے؟ کیا مصنوعی ذہانت بورڈ سے باہر نکل کر سرمایہ کاری، سیاست یا ملٹری کی سٹریٹیجی بنانے میں کردار ادا کر سکتی ہے؟ اصل دنیا میں سٹریٹیجی کے مسائل کہیں زیادہ پیچیدہ ہوتے ہیں۔ انسانی نفسیات، نامکمل معلومات اور دوسرے رینڈم فیکٹر بیچ میں آتے ہیں۔ پوکر کھیلنے والے ذہین سسٹم پہلے ہی یہ ثابت کر چکے ہیں کہ یہ ایسے چیلنج نہیں جن کو عبور نہ کیا جا سکے۔ لیکن پھر بھی اصل زندگی کے مسائل تک پہنچتے ابھی وقت لگے گا۔ دسمبر 2017 میں الفا زیرو کی دو کمپیوٹر پروگرامز کو دی جانے والی شکست اس لئے ایک انتہائی اہم سنگِ میل ہے کہ کوئی بھی 2017 میں یہاں تک پہنچنے کی توقع نہیں رکھتا تھا۔

انسان کا اس زمین پر غلبے میں سب سے بڑی وجہ اس کی ذہانت رہی ہے۔ کیا اب انسان اس زمین پر سب سے زیادہ ذہین ہے اور رہے گا؟

ساتھ لگی تصویر لی سیڈول اور الفا گو کے میچ سے ہے۔

نوٹ: الفا زیرو الفا گو زیرو کا زیادہ جنرل ورژن ہے اور شوگی میں بھی اسی طرح جیت چکا ہے۔

الفا زیرو پر
https://en.wikipedia.org/wiki/AlphaZero

بذریعہ فیس بک تبصرہ تحریر کریں

براہ راست تبصرہ تحریر کریں۔

Your email address will not be published. Required fields are marked *