چت جی پی تی (چه کار می کند و چرا کارآمد است؟) / در جهان هوش مصنوعی
کتاب «چت جیپیتی چه کار میکند و چرا کارآمد است؟» نوشتهی استیوِن ولفرام به همت نشر شَبنا به چاپ رسیده است. این کتاب کوچک تلاشی برای توضیح مقدماتی چرایی و چگونگی کارکرد چت جیپیتی است. از یک طرف، این کتاب داستان تکنولوژی است و از طرف دیگر، داستانی درخصوص علم و البته فلسفه. برای گفتن این داستان باید طیف گستردهای از ایدهها و کشفیاتی را که طی قرنها به دست آمده است کنار هم قرار دهیم.
دیدن کنار هم قرار گرفتن چیزهایی که مدتی طولانی به آنها علاقهمند بودم، طی یک فرایند ناگهانی برایم هیجانانگیز است؛ از رفتار پیچیدهی برنامههای ساده گرفته تا ویژگی اساسی زبان و معنا و کارآمدی سیستمهای بزرگ کامپیوتری که همگی بخشی از داستان چت جیپیتیاند.
چت جیپیتی نشئت گرفته از مفهوم شبکههای عصبی است که در دههی 1940 بهعنوان شکل ایدهآل عملکرد مغز ساخته شد. نویسنده میگوید: اولینبار در سال 1983، یک شبکهی عصبی را برنامهنویسی کردم که البته کار جالبی نمیکرد، اما چهل سال بعد، با کامپیوترهایی که چهل برابر سریعتر بودند و میلیاردها صفحهی متنی در وب و مجموعهای از نوآوریهای مهندسی، وضعیت کاملاً متفاوت است. مایهی شگفتی است که شبکهی عصبی ـ که حالا میلیاردها برابر بزرگتر از آنی است که من در سال 1983 ساختم ـ میتواند کار منحصربهفردی بکند؛ کاری که تا پیش از این گمان میرفت تنها مختص به انسان است و آن چیزی نیست جز خلق زبان معنادار انسانی.
این کتاب شامل دو بخش است؛ بخش اول توضیح چت جیپیتی و توانایی آن در تولید زبان، یعنی کاری انسانی است و بخش دوم نگاهی به آیندهی چت جیپیتی دارد و اینکه میتواند با استفاده از ابزارهای محاسباتی، کارهایی فراتر از توانایی انسان بکند و بهطور ویژه، بتواند از ابرقدرتهای دانش محاسباتی سیستم ما، یعنی ولفرام آلفا، بهرهبرداری کند. در حال حاضر، ظهور چت جیپیتی به ما نشان داد که حتی در دورهای که تقریباً همهچیز اختراع و کشف شده است، غافلگیری همچنان ممکن است.

قسمتی از کتاب چت جیپیتی چه کار میکند و چرا کارآمد است؟:
طی یک دههی گذشته پیشرفتهای بسیاری در هنر یادگیری شبکههای عصبی بهوجود آمده است. بله، این کار یک هنر است. گاهی اوقات ـ بهویژه در نگاه به گذشته ـ میتوان تا حدی «توضیحی علمی» برای آنچه اتفاق افتاد مشاهده کرد؛ اما بیشترِ آنچه درخصوص نحوهی کار با شبکههای عصبی به دست آمده است حاصل آزمون و خطا و اضافه کردن ایدهها و ترفندهاست که درنهایت علم شبکههای عصبی را ساخته است.
در این خصوص، چند بخش کلیدی وجود دارد؛ اول اینکه از چه نوع معماری شبکهی عصبیای برای انجام دادن یک کار خاص باید استفاده کرد. بعد، مسئلهی مهم اینکه چطور یک نفر باید دادههایی را که برای آموزش شبکهی عصبی لازم است جمعآوری کند. نکتهی مهم این است که برای آموزش یک شبکهی عصبی، لازم نیست از ابتدا شروع کنید: بلکه یک شبکهی نو میتواند مستقیماً با استفاده از یک شبکهی آموزشدیده کار کند یا حداقل از آن شبکه برای خلق نمونههای بیشتر جهت یادگیری استفاده کند.
ممکن است فکر کنید برای هر کار خاصی که شبکههای عصبی میکنند، به معماری خاصی نیاز است، اما کشفیات نشان میدهد یک معماری ثابت میتواند برای کارهای بهظاهر متفاوت به کار گرفته شود. این مسئله ایدهی محاسبهی جهانی را به یاد میآورد، اما همانطور که گفتم، نشان میدهد کارهایی که به شبکههای عصبی میسپاریم شبیه کارهای انسانی است و شبکههای عصبی میتوانند فرایندهای مشابه انسان را به کار بگیرند. در اوایل ظهور شبکههای عصبی، ایدهی اصلی این بود که این شبکه باید کارها را در کوچکترین سطح ممکن انجام دهد. برای مثال، در تبدیل سخنرانی به متن، ابتدا باید صدا را تحلیل کند، بعد آن را به واجها خرد کند و... اما آنچه در ادامه کشف شد این بود که ـ حداقل در امور انسانی ـ بهتر است شبکهی عصبی را طوری آموزش دهیم که به مسئلهی نهایی فکر کند، به آن اجازه دهیم ویژگیهای اولیهی ضروری را کشف کند و آن را برای خود رمزگذاری کند و...
همچنین اعتقاد بر این بود که باید اجزای پیچیده را بهصورت مجزا وارد شبکهی عصبی کرد تا بتواند بهنحوی مؤثر، ایدههای الگوریتمی خاصی را به کار بگیرد؛ اما بار دیگر مشخص شد که این کار چندان ارزشمند نیست؛ در عوض، بهتر است فقط با اجزای بسیار ساده کار کنیم و به آنها اجازه دهیم تا «خودشان را سامان دهند» اگرچه معمولاً ما نمیتوانیم نحوهی انجام این کار را درک کنیم تا احتمالاً به آن ایدههای الگوریتمی برسند.
این بدان معنا نیست که هیچ ایدهی ساختارمندی در ارتباط با شبکههای عصبی وجود ندارد، بلکه برای مثال، داشتن چینشی دوبعدی از نورونها با اتصالات محلی میان آنها، در سطوح اولیهی پردازش عکس بسیار کارآمد است. همچنین داشتن الگوهایی از ارتباط که بر نگاه متوالی به عقب تمرکز میکند، در مواجهه با چیزهای انسانی مثل زبان در چتجیپیتی کارآمد است.
چت جیپیتی چه کار میکند و چرا کارآمد است؟ را مریم جامهبزرگ ترجمه کرده و کتاب حاضر در 126 صفحهی رقعی و با جلد نرم چاپ و روانهی کتابفروشیها شده است.