چت جی پی تی (چه کار می کند و چرا کارآمد است؟) / در جهان هوش مصنوعی

1 سال پیش زمان مطالعه 5 دقیقه

کتاب «چت جی‌پی‌تی چه کار می‌کند و چرا کارآمد است؟» نوشته‌ی استیوِن ولفرام به همت نشر شَبنا به چاپ رسیده است. این کتاب کوچک تلاشی برای توضیح مقدماتی چرایی و چگونگی کارکرد چت جی‌پی‌تی است. از یک طرف، این کتاب داستان تکنولوژی است و از طرف دیگر، داستانی درخصوص علم و البته فلسفه. برای گفتن این داستان باید طیف گسترده‌ای از ایده‌ها و کشفیاتی را که طی قرن‌ها به دست آمده است کنار هم قرار دهیم.

دیدن کنار هم قرار گرفتن چیزهایی که مدتی طولانی به آن‌ها علاقه‌مند بودم، طی یک فرایند ناگهانی برایم هیجان‌انگیز است؛ از رفتار پیچیده‌ی برنامه‌های ساده گرفته تا ویژگی اساسی زبان و معنا و کارآمدی سیستم‌های بزرگ کامپیوتری که همگی بخشی از داستان چت جی‌پی‌تی‌اند.

چت جی‌پی‌تی نشئت گرفته از مفهوم شبکه‌های عصبی است که در دهه‌ی 1940 به‌عنوان شکل ایده‌آل عملکرد مغز ساخته شد. نویسنده می‌گوید: اولین‌بار در سال 1983، یک شبکه‌ی عصبی را برنامه‌نویسی کردم که البته کار جالبی نمی‌کرد، اما چهل سال بعد، با کامپیوترهایی که چهل برابر سریع‌تر بودند و میلیاردها صفحه‌ی متنی در وب و مجموعه‌ای از نوآوری‌های مهندسی، وضعیت کاملاً متفاوت است. مایه‌ی شگفتی است که شبکه‌ی عصبی ـ که حالا میلیاردها برابر بزرگ‌تر از آنی است که من در سال 1983 ساختم ـ می‌تواند کار منحصربه‌فردی بکند؛ کاری که تا پیش از این گمان می‌رفت تنها مختص به انسان است و آن چیزی نیست جز خلق زبان معنادار انسانی.

این کتاب شامل دو بخش است؛ بخش اول توضیح چت جی‌پی‌تی و توانایی آن در تولید زبان، یعنی کاری انسانی است و بخش دوم نگاهی به آینده‌ی چت جی‌پی‌تی دارد و اینکه می‌تواند با استفاده از ابزارهای محاسباتی، کارهایی فراتر از توانایی انسان بکند و به‌طور ویژه، بتواند از ابرقدرت‌های دانش محاسباتی سیستم ما، یعنی ولفرام آلفا، بهره‌برداری کند. در حال حاضر، ظهور چت جی‌پی‌تی به ما نشان داد که حتی در دوره‌ای که تقریباً همه‌چیز اختراع و کشف شده است، غافلگیری همچنان ممکن است.

قسمتی از کتاب چت جی‌پی‌تی چه کار می‌کند و چرا کارآمد است؟:

طی یک دهه‌ی گذشته پیشرفت‌های بسیاری در هنر یادگیری شبکه‌های عصبی به‌وجود آمده است. بله، این کار یک هنر است. گاهی اوقات ـ به‌ویژه در نگاه به گذشته ـ می‌توان تا حدی «توضیحی علمی» برای آنچه اتفاق افتاد مشاهده کرد؛ اما بیشترِ آنچه درخصوص نحوه‌ی کار با شبکه‌های عصبی به دست آمده است حاصل آزمون و خطا و اضافه ‌کردن ایده‌ها و ترفندهاست که درنهایت علم شبکه‌های عصبی را ساخته است.

در این خصوص، چند بخش کلیدی وجود دارد؛ اول اینکه از چه نوع معماری شبکه‌ی عصبی‌ای برای انجام دادن یک کار خاص باید استفاده کرد. بعد، مسئله‌ی مهم اینکه چطور یک نفر باید داده‌هایی را که برای آموزش شبکه‌ی عصبی لازم است جمع‌آوری کند. نکته‌ی مهم این است که برای آموزش یک شبکه‌ی عصبی، لازم نیست از ابتدا شروع کنید: بلکه یک شبکه‌ی نو می‌تواند مستقیماً با استفاده از یک شبکه‌ی آموزش‌دیده کار کند یا حداقل از آن شبکه برای خلق نمونه‌های بیشتر جهت یادگیری استفاده کند.

ممکن است فکر کنید برای هر کار خاصی که شبکه‌های عصبی می‌کنند، به معماری خاصی نیاز است، اما کشفیات نشان می‌دهد یک معماری ثابت می‌تواند برای کارهای به‌ظاهر متفاوت به کار گرفته شود. این مسئله ایده‌ی محاسبه‌ی جهانی را به یاد می‌آورد، اما همان‌طور که گفتم، نشان می‌دهد کارهایی که به شبکه‌های عصبی می‌سپاریم شبیه کارهای انسانی است و شبکه‌های عصبی می‌توانند فرایندهای مشابه انسان را به کار بگیرند. در اوایل ظهور شبکه‌های عصبی، ایده‌ی اصلی این بود که این شبکه باید کارها را در کوچک‌ترین سطح ممکن انجام دهد. برای مثال، در تبدیل سخنرانی به متن، ابتدا باید صدا را تحلیل کند، بعد آن را به واج‌ها خرد کند و... اما آنچه در ادامه کشف شد این بود که ـ حداقل در امور انسانی ـ بهتر است شبکه‌ی عصبی را طوری آموزش دهیم که به مسئله‌ی نهایی فکر کند، به آن اجازه دهیم ویژگی‌های اولیه‌ی ضروری را کشف کند و آن را برای خود رمزگذاری کند و...

همچنین اعتقاد بر این بود که باید اجزای پیچیده را به‌صورت مجزا وارد شبکه‌ی عصبی کرد تا بتواند به‌نحوی مؤثر، ایده‌های الگوریتمی خاصی را به کار بگیرد؛ اما بار دیگر مشخص شد که این کار چندان ارزشمند نیست؛ در عوض، بهتر است فقط با اجزای بسیار ساده کار کنیم و به آن‌ها اجازه دهیم تا «خودشان را سامان دهند» اگرچه معمولاً ما نمی‌توانیم نحوه‌ی انجام این کار را درک کنیم تا احتمالاً به آن ایده‌های الگوریتمی برسند.

این بدان معنا نیست که هیچ ایده‌ی ساختارمندی در ارتباط با شبکه‌های عصبی وجود ندارد، بلکه برای مثال، داشتن چینشی دوبعدی از نورون‌ها با اتصالات محلی میان آن‌ها، در سطوح اولیه‌ی پردازش عکس بسیار کارآمد است. همچنین داشتن الگوهایی از ارتباط که بر نگاه متوالی به عقب تمرکز می‌کند، در مواجهه با چیزهای انسانی مثل زبان در چت‌جی‌پی‌تی کارآمد است.

چت جی‌پی‌تی چه کار می‌کند و چرا کارآمد است؟ را مریم جامه‌بزرگ ترجمه کرده و کتاب حاضر در 126 صفحه‌ی رقعی و با جلد نرم چاپ و روانه‌ی کتابفروشی‌ها شده است.

خرید کتاب چت جی‌پی‌تی چه کار می‌کند و چرا کارآمد است؟