ChatGPT دانش خود را از کجا می‌آورد؟

اگرچه ChatGPT گاهی اشتباه می‌کند؛ در اکثر مواقع اینکه از همه چیز اطلاع دارد عجیب و ترسناک به نظر می‌رسد، گویی که از تمام جهان و هرچه تا به حال نوشته شده خبر دارد.

اگرچه ChatGPT گاهی اشتباه می‌کند؛ در اکثر مواقع اینکه از همه چیز اطلاع دارد عجیب و ترسناک به نظر می‌رسد، گویی که از تمام جهان و هرچه تا به حال نوشته شده خبر دارد. اما آیا تا به حال به این فکر کرده‌اید که چگونه این همه اطلاعات دارد؟

اگرچه به نظر می‌رسد که ChatGPT از تمام جهان و هرچه تا به حال نوشته شده خبر دارد اما برخلاف لحن قاطع و حجم عظیمی از اطلاعاتی که می‌تواند از آن‌ها استفاده کند، همه چیز را نمی‌داند و قطعاً نمی‌تواند مانند من و شما فکر کند، حتی اگر این‌طور به نظر برسد.

هوش مصنوعی، موجودی برتر نیست، نمی‌خواهم به داستان‌های علمی تخیلی طعنه بزنم اما این یک واقعیت است که تعداد گزارش‌ها از توهمات ناشی از چت‌بات‌ها در حال افزایش است و هرچه بیشتر به هوش مصنوعی تکیه کنیم، ممکن است این توهمات رایج‌تر شوند. به همین دلیل، درک نحوه عملکرد ابزارهایی مانند ChatGPT، محدودیت‌های آن‌ها و چگونگی استفاده بهینه از آن‌ها بیش از هر زمان دیگری اهمیت دارد. پس نگاهی به پشت صحنه عملکرد آن‌ها می‌اندازیم.

ChatGPT چیست و چگونه کار می‌کند؟

ChatGPT یک مدل زبان بزرگ (LLM) است که توسط OpenAI ساخته شده است. می‌توانید به صورت رایگان از آن استفاده کنید یا با پرداخت اشتراک به نسخه‌های پیشرفته‌تر دسترسی داشته باشید. این نسخه‌ها به عنوان مدل شناخته می‌شوند و هر کدام کمی متفاوت عمل می‌کنند.

درون یک مدل زبان بزرگ، نوعی هوش مصنوعی است که برای پیش‌بینی متن آموزش دیده است. این مدل با پیش‌بینی محتمل‌ترین کلمات برای قرار گرفتن در ادامه یک جمله، پاسخ تولید می‌کند و در این کار بسیار خوب است. به همین دلیل، پاسخ‌های ChatGPT می‌توانند روان، آگاهانه و حتی شوخ‌طبعانه به نظر برسند. اما در واقع نمی‌فهمد شما چه می‌گویید. البته ساختار زبان را درک می‌کند، اما هیچ چیز از معنی یا قصد پشت کلمات را آن‌طور که یک انسان می‌فهمد متوجه نمی‌شوند. این خود توضیحی است از این که چرا هوش مصنوعی، گاهی اوقات اشتباه می‌کند یا توهم می‌زند. به عنوان مثال ساده‌ترین راه برای درک آن این است که آن را تکمیل‌خودکار کننده‌ای (autocomplete) بسیار پیشرفته تصور کنید. شما یک درخواست به آن می‌دهید و بر اساس تمام اطلاعاتی که قبلاً دیده است، آنچه را که فکر می‌کند باید در ادامه بیاید، تکمیل می‌کند.

[توضیح خبرآنلاین:  تکمیل‌خودکار (autocomplete)، همان ویژگی است که وقتی شما واژه‌ای را در موتورهای جست‌وجو و یا هوش مصنوعی می‌نویسید، در حین تایپ، پیشنهادات یا کلمات مشابه را به شما نشان می‌دهد.]

دانش ChatGPT از کجا می‌آید؟

حال باز می‌گردیم به همان پرسشی که ابتدا مطرح کردیم؛ ChatGPT چگونه این همه اطلاعات دارد؟ باید گفت که همه چیز به داده‌های آموزشی برمی‌گردد. ChatGPT از حجم عظیمی از داده‌ها، از جمله کتاب‌ها، مقالات، وب‌سایت‌ها، کدها، صفحات ویکی‌پدیا، گفت‌وگوهای عمومی ردیت، مقالات منبع باز و موارد دیگر آموزش دیده است و هدف این است که تمام این اطلاعات را در مورد نحوه نوشتن، توضیح دادن، بحث کردن، شوخی کردن و ارتباط دادن ایده‌ها توسط انسان‌ها به آن یاد داده شود.

این بدان معناست که ChatGPT طیف گسترده‌ای از سبک‌ها و موضوعات زبانی را دیده است. اما همه چیز را ندیده است و برخی مدل‌های ChatGPT نیز به صورت لحظه‌ای به اینترنت متصل نمی‌شوند؛ به همین دلیل است که ممکن است در گذشته اطلاعاتی از آن درخواست کرده باشید و احساس کنید که بروز نیست و قدیمی است. البته دانش آن اغلب به آنچه که از آن آموزش دیده محدود می‌شود و در برخی مدل‌ها، آموزش در نقطه‌ای خاص متوقف شده است. بنابراین ممکن است آخرین اخبار را نداند یا از تغییرات فرهنگی جدیدتر اطلاعات نداشته باشد. با این حال، برخی از مدل‌ها اکنون قابلیت مرور وب را دارند و می‌توانید در بالای صفحه و در یک منوی کشویی، بررسی کنید که از کدام مدل استفاده می‌کنید.

بنابراین، داده‌های آموزشی پایه و اساس دانش ChatGPT هستند. اما پاسخ‌های آن همچنین توسط آنچه یادگیری تقویتی (reinforcement learning) نامیده می‌شود شکل می‌گیرد، به این معنی که از بازخورد انسانی در مورد اینکه چه چیزی یک پاسخ مفید یا دقیق را می‌سازد نیز یاد می‌گیرد.

ChatGPT دانش خود را از کجا می‌آورد؟

آیا ChatGPT تمام اینترنت را خوانده است؟

اینجاست که مسائل کمی مبهم می‌شوند. بخشی از داده‌های مورد استفاده برای آموزش ChatGPT با جست‌وجو محتوای عمومی موجود در اینترنت جمع‌آوری شده است. این بدان معناست که ابزارهایی مانند ChatGPT بخش‌های بزرگی از محتوای خود را از خواندن محتوای گفت‌وگوی افراد، وبلاگ‌ها، مستندات و اساساً هر چیزی که به صورت عمومی قابل دسترسی است و توسط سایت یا قوانین کپی‌رایت مسدود نشده است، بدست آورده است.

با این حال، مرزهای آن مبهم هستند. شرکت‌های هوش مصنوعی به دلیل استفاده از مطالبی مانند کتاب‌های کتابخانه‌ها در داده‌های آموزشی خود مورد انتقاد قرار گرفته‌اند. اینکه آیا باید از آن محتوا استفاده می‌کردند یا خیر، بخشی از بحث‌ها و چالش‌های حقوقی مداوم در مورد مالکیت داده‌ها، رضایت و اخلاق است. اما حتی با وجود اینکه همیشه مشخص نیست این مدل‌ها بر روی چه چیزهایی آموزش دیده‌اند، می‌توان با اطمینان گفت که ChatGPT ایمیل‌های خصوصی، اسناد شخصی یا پایگاه‌های داده محرمانه شما را نخوانده است، البته حداقل امیدواریم این‌طور باشد.

نکته مهم در اینجا این است که چون ChatGPT از محتوای ساخته دست انسان چیزهای زیادی یاد گرفته است، گاهی اوقات می‌تواند همان سوگیری‌ها، نقص‌ها و ایراداتی را که از قبل در فرهنگ و فضاهای آنلاین ما وجود دارد، منعکس کند.

ChatGPT چگونه تصمیم می‌گیرد که در ادامه چه بگوید؟

وقتی سؤالی را در ChatGPT تایپ می‌کنید، درخواست شما را به واحدهای کوچک‌تر به نام توکن (tokens) تقسیم می‌کند. سپس از هر آنچه در طول آموزش خود یاد گرفته است برای پیش‌بینی توکن بعدی استفاده می‌کند. این روند تا زمانی ادامه پیدا می‌کند که پاسخ کامل به پرسش و درخواست شما بدهد. این اتفاق به صورت لحظه‌ای رخ می‌دهد، به همین دلیل است که متن اغلب به نظر می‌رسد که در حال تایپ شدن به صورت زنده است. هر کلمه یک پیش‌بینی است که بر اساس هر آنچه قبل از آن آمده است، نوشته می‌شود. این دلیلی است که نشان می‌دهد چرا برخی پاسخ‌های هوش مصنوعی درست به نظر می‌رسند اما به طرز عجیبی اشتباه هستند؛ زیرا هوش مصنوعی در حال ترکیب کلمات است، نه استدلال موضوع.

ChatGPT دانش خود را از کجا می‌آورد؟

پس چرا به نظر می‌رسد ChatGPT همه چیز را می‌داند؟

اگر تا به حال احساس کرده‌اید که ChatGPT همه چیز را در مورد شما می‌داند، این به دلیل ویژگی‌های حافظه آن است. این مدل می‌تواند چیزهای مهم را در حافظه بلندمدت خود ذخیره کند و حتی چیزهایی را از تمام مکالمات گذشته شما به یاد بیاورد. همچنین در باهوش به نظر رسیدن فوق‌العاده خوب عمل می‌کند. پاسخ‌های آن اغلب دارای ساختار، دستور زبان، لحن و ریتم مناسبی هستند، زیرا این ابزار اصلا برای همین کار آموزش دیده است. بنابراین این توهم را ایجاد می‌کند که همیشه می‌داند درباره چه چیزی صحبت می‌کند. اما این روان بودن بیان، نشان از دقت نیست.

هوش مصنوعی اغلب مفید است. گاهی اوقات اشتباه می‌کند و گاهی اوقات این اشتباه را آن قدر واقعی جلوه می‌دهد که اگر حواستان نباشد، کار را دشوار می‌کند؛ به خصوص اگر اطلاع نداشته باشید که چقدر در قاطعانه صحبت کردن و هیجان‌زده کردن شما مهارت دارد.

در آخر باید گفت که هدف از این گزارش این نیست که شما از استفاده هوش مصنوعی بترسید. در واقع انتظار می‌رود که با اطلاع از چگونگی عملکرد ChatGPTاز  این ابزار هوش مصنوعی و سایر ابزارهای مشابه، عاقلانه‌تر استفاده کنید. ChatGPT ابزاری فوق‌العاده برای جرقه زدن ایده‌ها، نوشتن پیش‌نویس، خلاصه‌سازی متن و حتی کمک به شما برای تفکر بهتر است. بنابراین هرچه بیشتر از عملکرد آن مطلع باشیم، می‌توانیم از ابزارهای هوش مصنوعی مانند ChatGPT با هدف و آگاهی بیشتری استفاده کنیم و فریب آن را نخوریم.

منبع: techradar