شرکت OpenAI اخیرا ویدئویی را با عنوان معرفی GPT-4.5 در کانال یوتیوب خود منتشر کرده است که تواناییهای این مدل جدید را به نمایش میگذارد.
به گزارش تکراتو به نقل از smartprix، در این ویدئو، پاسخهای طبیعیتر و کاهش خطاهای مدل از جمله ویژگیهای برجسته آن معرفی شدهاند. در دقیقه ۲:۲۶ ویدیوی معرفی GPT-4.5 صفحهای از تاریخچهی چت مدل نمایش داده میشود که در میان پیامها، عبارت «Num GPUs for GPT 6 Training» دیده میشود. با این حال، هیچ توضیحی دربارهی این عبارت ارائه نشده است.

توسعهی GPT-6؟ ویدیوی معرفی GPT-4.5 سرنخهای جدیدی ارائه میدهد
برخی معتقدند که «Num» ممکن است اشاره به تعداد بیسابقهای از پردازندههای گرافیکی (GPU) داشته باشد (شاید ۱۰۰,۰۰۰ واحد.) توییتی قدیمی از کایل کوربیت نیز این احتمال را تقویت میکند.
بررسی سوابق نشان میدهد که مدل GPT-3 در سال ۲۰۲۰ با ۱۰,۰۰۰ پردازنده گرافیکی آموزش داده شد و مدلهای بعدی، نیازمند منابع بیشتری شدند؛ بهویژه پس از همکاری OpenAI با مایکروسافت. گزارشهای اواخر سال ۲۰۲۴ نیز از آمادهسازی برای یک سیستم نسل بعدی، احتمالاً GPT-6، خبر دادهاند.
GPT-4.5 که بهطور داخلی «Orion» نامگذاری شده، پیشرفت قابلتوجهی در تولید پاسخهای طبیعی و کاهش خطاها داشته و احتمالاً دارای ۳ تا ۴ تریلیون پارامتر است. تخمین زده میشود که آموزش این مدل روی ۳۰,۰۰۰ تا ۵۰,۰۰۰ پردازندهی گرافیکی NVIDIA H100 انجام شده باشد که هزینهای در حدود ۷۵۰ میلیون تا ۱.۵ میلیارد دلار را در بر داشته است.
این موضوع با ارزیابی مؤسسهی ایمنی هوش مصنوعی ایالات متحده از یک مدل نامشخص OpenAI همخوانی دارد. همچنین، احتمال دارد که «Num» مخفف «Numerous» باشد و به مقیاس عظیم آموزش GPT-6 اشاره کند.
البته، ممکن است این صرفا یک بازی تبلیغاتی باشد. OpenAI به غافلگیری علاقه دارد، همانطور که قبلا از کدنام «Strawberry» برای سری o1 استفاده کرده بود. شاید این اشارهی مبهم به تعداد GPUها، فقط یک اشارهی فریبنده باشد تا توجهها را از برنامههای واقعی OpenAI، مانند مدلهای ترکیبی استدلالی یا نمونههای اولیه AGI، منحرف کند.