به گزارش ایتنا و به نقل از The Decoder، در پیشرفتی انقلابی که مرزهای واقعیت مجازی و هوش مصنوعی را درمینوردد، گوگل دیپمایند از Genie 3 رونمایی کرده است؛ مدلی که میتواند جهانهای تعاملی سهبعدی را در زمان واقعی و تنها با استفاده از توصیفات متنی ایجاد کند.
گفتنی است این سامانه که با نرخ ۲۴ فریم بر ثانیه و وضوح ۷۲۰p عمل میکند، قادر است محیطهای پیچیدهای را تولید کند که ثبات بصری و فیزیکی خود را برای «دقایق متوالی» حفظ مینمایند. این دستاورد، گامی بلند به سوی توسعه سامانههای هوش مصنوعی عمومی (AGI) محسوب میشود.
بر این اساس، Genie 3 برخلاف مدلهای مرسوم ویدیویی، هر فریم را به صورت خودرگرسیونی تولید میکند و تا یک دقیقه از جزئیات محیطی قبلی را در نظر میگیرد. بدین ترتیب، این رویکرد به حفظ انسجام بصری در طول تعاملات گسترده کمک شایانی میکند.
دمیس هاسیبیس، مدیرعامل دیپمایند، در این باره تأکید میکند: «این مدلها برای ساخت هوش مصنوعی عمومی ضروری هستند، چرا که به طور فزایندهای ساختار فیزیکی زیربنایی جهان را درک میکنند».

گفتنی است این مدل نوین میتواند طیف وسیعی از سناریوها را از مناظر واقعگرایانه با اثرات آبوهوی پویا مانند گدازه، باد و باران تا محیطهای فانتزی شامل پورتالها، جزایر پرنده و موجودات متحرک خلق کند. همچنین امکان بازسازی مکانهای تاریخی مانند ونیز یا کنوسوس باستان نیز با این مدل وجود دارد.
در واقع کاربران با وارد کردن دستورات متنی – که «رویدادهای جهان قابل prompting» نامیده میشوند – میتوانند تغییراتی مانند تحولات آبوهویی یا ظهور اشیاء جدید را ایجاد کنند.
یکی از جنبههای برجسته Genie 3، توانایی آن در ایجاد محیطهای آموزشی برای عاملهای هوش مصنوعی خودمختار است. این مدل بدون نیاز به دادههای سهبعدی از پیش تعریفشده، محیطها را مستقیماً از توصیفات متنی و تعامل کاربر تولید میکند.
دیپمایند هماکنون از Genie 3 برای آزمایش عامل SIMA داخلی خود استفاده میکند که میتواند وظایف را به صورت مستقل در این جهانهای تولید شده انجام دهد.
بیتردید، این دموها پرسشهایی جدی را دربارهی نقش مدلهای جهانی مانند Genie 3 در آیندهٔ توسعهٔ بازیهای ویدیویی مطرح میکنند. برخی از نمایشهای دیپمایند، شباهت زیادی به نسخههای اولیهی بازیهای دیجیتال دارند—هرچند هنوز از پیچیدگی و غنای آثار تجاری فاصله دارند.
جیم فان، مدیر هوش مصنوعی انویدیا، این فناوری را پیشنمایش «موتور بازی ۲.۰» میداند و پیشبینی میکند: «روزی خواهد رسید که تمام پیچیدگیهای آنریل انجین توسط یک توده دادهمحور از وزنهای توجه جذب خواهد شد. آنگاه توسعه بازی به شکلی پیشرفته از مهندسی prompting تبدیل خواهد شد.»

Genie 3 امکان ناوبری در لحظه و ساخت تعاملی جهان را فراهم میکند و محیطهای ثابت را برای چند دقیقه با کیفیت 720p حفظ میکند.
این مدل هماکنون به عنوان پیشنمایش پژوهشی در دسترس گروه منتخبی از پژوهشگران و خلاقان قرار گرفته است. دیپمایند اعلام کرده این رویکرد به شناسایی ریسکهای بالقوه و هدایت توسعه بیشتر کمک خواهد کرد.
با وجود محدودیتهای فنی فعلی از جمله محدودیت اقدامات عامل، تعاملات چند دقیقهای و عدم قابلیت اطمینان شبیهسازیهای چندعاملی، کارشناسان کاربردهای گستردهای را در حوزههای آموزش، شبیهسازی و آموزش تخصصی برای این فناوری متصور هستند.
ریچارد ساتن و دیوید سیلور، پژوهشگران دیپمایند، در مقالهای اخیر بر نیاز به تغییر بنیادین در پژوهشهای هوش مصنوعی تأکید کردهاند: حرکت از سامانههای آموزشدیده بر دادههای ایستای انسانی به سوی عاملهایی که از تجربیات خود در جهانهای شبیهسازی شده یاد میگیرند. Genie 3 دقیقاً برای پشتیبانی از این چشمانداز طراحی شده است.
در پایان باید گفت این توسعه نهتنها نشاندهنده تعهد دیپمایند به پیشبرد مرزهای هوش مصنوعی است، بلکه میتواند تحولی اساسی در صنعت بازیهای ویدیویی، واقعیت مجازی و شبیهسازیهای آموزشی ایجاد کند.
کارشناسان معتقدند چنین فناوریهایی میتوانند به زودی شیوههای سنتی تولید محتوای دیجیتال را متحول کرده و دریچهای به سوی خلاقیتهای نامحدود در جهانهای مجازی بگشایند.
source