در ماه‌های اخیر سیستم‌های هوش مصنوعی مختص تبدیل متن به تصاویر، در سرخط خبرها قرار گرفته‌اند. حالا در این میان، محققان هوش مصنوعی شاغل در شرکت متا، از یک سیستم هوشمند برای تبدیل متن به ویدیو رونمایی کرده‌اند. این سیستم Make-A-Video نام دارد و با دریافت توصیفی از صحنه، می‌تواند ویدیوی کوتاهی در رابطه با متن نوشته شده ایجاد کند. مصنوعی بودن این ویدیو‌ها به وضوح مشخص است اما در هر صورت همین سیستم از پیشرفت فوق‌العاده در این حوزه خبر می‌دهد.
مارک زاکربرگ، مدیرعامل متا، در پست منتشر شده این سیستم را یک «پیشرفت حیرت‌انگیز» توصیف کرده و گفته:«تولید ویدیو توسط هوش مصنوعی بسیار سخت‌تر از تصاویر است زیرا در کنار خلق هر پیکسل، سیستم موردنظر باید روند تغییر پیکسل را هم پیش‌بینی کند.»
کلیپ‌ها طولانی‌تر از ۵ ثانیه نیستند و صدا ندارند ولی در کل طیف وسیعی از درخواست‌ها را در بر می‌گیرند. در ادامه‌ی این مطلب می‌توانید تعدادی از کلیپ‌هایی که از طرف متا منتشر شده را ببینید. با توجه به اینکه خارج از متا هنوز کسی به این سیستم دسترسی ندارد، احتمالا بهترین کلیپ‌ها از طرف این شرکت انتخاب شده‌اند.
همانطور که گفتیم با وجود اینکه در حال حاضر این ویدیو‌ها جذابیت چندانی ندارند، اما با توجه به پیشرفت سریع سیستم‌های هوش مصنوعی مربوط به ایجاد تصاویر، بدون شک در آینده‌ی نزدیک سیستم‌های ایجاد ویدیو‌ها هم به طور قابل توجهی بهبود پیدا می‌کنند. متا در پست منتشر شده نوشته که چنین سیستمی برای هنرمندان کاربردهای زیادی خواهد داشت. اما در این میان، این نوع سیستم‌ها چشم‌انداز نگران‌کننده‌ای هم ترسیم می‌کنند. به عنوان مثال احتمالا برای تبلیغات و ویدیو‌های جعلی هم در آینده مورد استفاده قرار خواهند گرفت.
باید خاطرنشان کنیم متا در زمینه‌ی توسعه‌ی سیستم‌های هوش مصنوعی مربوط به این حوزه تنها نیست. به عنوان مثال، ماه‌ها قبل تعدادی از محققان چینی از مدل هوش مصنوعی برای تبدیل متن به ویدیو رونمایی کردند. در مقاله‌ی منتشر شده از طرف متا، به چالش‌های مربوط به ایجاد ویدیو‌های طولانی‌تر از ۵ ثانیه، ویدیو‌های مبتنی بر صحنه‌های متنوع و رزولوشن بالاتر هم اشاره شده است.
منبع: The Verge


source

توسط techkhabari