هوش مصنوعی گوگل جمنای حالا آهنگ سازی می نماید!
به گزارش تفطن، شرکت گوگل در ادامه روند پرشتاب توسعه ابزارهای هوش مصنوعی مولد، انتها قابلیت مورد انتظار فراوری موسیقی را به صورت عمومی عرضه کرد. این ویژگی نو که بر پایه مدل قدرتمند Lyria 3 بنا شده است، هم اکنون به وسیله اپلیکیشن جمنای در دسترس کاربران واقع شده است. گوگل دیپ مایند (Google DeepMind) این مدل را پیشرفته ترین دستاورد خود در حوزه موسیقی معرفی نموده که قادر است با درک عمیق از دستورات کاربر، قطعاتی خلاقانه و شنیدنی فراوری کند. این حرکت تازه نشان دهنده کوشش گوگل برای تبدیل کردن دستیار هوشمند خود به یک پلتفرم چندمنظوره است که علاوه بر متن و تصویر، اکنون دنیای صدا را نیز به تسخیر خود درآورده است.
در سیستم تازه، فرآیند خلق موسیقی بسیار ساده تر و هوشمندتر از گذشته شده است. برخلاف ابزارهای پیشین که نیازمند وارد کردن متن ترانه به وسیله کاربر بودند، مدل Lyria 3 می تواند بر اساس حال وهوا و موضوعی که شما توصیف می کنید، به صورت اتوماتیک شعر و لیریک مناسب را بنویسد و اجرا کند. کاربران می توانند در بخش ابزارهای اپلیکیشن، گزینه موسیقی را انتخاب نموده و با معین سبک، سرعت (Tempo) و نوع وکال، یک قطعه 30 ثانیه ای باکیفیت دریافت نمایند. نکته جالب توجه اینجاست که برای افزایش جذابیت بصری فایل های خروجی، مدل دیگری به نام Nano Banana به کار گرفته شده است تا به صورت هم زمان یک کاور هنری (Cover Art) اختصاصی و مرتبط برای هر آهنگ فراوری کند.
گوگل در طراحی قابلیت های موزیکال جمنای، راه های متنوعی برای تعامل خلاقانه در نظر گرفته است. علاوه بر دستورات متنی که می توانند شامل جزئیاتی دقیق مثل یک آهنگ نوستالژیک با حال وهوای آفریقایی باشند، کاربران امکان آپلود عکس یا ویدیو را نیز به عنوان ورودی دارند. برای مثال، می توانید تصویری از حیوان خانگی خود در جنگل بارگذاری کنید و از هوش مصنوعی بخواهید آهنگی متناسب با آن فضا بسازد. با این حال، گوگل تأکید نموده که هدف از این ابزار خلق شاهکارهای هنری نیست، بلکه ایجاد راهی سرگرم نماینده برای بیان احساسات است. بعلاوه فیلترهای سخت گیرانه ای اعمال شده تا از تقلید مستقیم صدای خوانندگان مشهور جلوگیری گردد؛ اگر نام هنرمندی ذکر گردد، سیستم تنها از سبک کلی او الهام می گیرد.
از نظر ایمنی و رعایت حقوق مولفین، تمامی فایل های صوتی فراوریشده به وسیله این هوش مصنوعی به واترمارک دیجیتالی و نامرئی SynthID مجهز هستند تا تشخیص آن ها از آثار واقعی برای ابزارهای تشخیصی ممکن باشد. در حال حاضر، این سرویس برای تمامی کاربران بالای 18 سال در زبان هایی نظیر انگلیسی، آلمانی، ژاپنی و هندی فعال شده است. اگرچه دسترسی پایه برای عموم رایگان است، اما مشترکین طرح های پیشرفته مانند AI Premium محدودیت کمتری در تعداد دفعات فراوری محتوا خواهند داشت. گوگل وعده داده است که در آینده ای نزدیک، دامنه زبان های پشتیبانی شده و کیفیت خروجی را در پلتفرم جمنای به شکل چشمگیری توسعه خواهد داد.
منبع: GSMArena
منبع: دیجیکالا مگ