آزمایشگاه «Adobe Research» و محققان دانشگاه «Northwestern» یک سیستم هوش مصنوعی به نام Sketch2Sound توسعه دادهاند که طراحان صدا میتوانند با استفاده از آن افکتهای صوتی حرفهای و فضاهای صوتی منحصربهفرد را تنها با زمزمه، تقلید صدا و توضیحات متنی ایجاد کنند. این سیستم به طراحان این امکان را میدهد که افکتهای صوتی پیچیده را تنها با ورودیهای صوتی یا متنی ساده بسازند.
طبق گزارش «The-Decoder» سیستم Sketch2Sound از ورودیهای صوتی به صورت دقیق استفاده میکند و سه ویژگی کلیدی صدا را تجزیه و تحلیل میکند: بلندی، رنگ (که مشخص میکند صدا چقدر روشن یا تیره است) و تُن. سپس این ویژگیها با توضیحات متنی ترکیب شده و صدایی دقیقاً مطابق نیاز کاربر ایجاد میشود. به عنوان مثال، اگر کاربر دستور متنی فضای جنگلی را وارد کند و صداهای کوتاهی با دهان خود دربیاورد، سیستم بهطور خودکار این زمزمه را به صدای پرندگان تبدیل میکند.
یکی از ویژگیهای جالب Sketch2Sound این است که قادر است زمینه و مفهوم ورودیهای کاربر را بهدرستی تشخیص دهد. برای مثال، وقتی کاربر درحال ایجاد الگوی درام است، سیستم بهطور خودکار از نتهای پایین برای ایجاد صدای باس درام و از نتهای بالا برای ایجاد صدای درام کوچک استفاده میکند.
این ابزار به طراحان صدا این امکان را میدهد که کنترل دقیقی بر صداهای تولیدشده داشته باشند. تیم تحقیقاتی ادوبی به ابزار Sketch2Sound قابلیتهایی برای فیلتر کردن صدای تولیدشده اضافه کرده است که طراحان میتوانند بسته به نیاز خود کنترل دقیق یا تقریبی روی صداها داشته باشند. این ویژگی میتواند برای هنرمندان متخصص صداسازی (کسانی که افکتهای صوتی برای فیلمها ایجاد میکنند) بسیار مفید باشد زیرا آنها میتوانند افکتهای مورد نظر را سریعتر و به راحتی با استفاده از صدای خود ایجاد کنند.
با اینکه Sketch2Sound امکانات گستردهای برای طراحان صدا فراهم میآورد، محققان اشاره کردهاند که ویژگیهای صوتی فضایی (Spatial) میتوانند گاهی باعث مشکلاتی در تولید صدا شوند. بااینحال، تیم تحقیقاتی در تلاش است تا این مشکلات را برطرف کند. ادوبی هنوز تاریخ مشخصی برای عرضه تجاری این ابزار اعلام نکرده است.