مدل جدید هوش مصنوعی تبدیل متن به گفتار

دنیای اقتصاد چهارشنبه 01 اسفند 1403 - 00:03
مهر: یک مدل هوش مصنوعی ابداع شده که با کلیپ چندثانیه‌ای از صدای فرد آن را شبیه‌سازی می‌کند. به نقل از رجیستر، یک استارت‌آپ آمریکایی به نام Zyphra از یک مدل هوش مصنوعی متن به گفتار (TTS) رونمایی کرده که می‌تواند با دریافت نمونه صوتی ۵ثانیه‌ای از فرد، صدای او را شبیه‌سازی کند.

دنی مارتینلی و کریتیک پوتالات این استارت‌آپ را در ۲۰۲۱ میلادی با هدف ساخت یک سیستم‌عامل چند حالتی به نام MaiaOS راه‌اندازی کردند. نتیجه این تلاش‌ها به شکل عرضه خانواده مدل‌های زبانی کوچک Zamba و اکنون عرضه مدل‌های متن به گفتار Zonos نمایش داده شده است. هر یک از این مدل‌ها ۱.۶میلیارد پارامتر دارند و براساس ۲۰۰ هزار ساعت داده گفتاری شامل حرف زدن با لحن صدای خنثی مانند خوانش کتاب صوتی و همچنین گفتار با لحن احساسی آموزش دیدند.

منبع خبر "دنیای اقتصاد" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.