علی‌بابا از مدل‌های هوش مصنوعی استدلالگر Qwen3 رونمایی کرد؛ متن‌باز و هیبریدی

دیجیاتو سه شنبه 09 اردیبهشت 1404 - 09:32

این مدل‌ها از نوع هیبریدی هستند و می‌توانند به دو صورت سریع و عمیق به سؤالات کاربران پاسخ دهند. The post علی‌بابا از مدل‌های هوش مصنوعی استدلالگر Qwen3 رونمایی کرد؛ متن‌باز و هیبریدی appeared first on دیجیاتو.

هلدینگ چینی علی‌بابا از خانواده جدید مدل‌های هوش مصنوعی استدلالگر خود با نام Qwen3 رونمایی کرد. علی‌بابا ادعا می‌کند مدل‌های جدید این شرکت عملکردی مشابه مدل‌های گوگل و OpenAI دارند و حتی در مواردی می‌توانند از مدل‌های این شرکت‌ها پیشی بگیرند.

به گزارش تک کرانچ، این مدل‌ها تحت مجوز «آزاد» از طریق پلتفرم‌های Hugging Face و گیت‌هاب در دسترس کاربران قرار گرفته‌اند یا به‌زودی عرضه می‌شوند. اندازه این مدل‌ها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. یک مدل هوش مصنوعی هرچقدر پارامترهای بیشتری داشته باشد معمولاً عملکرد بهتری در مهارت‌های حل مسئله از خود نشان می‌دهد.

مدل‌های استدلالگر Qwen3 علی‌بابا به‌زودی در دسترس کاربران قرار می‌گیرند

ظهور و عرضه مدل‌های استدلالگر چینی مانند Qwen3 فشار روی آزمایشگاه‌های هوش مصنوعی غربی مانند OpenAI را برای ارائه فناوری‌های هوش مصنوعی توانمندتر افزایش داده است. رشد شرکت‌های چینی در زمینه هوش مصنوعی همچنین باعث شده که سیاست‌گذاران کشورهای غربی به‌سمت محدودکردن دسترسی شرکت‌های چینی به تراشه‌ها و فناوری‌های روز حرکت کنند.

به گفته علی‌بابا، مدل‌های Qwen3 از نوع هیبریدی هستند. به این معنا که این مدل‌ها هم می‌توانند برای حل مسائل پیچیده وقت بگذارند و استدلال کنند و هم در سریع‌ترین زمان پاسخ را در دسترس کاربر قرار دهند. با استفاده از مهارت استدلال، مدل‌های هوش مصنوعی می‌توانند به‌طور دائم پاسخ‌های خودشان را بررسی کنند.

برخی از مدل‌ها همچنین از معماری ترکیب متخصصان (MoE) استفاده می‌کنند که می‌تواند برای پاسخ به پرسش‌ها از نظر محاسباتی کارآمدتر باشد. MoE وظایف بزرگ را به وظایف کوچک‌تر تقسیم و پردازش آنها را به مدل‌های «متخصص» کوچک‌تر و تخصصی‌تر واگذار می‌کند.

به گفته علی‌بابا، مدل‌های Qwen3 از ۱۱۹ زبان پشتیبانی می‌کنند و روی مجموعه‌ای از داده‌ها متشکل از نزدیک به ۳۶ تریلیون توکن آموزش‌دیده‌اند. این هلدینگ چینی در هفته‌های گذشته نیز از مدل هوش مصنوعی استدلالگر تصویری خود رونمایی کرده بود.

علی‌بابا ادعا می‌کند که قدرت محاسباتی مدل‌های Qwen3 نسبت به نسل قبلی این مدل‌ها پیشرفت کرده است. هرچند خانواده مدل‌های Qwen3 هنوز نمی‌توانند در حد مدل‌های o۳ و o4-mini شرکت OpenAI ظاهر شوند، اما می‌توانند همچنان عملکرد قابل‌توجهی از خود نشان دهند و برای رفع نیازهای کاربران مناسب باشند.

مشاهده متن کامل خبر در "دیجیاتو"