هلدینگ چینی علیبابا از خانواده جدید مدلهای هوش مصنوعی استدلالگر خود با نام Qwen3 رونمایی کرد. علیبابا ادعا میکند مدلهای جدید این شرکت عملکردی مشابه مدلهای گوگل و OpenAI دارند و حتی در مواردی میتوانند از مدلهای این شرکتها پیشی بگیرند.
به گزارش تک کرانچ، این مدلها تحت مجوز «آزاد» از طریق پلتفرمهای Hugging Face و گیتهاب در دسترس کاربران قرار گرفتهاند یا بهزودی عرضه میشوند. اندازه این مدلها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. یک مدل هوش مصنوعی هرچقدر پارامترهای بیشتری داشته باشد معمولاً عملکرد بهتری در مهارتهای حل مسئله از خود نشان میدهد.
ظهور و عرضه مدلهای استدلالگر چینی مانند Qwen3 فشار روی آزمایشگاههای هوش مصنوعی غربی مانند OpenAI را برای ارائه فناوریهای هوش مصنوعی توانمندتر افزایش داده است. رشد شرکتهای چینی در زمینه هوش مصنوعی همچنین باعث شده که سیاستگذاران کشورهای غربی بهسمت محدودکردن دسترسی شرکتهای چینی به تراشهها و فناوریهای روز حرکت کنند.
به گفته علیبابا، مدلهای Qwen3 از نوع هیبریدی هستند. به این معنا که این مدلها هم میتوانند برای حل مسائل پیچیده وقت بگذارند و استدلال کنند و هم در سریعترین زمان پاسخ را در دسترس کاربر قرار دهند. با استفاده از مهارت استدلال، مدلهای هوش مصنوعی میتوانند بهطور دائم پاسخهای خودشان را بررسی کنند.
برخی از مدلها همچنین از معماری ترکیب متخصصان (MoE) استفاده میکنند که میتواند برای پاسخ به پرسشها از نظر محاسباتی کارآمدتر باشد. MoE وظایف بزرگ را به وظایف کوچکتر تقسیم و پردازش آنها را به مدلهای «متخصص» کوچکتر و تخصصیتر واگذار میکند.
به گفته علیبابا، مدلهای Qwen3 از ۱۱۹ زبان پشتیبانی میکنند و روی مجموعهای از دادهها متشکل از نزدیک به ۳۶ تریلیون توکن آموزشدیدهاند. این هلدینگ چینی در هفتههای گذشته نیز از مدل هوش مصنوعی استدلالگر تصویری خود رونمایی کرده بود.
علیبابا ادعا میکند که قدرت محاسباتی مدلهای Qwen3 نسبت به نسل قبلی این مدلها پیشرفت کرده است. هرچند خانواده مدلهای Qwen3 هنوز نمیتوانند در حد مدلهای o۳ و o4-mini شرکت OpenAI ظاهر شوند، اما میتوانند همچنان عملکرد قابلتوجهی از خود نشان دهند و برای رفع نیازهای کاربران مناسب باشند.