انقلاب خاموش DeepSeek؛ چگونه محدودیت منابع به خلق نوآوری انجامید

دیجیاتو چهارشنبه 10 بهمن 1403 - 19:50
موفقیت DeepSeek درس مهمی برای اکوسیستم استارتاپی دارد. وقتی نمی‌توانی مانند رقبای بزرگ خرج کنی، مجبوری خلاقانه‌تر عمل کنی. The post انقلاب خاموش DeepSeek؛ چگونه محدودیت منابع به خلق نوآوری انجامید appeared first on دیجیاتو.

تا همین چند ماه پیش، باور عمومی این بود که موفقیت در عرصه هوش مصنوعی تنها از مسیر منابع عظیم مالی می‌گذرد. اما ظهور غیرمنتظره یک شرکت چینی این معادله را دگرگون کرده است. DeepSeek (دیپ‌سیک) با رویکردی نو نشان داد که محدودیت منابع می‌تواند به جای مانع، محرکی برای نوآوری باشد.

صنعت هوش مصنوعی در سال‌های اخیر شاهد تحولی بنیادین بوده است. غول‌های بزرگی همچون Open AI و گوگل با صرف هزینه‌های زیاد در حال توسعه ابزارهای هوش مصنوعی هستند. «چت جی‌پی‌تی» و «جمنای» دو چت‌بات این شرکت هستند که بسیار مورد توجه کاربران قرار گرفته‌اند. اما به تازگی شاهد ظهور بازیگری جدید هستیم که توانسته زمین بازی در حوزه AI را به کلی تغییر دهد.

این روزها، نام دیپ‌سیک در صدر اخبار هوش مصنوعی قرار گرفته است. این مدل که توسط شرکتی چینی توسعه یافته، با ادعای مصرف منابع کمتر و عملکرد قابل رقابت با بزرگان این صنعت، توجه بسیاری را به خود جلب کرده است.

DeepSeek در مقاله‌ای اعلام کرده که مدل DeepSeek-V3 خود را با تراشه‌های انویدیا H800 و هزینه‌ای کمتر از 6 میلیون دلار آموزش داده است. DeepSeek-R1 که به تازگی منتشر شده، طبق ادعای این شرکت بسته به وظیفه خود، 20 تا 50 برابر مقرون‌ به‌صرفه‌تر از مدل استدلال‌گر OpenAI یعنی o1 است. این آمار تحسین شرکت‌های رقیب را هم برانگیخت. به طور مثال «سم آلتمن» مدیرعامل Open AI آن را یک مدل «تاثیر گذار» توصیف و اعلام کرد از رقابت استقبال می‌کنند.

انقلاب دیپ‌سیک در برابر هوش مصنوعی

خلق پارادایم جدید با نوآوری

«ایوب ویسمرادی»، کارشناس مدیریت محصول، در تشریح این وضعیت به دیجیاتو می‌گوید تا پیش از این، باور عمومی بر این بود که موفقیت در حوزه هوش مصنوعی مستلزم برخورداری از سه رکن اساسی است: داده‌های گسترده، الگوریتم‌های پیشرفته و توان محاسباتی قوی که کانال‌های توزیع مؤثر برای ایجاد دسترسی کاربر، آنها را تکمیل می‌کند. یعنی مایکروسافت با توجه به محبوبیت اکسل، کوپایلت را ساخت و به اکسل متصل کرد تا کاربران بتوانند از آن استفاده کنند. نمونه دیگر آن ایجاد دسترسی به جمینای در گوگل داک است.

دیدگاه موجود باعث شده بود که عرصه هوش مصنوعی در انحصار شرکت‌های بزرگ باقی بماند. در واقع تصور کلی این بود که برای داشتن مدل موفق باید در هر چهار حوزه مزیت داشته باشید. در نتیجه فقط شرکت‌های بزرگ مثل گوگل، متا و اوپن‌ای‌آی می‌توانستند در این عرصه فعالیت کنند، چون هم داده‌های زیادی داشتند، هم منابع انسانی متخصص برای تولید الگوریتم‌های خوب در دسترسشان بود و هم پول کافی برای ساخت مراکز داده و خرید تجهیزات پردازشی در اختیار داشتند.

این تصور آنقدر در اذهان رسوخ کرده بود که حتی مدیران ارشد صنعت فناوری به دنبال راهکارهایی برای جذب منابع انرژی جدید بودند. ویسمرادی به سخنان اریک اشمیت، مدیرعامل سابق گوگل، اشاره می‌کند که معتقد بود آمریکا برای پیشرفت در زمینه هوش مصنوعی باید با کانادا همکاری کند، چرا که این کشور از منابع هیدروپاور (انرژی آبی) ارزان و فراوانی برخوردار است که برای تأمین انرژی مراکز داده ضروری است. مراکز داده‌ای که وجودشان برای انجام محاسبات عظیم توسط هوش مصنوعی لازم است.

اما به نظر می‌رسد «انقلابی خاموش» در حال وقوع است. شرکت چینی Deepseek توانسته‌ با نوآوری در بخش الگوریتم، نیاز به محاسبات و در نتیجه منابع محاسباتی را کمتر کرده و به نتایج قابل توجهی دست یابد.

اپلیکیشن دیپ‌سیک

ویسمرادی این پدیده را این‌گونه تحلیل می‌کند: «وقتی محدودیت منابع وجود دارد، افراد به سمت خلاقیت سوق پیدا می‌کنند. این محدودیت مانند یک قوی سیاه عمل کرده و تیم‌ها را مجبور به خلق راهکارهای نوآورانه می‌کند. در حالی که شرکت‌های بزرگ به دلیل دسترسی به منابع فراوان، کمتر به فکر بهینه‌سازی بوده‌اند و بیشتر روی افزایش دقت خروجی تمرکز کرده‌اند.»

البته او تأکید می‌کند که از این موضوع نمی‌توان یک برداشت عمومی ثابت داشت که لزوما با منابع کمتر، می‌توان موفق شد؛ چراکه تیم‌های دیگر هم بودند که با وجود محدودیت‌ها تلاش کرده‌اند، اما موفق نشده‌اند: 

«در واقع با ظهور دیپ‌سیک شاهد خلق یک پارادایم جدید هستیم که با محاسبات پایین هم بتوان مدل با کیفیتی ساخت. آنها ذهنیت قبلی درباره نیاز به منابع عظیم را شکسته‌اند و شاید تیم‌های دیگر با الگو گرفتن، به سراغ بهینه‌سازی هرچه بیشتر در حوزه هوش مصنوعی بروند.»

محدودیت منابع، محرک نوآوری

ویسمرادی در پاسخ به سوال دیجیاتو مبنی بر اینکه آیا منابع مالی شرط لازم موفقیت یک استارتاپ است یا خیر، می‌گوید: «منابع مالی شرط لازم است و حداقلی از آن باید وجود داشته باشد. اما گاهی کمبود منابع می‌تواند مزیت محسوب شود. وقتی منابع محدودی داری و می‌خواهی با رقیب بزرگ رقابت کنی، باید خلاقیت به خرج دهی و این خلاقیت شاید تو را به راه‌حل‌هایی برساند که رقیبت به دلیل داشتن منابع کافی، نیازی نمی‌بیند به سراغ آن‌ها برود.»

ایوب ویسمرادی

ویسمرادی البته معتقد است انتخاب این مسیر به فلسفه و روحیات افراد هم بستگی دارد: «همیشه دو رویکرد وجود دارد. می‌توانید مسیر معمول و پذیرفته‌شده صنعت را دنبال کنید که نیازمند منابع زیاد است اما ریسک کمتری دارد و در میانه منحنی نرمال قرار می‌گیرد. یا می‌توانید به دنبال راه‌حل‌های غیرمتعارف بروید که اگرچه شانس موفقیت کمتری دارند، اما در صورت موفقیت می‌توانند خروجی ده برابر بهتری تولید کنند.»

او تأکید می‌کند که بایستی تفاوت‌های شخصیتی افراد را نیز در نظر گرفت، برخی اهل کارهای غیرمتعارف هستند و برخی ذاتاً ریسک‌پذیری پایین‌تری دارند و به دنبال ساخت چیزهای معمول هستند:

«اکثریت مسیر اول را ترجیح می‌دهند چون ریسک کمتری دارد، اما همیشه افرادی هستند که دوست دارند چیزهای بزرگ بسازند و ریسک‌پذیری بیشتری دارند.»

بررسی دقیق‌تر عملکرد دیپ‌سیک

برای ارزیابی دقیق‌تر عملکرد دیپ‌سیک، به سراغ «حمیدرضا مازندرانی»، کارشناس حوزه هوش مصنوعی رفتیم. او معتقد است برای سنجش عملکرد مدل‌های هوش مصنوعی، علاوه بر معیارهایی مانند میزان دانلود اپلیکیشن، رضایت کاربران و میزان استفاده از سرویس‌ها، بنچمارک‌های تخصصی نیز وجود دارند که همچون یک آزمون استاندارد، قدرت منطق و تحلیل این مدل‌ها را می‌سنجند.

مازندرانی بر اساس ارزیابی‌های موجود به دیجیاتو می‌گوید: «مدل‌های دیپ‌سیک قابل رقابت با برخی از مدل‌های OpenAI بوده و اگرچه نه با آخرین نسخه، اما با مدل O1 در یک سطح و حتی بهتر عمل کرده است.» با این حال، او هشدار می‌دهد که نتایج این آزمون‌ها را باید با احتیاط تفسیر کرد: 

«اگر این آزمون‌ها به عنوان داده ورودی مدل استفاده شوند، مثل یک برگه تقلب در آزمون است و مدل با داشتن جواب‌ها می‌تواند فراتر از توانایی واقعی خود عمل کند. به همین دلیل این آزمون‌ها باید مرتباً به‌روزرسانی شوند.»

حمیدرضا مازندرانی

مازندرانی معتقد است به طور کلی عملکرد DeepSeek خیلی خوب بوده، اما بخشی از اتفاقات فعلی مثل سقوط سهام شرکت‌های فناوری آمریکایی، ناشی از هایپ و هیجان زیاد است؛ چراکه اغلب یک سری موضوعات وایرال می‌شوند، بدون اینکه پشتوانه عمیقی داشته باشند. به باور او باید منتظر ماند و دید آیا این مدل هوش مصنوعی، به جایگاهی که برای آن متصور هستند می‌رسد یا خیر؟

وجه تمایز DeepSeek

آنچه که دیپ‌سیک را متمایز می‌کند، فناوری منحصر به فرد آن است. مازندرانی در توضیح این فناوری می‌گوید: «این مدل‌ها از معماری "Mixture of experts" (ترکیبی از متخصص‌ها) استفاده می‌کنند. مدل یک سری زیرمجموعه از وزن‌ها دارد که به ازای هر ورودی، فقط بخشی از آنها فعال می‌شوند. مثلاً وقتی سؤالی در مورد پزشکی می‌پرسید، فقط اکسپرت‌های مرتبط با پزشکی فعال می‌شوند. این ویژگی باعث کاهش چشمگیر مصرف انرژی می‌شود.»

او علاوه بر Mixture of experts، دیگر برگ برنده این مدل را داده‌های زیادی که در دسترسشان بوده دانست؛ چراکه در چین به راحتی داده از مردم جمع‌آوری می‌شود. همچنین ممکن است برای تمرین آن از خروجی‌ سایر مدل‌های هوش مصنوعی مثل اوپن ای‌آی استفاده شده باشد.

بدبینی نسبت به چین

ساختار سیاسی کشور چین موجب شده تا همواره نگاه‌ها به این کشور چندان مثبت نباشد. در ماجرای اخیر نیز برخی کارشناسان نسبت به آمار اعلام شده درباره منابع مصرفی دیپ‌سیک بدبین هستند. آنها برای تأیید سخنان خود به عملکرد نامناسب این چت‌بات دربرابر سوالات چالش‌برانگیز درباره کشور چین اشاره می‌کنند. به طور مثال معمولا دیپ‌سیک سوالات درباره حزب حاکم چین و رئیس جمهوری آن را بی‌پاسخ می‌گذارد. البته نباید فراموش کرد که سانسور در برخی چت‌بات‌های معروف مثل جمینای و چت‌جی‌پی‌تی نیز سابقه دارد. به طور مثال آنها تا پیش از برگزاری انتخابات ریاست جمهوری آمریکا به سوالاتی که حاوی کلمات انتخابات ریاست جمهوری بودند، پاسخ نمی‌دادند.

مازندرانی با تأیید اینکه برخی کارشناسان به آمار DeepSeek با دیده تردید می‌نگرند به انتشار متن باز این مدل اشاره کرده و می‌گوید این شرکت یا اهداف تجاری خیلی خاصی دارد که حاضر به انجام این کار شده یا پای مسائل سیاسی در میان است. به طور مثال Open Ai  وزن‌های آموزش که به چت جی‌پی‌تی کمک می‌کرد نتایج خود را تولید کند، منتشر نکرد؛ چراکه روی سود این شرکت اثرگذار بود.

رقابتی به سود کاربران

او به طور کلی ظهور دیپ سیک را به سود کاربران نهایی می‌داند: «این موضوع برای کاربران نهایی بسیار مفید خواهد بود. اول به خاطر رقابتی که ایجاد می‌کند و دوم اینکه گروه‌های مختلف و شرکت‌ها می‌توانند از وزن‌های این مدل برای کاربردهای خاص استفاده کنند.»

به طور مثال وزن‌های این مدل را می‌توان با یک سری داده‌های حوزه‌های خاص مثل پزشکی یا امنیت شبکه بیشتر آموزش داد و خروجی‌های خیلی بهتری گرفت. این اتفاق در نتیجه به نفع کاربران خواهد بود.

به نظر می‌رسد دیپ‌سیک، علی‌رغم همه هیاهوها و تردیدها، توانسته است گامی مهم در مسیر توسعه هوش مصنوعی بردارد. زمان نشان خواهد داد که آیا این مدل می‌تواند انتظارات را برآورده کند و جایگاه مورد نظر خود را در این عرصه به دست آورد یا خیر. چیزی که قطعی است، شکل گرفتن رقابتی به سود کاربران است.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.