به گزارش ایسنا، مدل جدید هوش مصنوعی «دیپسیک وی۳»(DeepSeek V3) که توسط شرکت «دیپسیک» ابداع شده است، به توسعهدهندگان امکان میدهد تا آن را برای بیشتر اپلیکیشنها از جمله اپلیکیشنهای تجاری دانلود و اصلاح کنند.
به نقل از تک کرانچ، دیپسیک وی۳ میتواند طیف گستردهای از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با توجه به درخواست انجام دهد.
براساس آزمایشهای داخلی شرکت دیپسیک، دیپسیک وی۳ هم از مدلهای قابل دانلود «باز» در دسترس و هم از مدلهای «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل میکند. در زیرمجموعهای از رقابتهای کدنویسی که در پلتفرم «کدفورسز«(Codeforces) میزبانی میشوند، دیپسیک وی۳ توانست بهتر از مدلهای دیگر مانند «Llama 3.1 405B» شرکت «متا»(Meta)، «GPT-4o» شرکت «اوپنایآی»(OpenAI) و «Qwen 2.5 72B» شرکت «علیبابا»(Alibaba) عمل میکند.
دیپسیک گفت که دیپسیک وی۳ روی یک مجموعه داده متشکل از ۱۴.۸ تریلیون توکن آموزش دیده است. در علم داده، توکنها برای نمایش بیتهای داده خام استفاده میشوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است.
اگرچه دیپسیک وی۳ کاربردیترین مدل نیست اما از برخی جهات یک دستاورد به شمار میرود. دیپسیک توانست این مدل را با استفاده از مرکز داده پردازندههای گرافیکی H800 شرکت «انویدیا»(Nvidia) در حدود دو ماه آموزش دهد. این شرکت خاطرنشان کرد فقط ۵.۵ میلیون دلار برای آموزش دیپسیک وی۳ هزینه کرده که کسری از هزینه توسعه مدلهایی مانند GPT-4 است.
انتهای پیام