ظهور DeepSeek در صنعت AI در هفتههای اخیر جنجالی به پا کرده است. این شرکت ادعا میکند که مدلهای هوش مصنوعی آنها در پارامترهای مختلف عملکردی قابل رقابت یا حتی برتر از رقبا دارد؛ اما نکتهای که بیشتر جلب توجه میکند، ادعای آنها در خصوص هزینه پایین آموزش این مدلهاست. طبق اظهارات DeepSeek، مدل هوش مصنوعی پیشرفته آنها به نام R1 با هزینهای کم در حدود 6 میلیون دلار و در مدت زمان تنها چند ماه آموزش دیده است؛ درحالیکه شرکتهای هوش مصنوعی محور غربی صدها میلیون دلار و حتی میلیاردها دلار برای آموزش نسل بعدی مدلهای پیشرفته خود هزینه میکنند.
هوش مصنوعی DeepSeek ادعا میکند که با استفاده از تراشههای قدیمیتر NVIDIA H800 به جای سختافزارهای مدرنتر، توانسته هزینههای آموزش را بهشدت کاهش دهد. همچنین، مشارکتهای صنعتی در چین نقش مؤثری در کاهش هزینهها داشته است. اما برخی از کارشناسان این ادعاها را زیر سؤال بردهاند. بهعنوانمثال، یکی از تحلیلگران اخیراً اشاره کرده است که ادعای هزینه پایین «ممکن است داستانی ساختگی» باشد.
مقایسه با OpenAI:
مدل GPT-4 از OpenAI تنها هزینهای در حدود ۱۰۰ میلیون دلار برای آموزش داشته است که این رقم نشاندهنده میزان سرمایهگذاری عظیم در این حوزه است. این موضوع باعث شده برخی از ناظران گمان کنند DeepSeek از میانبرهایی مانند تقطیر (distillation) دادههای مدلهای GPT بهره برده است؛ روشی که مطابق با شرایط استفاده OpenAI، ممنوع است.
تعدادی از چهرههای برجسته در صنعت هوش مصنوعی به ادعاهای DeepSeek واکنش نشان دادهاند:
این ابهامات موجب شده تا برخی معتقد باشند که استراتژی هزینه پایین DeepSeek بخشی از سیاستهای سرمایهگذاری صندوق High-Flyer چین است که ارزش این صندوق به ۸ میلیارد دلار میرسد. همچنین، سرمایهگذار معروف بیلی اکمن احتمال داده است که این ادعاها بهنفع سقوط سهام شرکتهایی مانند NVIDIA مطرح شدهاند.
جمعبندی
با وجود پشتوانه مالی قابلتوجه و ادعاهای چشمگیر، موضوع هزینه پایین آموزش مدل “R1” از DeepSeek همچنان محل بحث و اختلاف نظر درمیان کارشناسان صنعت هوش مصنوعی باقی مانده است. درحالیکه برخی از چهرههای برجسته این ادعا را بهعنوان «داستان ساختگی» معرفی کردهاند، DeepSeek همچنان به ارائه توضیحات بیشتر و شفافسازی از روشهای خود ادامه خواهد داد.
دیدگاه شما درباره هزینه کم توسعه هوش مصنوعی DeepSeek چیست؟