OpenAI میگوید به شواهدی دست یافته که نشان میدهد DeepSeek استارتآپ هوش مصنوعی چینی از مدلهای اختصاصی این شرکت آمریکایی برای مدلسازی هوش مصنوعی منبع باز خود استفاده کرده است. با رونمایی از دیپ سیک، سهام شرکتهای آمریکایی مانند انویدیا به شدت افت کرد. همچنین بیت کوین و بازار ارز دیجیتال ریزش سنگینی را تجربه کرد. مایکروسافت نیز در حال تحقیق بروی گروه مرتبط با DeepSeek که جمعآوری دادههای OpenAI را انجام داده است.
سازنده ChatGPT مستقر در سانفرانسیسکو به فایننشال تایمز گفت که شواهدی از «تقطیر» دیده است که گمان میرود از DeepSeek باشد.
این تکنیک توسط توسعهدهندگان برای به دست آوردن عملکرد بهتر در مدلهای کوچکتر با استفاده از خروجیهای مدلهای بزرگتر و تواناتر مورد استفاده قرار میگیرد و به آنها اجازه میدهد تا نتایج مشابهی را در کارهای خاص با هزینه بسیار کمتر به دست آورند.
استفاده از مدلهای گذشته یک روش رایج است. اما نگرانی این بود که DeepSeek ممکن است این کار را برای ساخت مدل رقیب خود انجام دهد، که نقض شرایط خدمات OpenAI است.
یکی از افراد نزدیک به OpenAI گفت: «مسئله زمانی است که شما [آن را از پلتفرم خارج میکنید و] برای ایجاد مدل خود برای اهداف خود این کار را انجام میدهید.
OpenAI از اظهار نظر بیشتر یا ارائه جزئیات شواهد خود خودداری کرد. شرایط خدمات آن بیان میکند که کاربران نمیتوانند هیچ یک از خدمات آن را «کپی» کنند یا «از خروجی برای توسعه مدلهایی که با OpenAI رقابت میکنند» استفاده کنند.
انتشار مدل استدلال R1 توسط DeepSeek بازارها و همچنین سرمایه گذاران و شرکت های فناوری در سیلیکون ولی را شگفت زده کرده است. مدل های ساخته شده روی کفش آن به رتبه های بالا و نتایج قابل مقایسه با مدل های پیشرو ایالات متحده دست یافته اند.
سهام انویدیا در روز دوشنبه 17 درصد سقوط کرد و 589 میلیارد دلار از ارزش بازار آن حذف شد، زیرا ترس از عدم نیاز به سرمایه گذاری های بزرگ در سخت افزار گران قیمت هوش مصنوعی آن است. آنها در روز سه شنبه 9 درصد بهبود یافتند، همراه با سایر سهام فناوری.
یکی دیگر از افراد آگاه گفت که OpenAI و شریکش مایکروسافت حسابهایی را بررسی کردند که گمان میرود سال گذشته DeepSeek هستند که از رابط برنامهنویسی برنامه OpenAI (API) استفاده میکردند و دسترسی آنها را به ظن تقطیر که شرایط خدمات را نقض میکرد مسدود کردند. این تحقیقات اولین بار توسط بلومبرگ گزارش شد.
مایکروسافت از اظهار نظر خودداری کرد و OpenAI بلافاصله به درخواست اظهار نظر در مورد این جزئیات پاسخ نداد. DeepSeek به درخواست اظهار نظر در تعطیلات سال نو قمری پاسخ نداد.
پیش از این، دیوید ساکس، تزار هوش مصنوعی و ارز دیجیتال رئیس جمهور دونالد ترامپ، گفته بود «احتمال دارد» سرقت IP رخ داده باشد.
تکنیکی در هوش مصنوعی به نام تقطیر (Distillation) وجود دارد…وقتی یک مدل از مدل دیگری یاد میگیرد [و] به نوعی دانش را از مدل والد خارج میکند.» ساکس روز سهشنبه به فاکس نیوز گفت.
ساکس افزود: «و شواهد قابل توجهی وجود دارد که نشان میدهد کاری که DeepSeek در اینجا انجام داد این است که دانش مدلهای OpenAI را استخراج کرده است، و من فکر نمیکنم OpenAI از این بابت خیلی خوشحال باشد».
DeepSeek گفت که فقط از 2048 کارت گرافیک Nvidia H800 استفاده کرده و 5.6 میلیون دلار برای آموزش مدل V3 خود با 671 میلیارد پارامتر هزینه کرده است که کسری از هزینه های OpenAI و Google برای آموزش مدل هایی با اندازه مشابه است. برخی از کارشناسان گفتند که این مدل پاسخهایی ایجاد میکند که نشان میدهد بر روی خروجیهای GPT-4 OpenAI آموزش دیده است که شرایط خدمات آن را نقض میکند.
کارشناسان داخلی صنعت میگویند که استفاده از خروجیهای شرکتهایی مانند OpenAI که روی استخدام افرادی سرمایهگذاری کردهاند تا به مدلهایشان بیاموزند که چگونه پاسخهایی را تولید کنند که به نظر انسانیتر میآیند، برای آزمایشگاههای هوش مصنوعی در چین و ایالات متحده معمول است. خودی ها می گویند که این کار گران و پرکار است و بازیکنان کوچکتر اغلب از این کار خودداری می کنند.
ریتویک گوپتا، کاندیدای دکترای هوش مصنوعی در دانشگاه کالیفرنیا، برکلی، میگوید: «این یک روش بسیار رایج برای استارتآپها و دانشگاهیان است که از خروجیهای LLM تجاری همسو با انسان، مانند ChatGPT، برای آموزش مدل دیگری استفاده کنند.
«این بدان معناست که شما این مرحله بازخورد انسانی را به صورت رایگان دریافت میکنید. برای من تعجب آور نیست که DeepSeek ظاهراً همین کار را انجام دهد. اگر آنها بودند، توقف دقیق این عمل ممکن است دشوار باشد.»
این عمل دشواری را برای شرکتهایی که مشتاق حفظ برتری فنی خود هستند، برجسته میکند. OpenAI در آخرین بیانیه خود گفت: «ما می دانیم که شرکت های مستقر در [چین] – و دیگران – دائماً در تلاش هستند تا مدل های شرکت های پیشرو هوش مصنوعی ایالات متحده را تقلید کنند.
وی افزود: «ما در اقدامات متقابل برای محافظت از IP خود، از جمله فرآیندی دقیق که قابلیتهای مرزی در مدلهای منتشر شده گنجانده شده است، مشارکت میکنیم… بسیار مهم است که ما در حال همکاری نزدیک با دولت ایالات متحده برای بهترین محافظت از توانمندترین مدل ها در برابر تلاش های دشمنان و رقبا برای استفاده از فناوری ایالات متحده هستیم.