جنگ GPU: وقتی قدرت محاسباتی سلاح می‌شود

آرسام صباغ

تا همین دو سال پیش، قدرت محاسباتی چیزی شبیه برق شهری بود: پول می‌دادید، مصرف می‌کردید و کسی نمی‌پرسید برای چه. تیرماه ۱۴۰۵ این توهم فروریخت. وقتی گوگل دسترسی متا به زیرساخت محاسباتی Gemini را سهمیه‌بندی کرد، پیام روشنی به کل صنعت مخابره شد: قدرت محاسباتی (Compute) دیگر کالای خنثی نیست — سلاح است. این گزارش تشریح می‌کند که چگونه جنگ GPU نقشه قدرت را در صنعت هوش مصنوعی بازترسیم کرده و چرا نقشه راه آزمایشگاه‌ها دیگر با الگوریتم نه، با مگاوات و سیلیکون تعیین می‌شود.

ردیف رک‌های GPU پشت قفس‌های امنیتی — نمادی از جیره‌بندی قدرت محاسباتی — در سال ۲۰۲۶، دسترسی به GPU دیگر تابع قرارداد تجاری ساده نیست؛ تابع موازنه قدرت میان غول‌های فناوری است.

۱. پایان دوران «برق شهری» محاسبات

از ۲۰۲۳ تا ۲۰۲۵، روایت غالب صنعت این بود که ابر (Cloud) همه‌چیز را دموکراتیک کرده است: هر استارتاپی با یک کارت اعتباری می‌توانست به همان زیرساختی دسترسی داشته باشد که OpenAI دارد. اما رشد انفجاری مدل‌های مرزی این معادله را شکست. آموزش یک مدل مرزی (Frontier Model) امروز به ده‌ها هزار شتاب‌دهنده هم‌زمان نیاز دارد و ظرفیت جهانی تولید — حتی با تمام توان TSMC — پاسخگوی تقاضا نیست.

وقتی عرضه محدود و تقاضا نامحدود باشد، بازار به سیاست تبدیل می‌شود. تحلیلگری در شبکه X این وضعیت را در یک جمله خلاصه کرد: «در ۲۰۲۶، تنها ارز واقعی، قدرت محاسباتی است.» این جمله دیگر استعاره نیست؛ توصیف دقیق ترازنامه شرکت‌هاست. ارزش‌گذاری آزمایشگاه‌های هوش مصنوعی امروز پیش از هر چیز بر اساس ظرفیت محاسباتی تضمین‌شده آن‌ها سنجیده می‌شود، نه صرفاً کیفیت مدل‌ها یا تعداد کاربران.

۲. گوگل در برابر متا: جیره‌بندی سیلیکون

در اوایل ژوئیه ۲۰۲۶ گزارش شد که گوگل دسترسی متا به زیرساخت محاسباتی Gemini را محدود کرده است — اتفاقی که در ظاهر یک اختلاف قراردادی است، اما در باطن نخستین شلیک علنی جنگ سرد محاسباتی محسوب می‌شود. متا از اواخر ۲۰۲۵ یکی از بزرگ‌ترین اجاره‌کنندگان ظرفیت خارجی بود: قرارداد شش‌ساله حدوداً ۱۰ میلیارد دلاری با Google Cloud، توافق ۱۴ میلیارد دلاری با CoreWeave و قرارداد ۳ میلیارد دلاری با Nebius. حالا همان شرکتی که به متا ظرفیت می‌فروخت، شیر فلکه را نیمه‌بسته است.

درس استراتژیک این ماجرا تلخ اما شفاف است: هر آزمایشگاهی که ادغام عمودی نداشته باشد، آسیب‌پذیر است. حتی متا — با ارزش بازار تریلیون‌دلاری — وقتی زیرساختش را از رقیب اجاره می‌کند، عملاً کلید آینده‌اش را به او سپرده است. اگر این اتفاق برای متا می‌افتد، تکلیف استارتاپ‌هایی که کل هستی‌شان روی اعتبار ابری چند ماهه بنا شده، روشن است.

«نقشه راه توسعه هوش مصنوعی دیگر با نبوغ الگوریتمی محدود نمی‌شود؛ با کنترل فیزیکی سخت‌افزار محدود می‌شود.»

۳. واکنش متا: تولد یک ابر جدید

پاسخ متا به این جیره‌بندی، ساختن راه خروج بود: راه‌اندازی کسب‌وکار ابری اختصاصی برای بازفروش ظرفیت مازاد محاسباتی خود. این حرکت که در گزارش‌های صنعتی با نام Meta Compute شناخته می‌شود، مستقیماً بازار «نئوکلود»‌ها (Neo-Cloud) — بازیگرانی مانند CoreWeave، Lambda و Nebius — را هدف گرفته است.

طنز ماجرا را از دست ندهید: شرکتی که تا دیروز بزرگ‌ترین مستأجر بازار بود، حالا می‌خواهد موجر شود. این چرخش فقط یک تنوع‌بخشی درآمدی نیست؛ یک بیمه استراتژیک است. وقتی شما مالک دیتاسنتر، شبکه و انرژی باشید، هیچ رقیبی نمی‌تواند با یک تصمیم هیئت‌مدیره، برنامه آموزش مدل بعدی‌تان را فلج کند.

۴. از قیمت توکن تا تضمین ظرفیت

مهم‌ترین تغییر رفتاری این دوره در تیم‌های خرید سازمانی رخ داده است. تا سال گذشته، مذاکرات B2B حول قیمت هر میلیون توکن می‌چرخید: چند دلار برای ورودی، چند دلار برای خروجی. در ۲۰۲۶ این چانه‌زنی جای خود را به مطالبه‌ای سخت‌تر داده است: تضمین ظرفیت (Compute Guarantee).

سازمان‌ها آموخته‌اند که قیمت ارزان توکن بی‌معناست اگر در روز اوج تقاضا، سهمیه شما نصف شود یا صف استنتاج شما پشت مشتریان بزرگ‌تر قرار گیرد. قراردادهای جدید شبیه قراردادهای خرید تضمینی برق نوشته می‌شوند: حداقل ظرفیت رزروشده، جریمه قطع سرویس، و بندهای صریح درباره اولویت‌بندی در شرایط کمبود. این زبان حقوقی تازه، خودش گواه تسلیحاتی‌شدن compute است.

تصویر بزرگ: مجموع تعهدات اجاره زیرساخت متا در کمتر از یک سال — گوگل (~۱۰ میلیارد دلار)، CoreWeave (~۱۴ میلیارد دلار)، Nebius (~۳ میلیارد دلار) و مذاکرات ~۲۰ میلیارد دلاری با Oracle — از تولید ناخالص داخلی بسیاری از کشورها بیشتر است. و همین وابستگی، پاشنه آشیل او شد.

۵. ادغام عمودی: راه فرار از گروگان‌گیری

پاسخ ساختاری صنعت به این بحران، حرکت شتابان به سمت ادغام عمودی (Vertical Integration) است. گوگل با TPU، آمازون با Trainium و Inferentia، متا با MTIA و مایکروسافت با Maia، همگی می‌کوشند وابستگی خود به انویدیا و به یکدیگر را قطع کنند. تراشه اختصاصی دیگر پروژه تحقیقاتی نیست؛ شرط بقاست.

اما ادغام عمودی فقط تراشه نیست. لایه پایین‌تر از سیلیکون، انرژی است. آزمایشگاه‌هایی که قراردادهای بلندمدت هسته‌ای و زمین‌گرمایی امضا کرده‌اند، در واقع دارند همان منطق را یک لایه عمیق‌تر اجرا می‌کنند: هرچه از زنجیره تأمین را مالک نباشی، روزی علیه تو استفاده خواهد شد. پیش‌بینی جسورانه اما منطقی این است که آزمایشگاه‌های بازمانده دهه آینده، در عمل شرکت‌های انرژی خواهند بود که مدل زبانی هم دارند.

۶. بُعد ژئوپلیتیک: سهمیه‌بندی در مقیاس کشورها

آنچه گوگل با متا کرد، دولت‌ها سال‌هاست با یکدیگر می‌کنند. کنترل صادرات تراشه‌های پیشرفته به چین، سهمیه‌بندی دسترسی کشورهای مختلف به شتاب‌دهنده‌های نسل جدید، و چارچوب‌های «کاربر مورد اعتماد» برای مدل‌های مرزی، همگی نسخه دولتی همین جنگ GPU هستند. مرز میان سیاست صنعتی و سیاست خارجی عملاً محو شده است.

به همین دلیل است که پروژه‌های هوش مصنوعی حاکمیتی (Sovereign AI) — از برنامه ۵.۵ میلیارد یورویی بایرن در آلمان تا سرمایه‌گذاری‌های هند و عربستان — با این سرعت تأمین مالی می‌شوند. کشورهایی که زیرساخت محاسباتی مستقل ندارند، در عمل حق وتوی توسعه فناورانه خود را به واشنگتن، پکن یا مانتین‌ویو واگذار کرده‌اند.

۷. تکلیف بازیگران کوچک چیست؟

برای استارتاپ‌ها و آزمایشگاه‌های میان‌رده، جنگ GPU دو پیامد مستقیم دارد. نخست، هزینه ورود به آموزش مدل مرزی عملاً از دسترس خارج شده و بازیگران کوچک باید در لایه‌های دیگر — داده تخصصی، مدل‌های کوچک بهینه، و لایه عاملی (Agentic Layer) — ارزش بسازند. دوم، معماری چندابری (Multi-Cloud) از یک توصیه محافظه‌کارانه به الزام حیاتی تبدیل شده است؛ تیمی که فقط روی یک ارائه‌دهنده قفل شده، در واقع یک ریسک تک‌نقطه‌ای در قلب کسب‌وکارش دارد.

روند مکمل، رشد بازار استنتاج لبه (Edge Inference) است: وقتی ابر جیره‌بندی می‌شود، اجرای مدل‌های کوچک روی سخت‌افزار خودی جذابیت مضاعف پیدا می‌کند — موضوعی که در تحلیل جداگانه‌ای درباره نسل جدید مدل‌های روی‌دستگاه به آن پرداخته‌ایم.

۸. درسی که اکوسیستم ایران زودتر از همه آموخت

برای توسعه‌دهنده ایرانی، «جیره‌بندی دسترسی به زیرساخت» خبر تازه‌ای نیست؛ سال‌هاست با آن زندگی می‌کند. تحریم‌ها همان کاری را با اکوسیستم ایران کردند که گوگل امروز با متا می‌کند — با این تفاوت که اینجا هیچ قرارداد ۱۰ میلیارد دلاری جایگزینی در کار نبود. تجربه‌ای که تیم‌های ایرانی در سال‌های اخیر اندوختند — اتکا به مدل‌های وزن‌باز، بهینه‌سازی استنتاج روی سخت‌افزار محدود، و طراحی معماری‌های مقاوم در برابر قطع سرویس — حالا دقیقاً همان مهارت‌هایی است که کل صنعت جهانی به آن محتاج شده است.

این یک فرصت واقعی است: در جهانی که همه باید «مهندسی کمبود» یاد بگیرند، تیم‌هایی که یک دهه در شرایط کمبود مهندسی کرده‌اند، مزیت رقابتی غیرمنتظره‌ای دارند.

۹. جمع‌بندی: نقشه جدید قدرت

جنگ GPU سه واقعیت را تثبیت کرده است. اول، قدرت محاسباتی به دارایی استراتژیک هم‌ردیف انرژی و غذا تبدیل شده و مثل آن‌ها سهمیه‌بندی، احتکار و تسلیحاتی می‌شود. دوم، ادغام عمودی — از تراشه تا نیروگاه — دیگر انتخاب نیست؛ شرط ماندن در بازی است. سوم، برندگان این دهه لزوماً بهترین مدل را نخواهند داشت؛ مطمئن‌ترین دسترسی به سیلیکون و انرژی را خواهند داشت.

برای بقیه ما — تیم‌های کوچک‌تر، کشورهای غیرمرکزی، توسعه‌دهندگان مستقل — پیام روشن است: روی لایه‌هایی سرمایه‌گذاری کنید که جیره‌بندی‌شان سخت‌تر است: داده اختصاصی، تخصص دامنه، و مدل‌هایی که روی سخت‌افزار خودتان می‌چرخند.