۲۵ خرداد ۱۴۰۵ - ۱۹:۵۴

رکوردشکنی بی‌سابقه انویدیا در بنچمارک جدید AA-AgentPerf

5656
بازدید:۳۲
انویدیا با رونمایی از نتایج بنچمارک جدید AA-AgentPerf، استانداردهای جدیدی برای اجرای «عامل‌های هوش مصنوعی» (Agentic AI) تعیین کرد. پلتفرم Blackwell GB300 NVL72 با ثبت جهشی ۲۰ برابری در بهره‌وری انرژی نسبت به معماری پیشین (H200)، نشان داد که راهکار جدید انویدیا نه تنها در سرعت، بلکه در مدیریت هم‌زمان ده‌ها هزار عامل فعال، بی‌رقیب است.

عبور از مرزها؛ معماری Blackwell چگونه اجرای هم‌زمان عامل‌های هوش مصنوعی را متحول کرد؟

 با ظهور هوش مصنوعی عامل‌محور (Agentic AI)، نیاز به سخت‌افزارهایی که بتوانند استدلال‌های چندمرحله‌ای، فراخوانی ابزارها و کانتکست‌های طولانی را به صورت پایدار مدیریت کنند، حیاتی شده است. بنچمارک جدید Artificial Analysis با نام AA-AgentPerf، دقیقاً همین شرایط عملیاتی را شبیه‌سازی کرده و نتایج حاصل از آن، سلطه بلامنازع Blackwell را تثبیت می‌کند.

اعداد و ارقامی که باورکردنی نیستند

در حالی که در معماری نسل قبل (H200)، شاهد پشتیبانی از ۲.۶ هزار عامل به ازای هر مگاوات انرژی بودیم، پلتفرم GB300 NVL72 این عدد را به رقم حیرت‌انگیز ۶۱.۴ هزار عامل رسانده است. این یعنی کاهش چشمگیر هزینه‌های عملیاتی برای شرکت‌هایی که قصد دارند مدل‌های بزرگی مانند DeepSeek V4 Pro را به صورت گسترده مستقر کنند.

مقایسه کلیدی عملکرد:

  •     بهره‌وری انرژی (عامل/مگاوات): ۶۱,۴۰۰ (GB300) در برابر ۲,۶۰۰ (H200) - بهبود ۲۰ برابری.
  •     ظرفیت هر GPU (عامل هم‌زمان): ۵۷.۵ (GB300) در برابر ۱.۴ (H200) - بهبود ۴۰ برابری.
  • چرا این بنچمارک مهم است؟

بنچمارک‌های قدیمی معمولاً بر اساس پرامپت‌های ایستا و ساده بودند. اما AA-AgentPerf به سراغ سناریوهای واقعی رفته است؛ جایی که سیستم باید هم‌زمان ده‌ها کدنویس مجازی را مدیریت کند، به حافظه KV Cache رجوع کند و زمان‌بندی پردازش‌ها را در لحظه تغییر دهد. این تست، «تاب‌آوری واقعی» سیستم را در شرایط زیر فشار کاری سنگین می‌سنجد.

نگاه به آینده: معماری Rubin

انویدیا حتی پیش از جا افتادن کامل معماری Blackwell، نگاه خود را به آینده دوخته است. معماری Rubin که در افق نزدیک قرار دارد، با بهره‌گیری از پردازنده‌های Vera و توان محاسباتی ۵۰ پتافلاپسی (NVFP4)، وعده می‌دهد که گلوگاه‌های فعلی در فراخوانی ابزارهای LLM را نیز از میان بردارد.

5656

5656

تحلیل نهایی:

این جهش عملکرد، پیامی روشن برای صنعت دارد: دوران «هوش مصنوعی چت‌باکس» به پایان رسیده و ما وارد عصر «هوش مصنوعی عمل‌گرا» شده‌ایم. شرکت‌هایی که روی سخت‌افزارهای نسل قبل مانده‌اند، به‌زودی با هزینه‌های انرژی و سربارهای محاسباتی سنگینی روبرو خواهند شد که عملاً رقابت را برای آن‌ها در مقیاس‌های بزرگ دشوار می‌کند.

تازه‌ها
پربیننده‌ها پربحث‌ها