ICP·Devآی‌سی‌پی‌·دِو
بازگشت به مقالات
عامل‌های هوش مصنوعی۷ تیر ۱۴۰۵3 دقیقه مطالعه

فراتر از خطوط لوله دست‌نویس: Fugu Ultra از Sakana AI هماهنگ‌سازی چندعاملی را به لایه مدل منتقل می‌کند

شرکت توکیویی Sakana AI از Fugu و Fugu Ultra، اولین «مدل‌های هماهنگ‌ساز» جهان رونمایی کرد که به عنوان یک رهبر ارکستر آموزش‌دیده عمل می‌کنند. Fugu با ادغام چارچوب‌های چندعاملی سنتی در یک API با فراخوانی بازگشتی، به عملکردی پیشرو در استدلال و کدنویسی بدون نیاز به برنامه‌نویسی دستی جریان کار دست می‌یابد.

نکات کلیدی

  • شرکت توکیویی Sakana AI از Fugu و Fugu Ultra، اولین «مدل‌های هماهنگ‌ساز» جهان رونمایی کرد که به عنوان یک رهبر ارکستر آموزش‌دیده عمل می‌کنند
  • Fugu با ادغام چارچوب‌های چندعاملی سنتی در یک API با فراخوانی بازگشتی، به عملکردی پیشرو در استدلال و کدنویسی بدون نیاز به برنامه‌نویسی دستی جریان کار دست می‌یابد
اشتراک‌گذاری
فراتر از خطوط لوله دست‌نویس: Fugu Ultra از Sakana AI هماهنگ‌سازی چندعاملی را به لایه مدل منتقل می‌کند

فراتر از خطوط لوله دست‌نویس: Fugu Ultra از Sakana AI هماهنگ‌سازی چندعاملی را به لایه مدل منتقل می‌کند

چشم‌انداز عوامل هوش مصنوعی در اواسط سال ۲۰۲۶ در حال تجربه تغییری آرام اما سریع است. در دو سال گذشته، ساخت سیستم‌های چندعاملی قدرتمند به معنای نوشتن صدها خط کد تکراری و شکننده بود. چارچوب‌هایی مانند LangGraph، CrewAI و چارچوب تازه منتشرشده Agent Framework 1.0 مایکروسافت، توسعه‌دهندگان را ملزم می‌کردند تا نمودارهای جهت‌دار بدون دور (DAGs) را به دقت ترسیم کنند، پس‌زمینه داستانی عامل‌ها را به صورت دستی کدگذاری نمایند و جریان داده را به طور دستی مدیریت کنند.

همه این‌ها در ۲۲ ژوئن ۲۰۲۶ تغییر کرد. شرکت توکیویی Sakana AI که توسط لیون جونز (هم‌نویسنده مقاله برجسته ترانسفورمر "Attention Is All You Need") تأسیس شده است، به طور رسمی از Sakana Fugu و Fugu Ultra رونمایی کرد. این خانواده جدید از «مدل‌های هماهنگ‌ساز» که پارادایم جدیدی را معرفی می‌کنند، هماهنگی چندعاملی را از چارچوب‌های نرم‌افزاری خارجی و دست‌نویس مستقیماً به خودِ مدل پایه منتقل می‌نمایند.

مدل به عنوان رهبر ارکستر

مدل Fugu به جای اینکه صرفاً به عنوان یک تولیدکننده مستقل عمل کند، مانند یک «رهبر ارکستر» عصبی و آموزش‌دیده رفتار می‌کند. هنگامی که کاربر یک کار پیچیده را ارسال می‌کند، Fugu فقط یک پاسخ ساده خروجی نمی‌دهد؛ بلکه به طور پویا مسئله را ارزیابی کرده و مجموعه‌ای از مدل‌های متخصص، با عملکرد بالا و در دسترس عموم را هماهنگ می‌کند.

در بخش فنی، Fugu بر دو پیشرفت معماری بزرگ تکیه دارد که در ICLR 2026 منتشر شد: TRINITY (سیستمی که نقش‌های پویای «متفکر، مجری و تأییدکننده» را به عامل‌ها اختصاص می‌دهد) و یک حلقه هماهنگ‌سازی آموزش‌دیده. Fugu به طور مستقل تصمیم می‌گیرد که کدام مدل‌های متخصص را فراخوانی کند، چگونه کار را تجزیه کند و خروجی‌ها را چگونه تأیید نماید. شگفت‌انگیزتر اینکه Fugu می‌تواند به صورت بازگشتی نمونه‌هایی از خودش را برای بررسی کار خود فراخوانی کند و این حلقه را تا زمان رسیدن به یک اجماع با اطمینان بالا ادامه دهد.

نمودار جریان سه‌بعدی اطلاعاتی در مقایسه با روش سنتی...

عملکردی که مدل‌های غول‌پیکر یکپارچه را به چالش می‌کشد

مدل Fugu Ultra (نسخه بهینه‌شده برای عملکرد بالا در این سری) با تجمیع و بهینه‌سازی اکوسیستم مشترکی از مدل‌های پیشرو، به نتایجی دست می‌یابد که با غول‌های نرم‌افزاری یکپارچه و تک‌ارائه‌دهنده رقابت می‌کند.

از آنجا که Fugu بر اساس هماهنگ‌سازی مشارکتی ساخته شده است، قابلیت‌های شناختی سطح بالایی را بدون تکیه بر APIهای تک‌ارائه‌دهنده یا قرار گرفتن تحت کنترل‌های صادراتی محدودکننده ارائه می‌دهد. در داده‌های بنچمارک، Fugu Ultra نتایج شگفت‌انگیزی را در چندین بخش استدلال پیچیده نشان داد:

  • SWE-Bench Pro: مدل Fugu Ultra امتیاز ۷۳.۷٪ را (با اجرای تحت ساختار mini-swe-agent) کسب کرد و از Claude Opus 4.8 (۶۹.۲٪) و GPT-5.5 (۵۸.۶٪) پیشی گرفت.
  • Humanity's Last Exam: در این بنچمارک چندرشته‌ای در سطح متخصص، Fugu Ultra موفق به کسب نرخ موفقیت ۵۰.۰٪ شد که از Claude Opus 4.8 (۴۹.۸٪) پیشی گرفت و GPT-5.5 (۴۱.۴٪) را با فاصله زیاد پشت سر گذاشت.

چالش‌ها: تاخیر و مسیریابی «جعبه سیاه»

البته، انتقال هماهنگ‌سازی به سطح انتزاع مدل بدون هزینه نیست:

۱. تاخیر: در حالی که مدل استاندارد Fugu برای کارهای تعاملی با تاخیر کمتر (در حدود ۴ ثانیه) بهینه شده است، Fugu Ultra صرفاً برای کیفیت طراحی شده است. این مدل سرعت را فدای دقت می‌کند و انجام کارهای پیچیده استدلالی چندمرحله‌ای معمولاً بین ۸ تا ۱۶۰ ثانیه طول می‌کشد. ۲. هزینه پنهان هماهنگ‌سازی: از آنجا که Fugu هنگام هماهنگ کردن عامل‌های پس‌زمینه، «توکن‌های هماهنگ‌ساز» پنهانی تولید می‌کند، هزینه‌های توکن ممکن است به سرعت در پشت صحنه انباشته شوند؛ هرچند Sakana متعهد شده است که این معیارهای توکن را به صورت شفاف نمایش دهد. ۳. مشکل «جعبه سیاه»: توسعه‌دهندگان کنترل دقیق و خط به خطی را که چارچوب‌های گراف‌محور مانند LangGraph ارائه می‌دادند، از دست می‌دهند. در این حالت، شما با اطمینان، منطق مسیریابی را به یک شبکه عصبی واگذار می‌کنید.

در نهایت، Sakana Fugu ثابت می‌کند که آینده هوش مصنوعی تنها به آموزش مدل‌های یکپارچه بزرگتر محدود نمی‌شود. Fugu با نگاه به هماهنگ‌سازی چندعاملی به عنوان یک API یکپارچه و آموزش‌دیده در سطح مدل، مسیری سریع‌تر و منعطف‌تر را به سوی هوش مصنوعی سطح بالا هموار می‌کند.

برچسب‌ها

#Sakana AI#Fugu Ultra#عامل‌های هوش مصنوعی#هماهنگ‌سازی چندعاملی#مدل زبانی بزرگ

منابع و ارجاعات مستند

پیشنهاد مطالعه بعدی

خوشتان آمد؟ مقاله بعدی را بگیرید

در خبرنامه عضو شوید تا راهنمای بعدی در ایمیلتان باشد — بدون مزاحمت، لغو عضویت در هر زمان.