هنگامی که مراکز داده هوش مصنوعی از فضا خارج می شوند ، با یک معضل گران قیمت روبرو می شوند: امکانات بزرگتر بسازند یا راه هایی پیدا کنند تا چندین مکان با هم یکپارچه کار کنند. آخرین فناوری Ethernet NVIDIA وعده داده است که با اتصال مراکز داده هوش مصنوعی در مسافت های وسیع به آنچه که این شرکت “در مقیاس GIGA Super-Factories” می نامد ، این چالش را حل کند.
این نوآوری شبکه ای که پیش از Hot Chips 2025 اعلام شده است ، پاسخ شرکت به یک مشکل رو به رشد را نشان می دهد که صنعت هوش مصنوعی را وادار به تجدید نظر در نحوه توزیع قدرت محاسباتی می کند.
مشکل: وقتی یک ساختمان کافی نیست
هرچه مدل های هوش مصنوعی پیچیده تر و خواستار تر می شوند ، به قدرت محاسباتی عظیمی نیاز دارند که اغلب از آنچه که هر تسهیلات واحد می تواند فراهم کند ، فراتر می رود. مراکز داده سنتی هوش مصنوعی در ظرفیت قدرت ، فضای فیزیکی و قابلیت خنک کننده با محدودیت هایی روبرو هستند.
هنگامی که شرکت ها به قدرت پردازش بیشتری احتیاج دارند ، آنها به طور معمول باید امکانات کاملاً جدیدی بسازند – اما هماهنگی کار بین مکان های جداگانه به دلیل محدودیت های شبکه مشکل ساز بوده است. این مسئله در زیرساخت های استاندارد اترنت نهفته است ، که از زمان تأخیر بالا ، نوسانات عملکرد غیرقابل پیش بینی (به نام “لرزش”) رنج می برد و سرعت انتقال داده های متناقض هنگام اتصال مکان های دوردست.
این مشکلات برای توزیع کارآمد محاسبات پیچیده در چندین سایت برای سیستم های AI دشوار است.
راه حل Nvidia: فناوری مقیاس
Ethernet Spectrum-XGS آنچه را که NVIDIA از قابلیت “مقیاس” استفاده می کند ، معرفی می کند.
این فناوری در پلتفرم اترنت طیف-X موجود NVIDIA ادغام می شود و شامل چندین نوآوری کلیدی است:
- الگوریتم های سازگار با فاصله که به طور خودکار رفتار شبکه را بر اساس فاصله فیزیکی بین امکانات تنظیم می کند
- کنترل احتقان پیشرفته که از تنگناهای داده در هنگام انتقال از راه دور جلوگیری می کند
- مدیریت تأخیر دقیق برای اطمینان از زمان پاسخ قابل پیش بینی
- تله متری پایان به پایان برای نظارت و بهینه سازی شبکه در زمان واقعی
براساس اعلامیه NVIDIA ، این پیشرفت ها می تواند “تقریباً دو برابر عملکرد کتابخانه ارتباطات جمعی NVIDIA” ، که ارتباط بین واحدهای پردازش چند گرافیکی (GPU) و گره های محاسباتی را انجام می دهد.
اجرای دنیای واقعی
Coreweave ، یک شرکت زیرساخت ابری که متخصص در محاسبات شتاب GPU است ، قصد دارد جزو اولین پذیرندگان اترنت طیف-XGS باشد.
پیتر سالکی ، بنیانگذار Coreweave و مدیر ارشد فناوری گفت: “با NVIDIA Spectrum-XGS ، ما می توانیم مراکز داده خود را به یک ابر رایانه یکپارچه و یکپارچه متصل کنیم و به مشتریان خود دسترسی به هوش مصنوعی در مقیاس GIGA ارائه دهیم که پیشرفت های پیشرفت در هر صنعت را تسریع می کند.”
این استقرار به عنوان یک مورد آزمایش عملی برای اینکه آیا این فناوری می تواند وعده های خود را در شرایط دنیای واقعی ارائه دهد ، خدمت می کند.
زمینه صنعت و پیامدهای
این اعلامیه به دنبال مجموعه ای از نسخه های متمرکز بر شبکه از NVIDIA ، از جمله پلت فرم اصلی طیف-X و سوئیچ های فوتونیک Quantum-X است. این الگوی نشان می دهد که شرکت زیرساخت های شبکه را به عنوان یک تنگنا مهم در توسعه هوش مصنوعی تشخیص می دهد.
جنسن هوانگ ، بنیانگذار و مدیرعامل Nvidia ، در بیانیه مطبوعاتی گفت: “انقلاب صنعتی هوش مصنوعی در اینجا است ، و کارخانه های AI در مقیاس غول پیکر زیرساخت های اساسی هستند.” در حالی که توصیف هوانگ منعکس کننده دیدگاه بازاریابی Nvidia است ، چالش اساسی که او توصیف می کند – نیاز به ظرفیت محاسباتی بیشتر – در صنعت هوش مصنوعی اذعان شده است.
این فناوری به طور بالقوه می تواند بر نحوه برنامه ریزی و بهره برداری از مراکز داده هوش مصنوعی تأثیر بگذارد. شرکت ها به جای ایجاد امکانات منفرد گسترده که شبکه های برق محلی و بازارهای املاک و مستغلات را تحت فشار قرار می دهند ، ممکن است ضمن حفظ سطح عملکرد ، زیرساخت های خود را در چندین مکان کوچکتر توزیع کنند.
ملاحظات و محدودیت های فنی
با این حال ، چندین عامل می توانند بر اثربخشی عملی طیف-XGS اترنت تأثیر بگذارند. عملکرد شبکه در مسافت های طولانی منوط به محدودیت های فیزیکی ، از جمله سرعت نور و کیفیت زیرساخت های اساسی اینترنت بین مکان ها است. موفقیت این فناوری تا حد زیادی به چگونگی عملکرد آن در این محدودیت ها بستگی دارد.
علاوه بر این ، پیچیدگی مدیریت مراکز داده توزیع شده AI فراتر از شبکه گسترش می یابد تا شامل همگام سازی داده ها ، تحمل گسل و انطباق نظارتی در حوزه های قضایی مختلف باشد – چالش هایی که پیشرفت های شبکه به تنهایی نمی توانند حل کنند.
در دسترس بودن و تأثیر بازار
NVIDIA اظهار داشت که اترنت طیف-XGS “اکنون در دسترس است” به عنوان بخشی از پلت فرم طیف-X ، اگرچه قیمت گذاری و زمان بندی ویژه استقرار فاش نشده است. نرخ پذیرش این فناوری به احتمال زیاد به مقرون به صرفه بودن در مقایسه با رویکردهای جایگزین ، مانند ایجاد امکانات تک سایت بزرگتر یا استفاده از راه حل های شبکه موجود بستگی دارد.
نکته اصلی برای مصرف کنندگان و مشاغل این است: اگر فناوری NVIDIA همانطور که وعده داده شده عمل می کند ، می توانیم خدمات AI سریعتر ، برنامه های قدرتمندتر و هزینه های بالقوه کمتری را مشاهده کنیم زیرا شرکت ها از طریق محاسبات توزیع شده کارایی کسب می کنند. با این حال ، اگر این فناوری نتواند در شرایط دنیای واقعی ارائه شود ، شرکت های هوش مصنوعی همچنان با انتخاب گران بین ساخت تسهیلات مجرد و یا پذیرش سازش های عملکردی روبرو خواهند شد.
استقرار آینده CoreWeave به عنوان اولین آزمایش مهم در مورد اتصال مراکز داده هوش مصنوعی در مسافت ها می تواند واقعاً در مقیاس کار کند. نتایج به احتمال زیاد تعیین می کند که آیا شرکت های دیگر از رویکردهای سنتی پیروی می کنند یا از رویکردهای سنتی استفاده می کنند. در حال حاضر ، Nvidia یک دیدگاه بلندپروازانه ارائه داده است – اما صنعت هوش مصنوعی هنوز منتظر است تا ببیند آیا واقعیت با قول مطابقت دارد یا خیر.
همچنین ببینید: تراشه جدید Nvidia Blackwell برای چین از مدل H20 پیشی می گیرد
آیا می خواهید در مورد AI و داده های بزرگ از رهبران صنعت اطلاعات بیشتری کسب کنید؟ نمایشگاه AI & Big Data را که در آمستردام ، کالیفرنیا و لندن برگزار می شود ، بررسی کنید. این رویداد جامع با سایر رویدادهای پیشرو از جمله کنفرانس اتوماسیون هوشمند ، BlockX ، هفته تحول دیجیتال و Cyber Security & Cloud Expo همکاری می کند.
سایر رویدادهای آینده فناوری شرکت و وبینارهای موجود در TechForge را در اینجا کاوش کنید.