با افزایش سریع برنامه های کاربردی هوش مصنوعی، به رهبری مدل هایی مانند ChatGPT، تقاضا برای قدرت محاسباتی به شدت افزایش یافته است. برای پاسخگویی به نیازهای محاسباتی روزافزون عصر هوش مصنوعی، گروه H3C، تحت چتر Tsinghua Unigroup، اخیراً از 11 محصول جدید در سری H3C UniServer G6 و HPE Gen11 در اجلاس NAVIGATE Leader Summit 2023 رونمایی کرد. این محصولات سرور جدید یک ماتریس جامع برای هوش مصنوعی در سناریوهای مختلف ایجاد میکنند و یک پلتفرم زیربنایی قدرتمند برای مدیریت دادههای عظیم و الگوریتمهای مدل ارائه میکنند و از عرضه کافی منابع محاسباتی هوش مصنوعی اطمینان میدهند.
ماتریس محصولات متنوع برای رفع نیازهای محاسباتی هوش مصنوعی
گروه H3C به عنوان یک رهبر در محاسبات هوشمند، سالها است که عمیقاً در زمینه هوش مصنوعی مشغول است. در سال 2022، H3C به بالاترین نرخ رشد در بازار محاسبات تسریع شده چین دست یافت و در مجموع 132 رتبه اول جهان را در معیار مشهور بین المللی هوش مصنوعی MLPerf به دست آورد که مهارت و توانایی های فنی قوی خود را نشان می دهد.
H3C با بهرهگیری از معماری پیشرفته محاسباتی و قابلیتهای مدیریت توان محاسباتی هوشمند که بر اساس محاسبات هوشمند ساخته شدهاند، پرچمدار محاسبات هوشمند H3C UniServer R5500 G6 را توسعه داده است که بهطور خاص برای آموزش مدلهای در مقیاس بزرگ طراحی شده است. آنها همچنین H3C UniServer R5300 G6 را معرفی کرده اند، یک موتور محاسباتی هیبریدی مناسب برای سناریوهای استنتاج/آموزش در مقیاس بزرگ. این محصولات بیشتر نیازهای محاسباتی متنوع را در سناریوهای مختلف هوش مصنوعی برآورده می کنند و پوشش محاسباتی هوش مصنوعی جامعی را ارائه می دهند.
پرچمدار محاسبات هوشمند طراحی شده برای آموزش مدل در مقیاس بزرگ
H3C UniServer R5500 G6 ترکیبی از قدرت، مصرف انرژی کم و هوشمندی است. در مقایسه با نسل قبلی، سه برابر قدرت محاسباتی را ارائه می دهد و زمان آموزش را 70 درصد برای سناریوهای آموزشی مدل بزرگ GPT-4 کاهش می دهد. برای سناریوهای مختلف کسب و کار هوش مصنوعی، مانند آموزش در مقیاس بزرگ، تشخیص گفتار، طبقه بندی تصویر و ترجمه ماشینی قابل استفاده است.
قدرت: R5500 G6 تا 96 هسته CPU را پشتیبانی می کند و عملکرد هسته را 150 درصد افزایش می دهد. به ماژول جدید NVIDIA HGX H800 8-GPU مجهز شده است که 32 PFLOPS قدرت محاسباتی را ارائه می دهد که منجر به بهبود 9 برابری در سرعت آموزش هوش مصنوعی مدل در مقیاس بزرگ و بهبود 30 برابری در عملکرد استنتاج هوش مصنوعی مدل در مقیاس بزرگ می شود. علاوه بر این، با پشتیبانی از شبکههای PCIe 5.0 و 400G، کاربران میتوانند خوشههای محاسباتی هوش مصنوعی با عملکرد بالاتر را مستقر کنند و پذیرش و کاربرد هوش مصنوعی را در شرکتها تسریع کنند.
هوشمندی: R5500 G6 از دو پیکربندی توپولوژی پشتیبانی میکند، که بهطور هوشمندانه با سناریوهای مختلف برنامههای هوش مصنوعی تطبیق میکند و برنامههای یادگیری عمیق و محاسبات علمی را تسریع میبخشد، و استفاده از منابع GPU را تا حد زیادی بهبود میبخشد. به لطف ویژگی GPU چند نمونه ای ماژول H800، یک H800 منفرد را می توان به 7 نمونه GPU با امکان تا 56 نمونه GPU تقسیم کرد که هر کدام دارای محاسبات و منابع حافظه مستقل هستند. این به طور قابل توجهی انعطاف پذیری منابع هوش مصنوعی را افزایش می دهد.
ردپای کم کربن: R5500 G6 به طور کامل از خنک کننده مایع، از جمله خنک کننده مایع برای CPU و GPU پشتیبانی می کند. با PUE (کارآیی مصرف انرژی) کمتر از 1.1، "محاسبات خنک" را در گرمای موج محاسباتی امکان پذیر می کند.
شایان ذکر است که R5500 G6 پس از عرضه به عنوان یکی از 10 سرور برتر با کارایی بالا در سال 2023 در "رتبه بندی قدرت 2023 برای عملکرد محاسباتی" شناخته شد.
موتور محاسباتی ترکیبی برای تطبیق انعطافپذیر آموزش و نیازهای استنتاج
H3C UniServer R5300 G6، به عنوان نسل بعدی سرور هوش مصنوعی، پیشرفت های قابل توجهی در مشخصات CPU و GPU نسبت به نسل قبلی خود ارائه می دهد. عملکرد فوقالعاده، توپولوژی هوشمند و قابلیتهای محاسباتی و ذخیرهسازی یکپارچه را به رخ میکشد که آن را برای آموزش مدلهای یادگیری عمیق، استنتاج یادگیری عمیق و دیگر سناریوهای کاربردی هوش مصنوعی مناسب میسازد و به طور انعطافپذیری با نیازهای آموزش و محاسبات استنتاج مطابقت دارد.
عملکرد فوقالعاده: R5300 G6 با آخرین نسل از پردازندههای گرافیکی درجه سازمانی NVIDIA سازگار است و عملکردی 4.85 برابری نسبت به نسل قبلی ارائه میکند. از انواع مختلفی از کارتهای شتاب هوش مصنوعی مانند GPU، DPU و NPU پشتیبانی میکند تا نیازهای ناهمگن قدرت محاسباتی هوش مصنوعی را در سناریوهای مختلف برآورده کند و عصر هوشمندی را تقویت کند.
توپولوژی هوشمند: R5300 G6 پنج تنظیمات توپولوژی GPU شامل HPC، هوش مصنوعی موازی، هوش مصنوعی سریال، دسترسی مستقیم 4 کارتی و دسترسی مستقیم 8 کارتی را ارائه می دهد. این انعطافپذیری بیسابقه سازگاری با سناریوهای مختلف برنامههای کاربردی کاربر را تا حد زیادی افزایش میدهد، منابع را به صورت هوشمند تخصیص میدهد، و عملیات توان محاسباتی کارآمد را هدایت میکند.
محاسبات و ذخیره سازی یکپارچه: R5300 G6 به طور انعطاف پذیری کارت های شتاب هوش مصنوعی و NIC های هوشمند را در خود جای می دهد و قابلیت های آموزش و استنتاج را با هم ترکیب می کند. تا 10 پردازنده گرافیکی دو عرض و 24 اسلات هارد دیسک LFF (فاکتور فرم بزرگ) را پشتیبانی می کند که امکان آموزش و استنتاج همزمان روی یک سرور را فراهم می کند و یک موتور محاسباتی مقرون به صرفه برای محیط های توسعه و آزمایش ارائه می دهد. با ظرفیت ذخیره سازی تا 400 ترابایت، به طور کامل نیازهای فضای ذخیره سازی داده های هوش مصنوعی را برآورده می کند.
با افزایش رونق هوش مصنوعی، قدرت محاسباتی دائما در حال تغییر شکل و چالش است. انتشار نسل بعدی سرورهای هوش مصنوعی نقطه عطفی دیگر در تعهد گروه H3C به فناوری «هوش ذاتی» و حرکت مداوم آن برای تکامل محاسبات هوشمند است.
با نگاه به آینده، با هدایت استراتژی "هوش بومی ابری"، گروه H3C به مفهوم "عمل گرایی دقیق، اعطای هوش به عصر" پایبند است. آنها به کشت خاک حاصلخیز محاسبات هوشمند، کاوش در سناریوهای کاربردی هوش مصنوعی در سطح عمیق، و سرعت بخشیدن به رسیدن دنیای هوشمند با قدرت محاسباتی آماده و سازگار برای آینده ادامه خواهند داد.
زمان ارسال: ژوئیه-04-2023