Gemma 2 بهترین عملکرد را در کلاس خود ارائه میدهد، با سرعت باورنکردنی در سخت افزارهای مختلف اجرا میشود و به راحتی با سایر ابزارهای هوش مصنوعی ادغام میشود.
هوش مصنوعی این پتانسیل را دارد که به برخی از مبرمترین مشکلات بشریت رسیدگی کند، اما تنها در صورتی که همه ابزارهای لازم برای ساختن با آن را داشته باشند. به همین دلیل است که در اوایل سال جاری گوگل Gemma را معرفی کرد، خانوادهای از مدلهای باز سبک وزن و پیشرفته که از همان تحقیقات و فناوری استفاده شده برای ساخت مدلهای Gemini ساخته شدهاند.
گوگل به رشد خانواده Gemma با CodeGemma، RecurrentGemma و PaliGemma ادامه داده، که هر کدام قابلیتهای منحصربهفردی را برای وظایف مختلف هوش مصنوعی ارائه میکنند و از طریق ادغام با شرکای مانند Hugging Face، NVIDIA و Ollama به راحتی قابل دسترسی هستند.
اکنون گوگل به طور رسمی Gemma 2 را برای محققان و توسعه دهندگان در سراسر جهان منتشر کرده است. Gemma 2 که در هر دو اندازه پارامتر 9 میلیارد (9B) و 27 میلیارد (27B) موجود است، عملکرد بالاتری دارد و در استنتاج از نسل اول کارآمدتر است، با پیشرفتهای ایمنی قابل توجهی که در آن ساخته شده است. در واقع، در 27B، جایگزینهای رقابتی را ارائه میکند.
به مدلهایی بیش از دو برابر اندازه آن، عملکردی را ارائه میدهد که فقط با مدلهای اختصاصی در ماه دسامبر امکانپذیر بود. و این اکنون روی یک هاست NVIDIA H100 Tensor Core GPU یا TPU قابل دستیابی است و هزینههای استقرار را به میزان قابل توجهی کاهش میدهد.
Gemma 2 یک استاندارد مدل باز جدید برای کارایی و عملکرد
ما Gemma 2 را بر اساس یک معماری بازطراحی شده ساختیم که برای عملکرد استثنایی و کارایی استنتاج مهندسی شده است. در اینجا چیزی است که آن را متمایز میکند:
- عملکرد بزرگتر: در 27B، Gemma 2 بهترین عملکرد را برای کلاس اندازه خود ارائه میدهد و حتی جایگزینهای رقابتی برای مدلهای بیش از دو برابر اندازه خود ارائه میدهد. مدل 9B Gemma 2 همچنین عملکرد پیشرو در کلاس خود را ارائه میدهد و از Llama 3 8B و سایر مدلهای باز در رده اندازه خود بهتر عمل میکند. برای جزئیات عملکرد، گزارش فنی را بررسی کنید.
- بهرهوری بینظیر و صرفهجویی در هزینه: مدل 27B Gemma 2 به گونه ای طراحی شده است که استنتاج را با دقت کامل بر روی یک هاست Google Cloud TPU، NVIDIA A100 80GB Tensor Core GPU یا NVIDIA H100 Tensor Core GPU به طور قابل توجهی کاهش دهد و در عین حال عملکرد بالا را کاهش دهد. این امکان استقرار هوش مصنوعی در دسترس و مقرون به صرفه تر را فراهم میکند.
- استنتاج سریع در سختافزار: Gemma 2 برای اجرا با سرعت باورنکردنی در طیف وسیعی از سخت افزارها، از لپتاپهای بازی قدرتمند و دسکتاپهای سطح بالا، تا تنظیمات مبتنی بر ابر، بهینه شده است. Gemma 2 را با دقت کامل در استودیوی هوش مصنوعی گوگل امتحان کنید، عملکرد محلی را با نسخه کوانتیزه شده با Gemma.cpp در CPU خود باز کنید، یا آن را روی رایانه خانگی خود با NVIDIA RTX یا GeForce RTX از طریق Hugging Face Transformers امتحان کنید.
برای توسعهدهندگان و محققان ساخته شده است
Gemma 2 نه تنها قدرتمندتر است، بلکه به گونهای طراحی شده است که به راحتی در جریان کار شما ادغام شود:
باز و در دسترس: درست مانند مدلهای اصلی Gemma 2 تحت مجوز تجاری Gemma گوگل در دسترس است و به توسعه دهندگان و محققان این امکان را میدهد تا نوآوریهای خود را به اشتراک بگذارند و تجاری سازی کنند.
سازگاری با فریمورک گسترده: به دلیل سازگاری با فریمورکهای اصلی هوش مصنوعی مانند Hugging Face Transformers و JAX، PyTorch و TensorFlow از طریق Keras 3.0، vLLM، Gemma.cpp، Llama.cpp و Ollama، به راحتی از Gemma 2 با ابزارها و گردشهای کاری دلخواه خود استفاده کنید.
علاوه بر این، Gemma با NVIDIA TensorRT-LLM بهینهسازی شده است تا روی زیرساختهای شتابدهنده NVIDIA یا بهعنوان یک میکروسرویس استنتاج NVIDIA NIM با بهینهسازی برای NeMo NVIDIA در آینده اجرا شود. میتوانید امروز را با Keras و Hugging Face تنظیم کنید. ما فعالانه در حال کار برای فعال کردن گزینههای تنظیم دقیق پارامترهای بیشتر هستیم.
استقرار بدون دردسر: از ماه آینده، مشتریان Google Cloud میتوانند به راحتی Gemma 2 را بر روی Vertex AI پیادهسازی و مدیریت کنند.
پروژههای ساخته شده با Gemma
اولین راهاندازی Gemma گوگل منجر به بیش از 10 میلیون بارگیری و پروژههای الهام بخش بیشماری شد. به عنوان مثال، ناواراسا از Gemma برای ایجاد مدلی استفاده کرد که ریشه در تنوع زبانی هند دارد.
اکنون Gemma 2 به توسعهدهندگان کمک میکند تا پروژههای جاهطلبانهتری را آغاز کنند و سطوح جدیدی از عملکرد و پتانسیل را در خلاقیتهای هوش مصنوعی خود باز کنند. گوگل به کشف معماریهای جدید و توسعه انواع تخصصی Gemma برای مقابله با طیف وسیعتری از وظایف و چالشهای هوش مصنوعی ادامه خواهد داد. این شامل یک مدل با پارامتر 2.6B آینده است که برای پر کردن بیشتر شکاف بین دسترسی سبک وزن و عملکرد قدرتمند طراحی شده است. در گزارش فنی میتوانید درباره این نسخه آینده اطلاعات بیشتری کسب کنید.
تازه در حال شروع شدن است
Gemma 2 اکنون در استدیو هوش مصنوعی گوگل در دسترس است، بنابراین میتوانید قابلیتهای عملکرد کامل آن را در 27B بدون نیاز به سختافزار آزمایش کنید. همچنین میتوانید وزنههای مدل را از Kaggle و Hugging Face Models با Vertex AI Model Garden دانلود کنید.
برای فعال کردن دسترسی برای تحقیق و توسعه، Gemma 2 همچنین به صورت رایگان از طریق Kaggle یا از طریق یک ردیف رایگان برای نوتبوکهای Colab در دسترس است. برای اولین بار مشتریان Google Cloud ممکن است واجد شرایط 300 دلار اعتبار باشند. محققان دانشگاهی میتوانند برای برنامه تحقیقاتی آکادمیک Gemma 2 برای دریافت اعتبار Google Cloud برای تسریع تحقیقات خود درخواست دهند. درخواستها اکنون تا 9 آگوست باز هستند.
منبع : گوگل