گوگل Gemma 2

گوگل Gemma 2، نسل بعدی مدل‌های باز خود را راه‌اندازی کرد

سرفصل‌های مقاله

Gemma 2 بهترین عملکرد را در کلاس خود ارائه می‌دهد، با سرعت باورنکردنی در سخت افزارهای مختلف اجرا می‌شود و به راحتی با سایر ابزارهای هوش مصنوعی ادغام می‌شود.

هوش مصنوعی این پتانسیل را دارد که به برخی از مبرم‌ترین مشکلات بشریت رسیدگی کند، اما تنها در صورتی که همه ابزارهای لازم برای ساختن با آن را داشته باشند. به همین دلیل است که در اوایل سال جاری گوگل Gemma را معرفی کرد، خانواده‌ای از مدل‌های باز سبک وزن و پیشرفته که از همان تحقیقات و فناوری استفاده شده برای ساخت مدل‌های Gemini ساخته شده‌اند.

گوگل به رشد خانواده Gemma با CodeGemma، RecurrentGemma و PaliGemma ادامه داده‌، که هر کدام قابلیت‌های منحصربه‌فردی را برای وظایف مختلف هوش مصنوعی ارائه می‌کنند و از طریق ادغام با شرکای مانند Hugging Face، NVIDIA و Ollama به راحتی قابل دسترسی هستند.

cta-gif-album-m
cta-gif-album

اکنون گوگل به طور رسمی Gemma 2 را برای محققان و توسعه دهندگان در سراسر جهان منتشر کرده است. Gemma 2 که در هر دو اندازه پارامتر 9 میلیارد (9B) و 27 میلیارد (27B) موجود است، عملکرد بالاتری دارد و در استنتاج از نسل اول کارآمدتر است، با پیشرفت‌های ایمنی قابل توجهی که در آن ساخته شده است. در واقع، در 27B، جایگزین‌های رقابتی را ارائه می‌کند.

به مدل‌هایی بیش از دو برابر اندازه آن، عملکردی را ارائه می‌دهد که فقط با مدل‌های اختصاصی در ماه دسامبر امکان‌پذیر بود. و این اکنون روی یک هاست NVIDIA H100 Tensor Core GPU یا TPU قابل دستیابی است و هزینه‌های استقرار را به میزان قابل توجهی کاهش می‌دهد.

Gemma 2 یک استاندارد مدل باز جدید برای کارایی و عملکرد

Gemma 2

ما Gemma 2 را بر اساس یک معماری بازطراحی شده ساختیم که برای عملکرد استثنایی و کارایی استنتاج مهندسی شده است. در اینجا چیزی است که آن را متمایز می‌کند:

  • عملکرد بزرگتر: در 27B، Gemma 2 بهترین عملکرد را برای کلاس اندازه خود ارائه می‌دهد و حتی جایگزین‌های رقابتی برای مدل‌های بیش از دو برابر اندازه خود ارائه می‌دهد. مدل 9B Gemma 2 همچنین عملکرد پیشرو در کلاس خود را ارائه می‌دهد و از Llama 3 8B و سایر مدل‌های باز در رده اندازه خود بهتر عمل می‌کند. برای جزئیات عملکرد، گزارش فنی را بررسی کنید.
  • بهره‌وری بی‌نظیر و صرفه‌جویی در هزینه: مدل 27B Gemma 2 به گونه ای طراحی شده است که استنتاج را با دقت کامل بر روی یک هاست Google Cloud TPU، NVIDIA A100 80GB Tensor Core GPU یا NVIDIA H100 Tensor Core GPU به طور قابل توجهی کاهش دهد و در عین حال عملکرد بالا را کاهش دهد. این امکان استقرار هوش مصنوعی در دسترس و مقرون به صرفه تر را فراهم می‌کند.
  • استنتاج سریع در سخت‌افزار: Gemma 2 برای اجرا با سرعت باورنکردنی در طیف وسیعی از سخت افزارها، از لپ‌تاپ‌های بازی قدرتمند و دسکتاپ‌های سطح بالا، تا تنظیمات مبتنی بر ابر، بهینه شده است. Gemma 2 را با دقت کامل در استودیوی هوش مصنوعی گوگل امتحان کنید، عملکرد محلی را با نسخه کوانتیزه شده با Gemma.cpp در CPU خود باز کنید، یا آن را روی رایانه خانگی خود با NVIDIA RTX یا GeForce RTX از طریق Hugging Face Transformers امتحان کنید.

برای توسعه‌دهندگان و محققان ساخته شده است

Gemma 2 نه تنها قدرتمندتر است، بلکه به گونه‌ای طراحی شده است که به راحتی در جریان کار شما ادغام شود:

باز و در دسترس: درست مانند مدل‌های اصلی Gemma 2 تحت مجوز تجاری Gemma گوگل در دسترس است و به توسعه دهندگان و محققان این امکان را می‌دهد تا نوآوری‌های خود را به اشتراک بگذارند و تجاری سازی کنند.

سازگاری با فریمورک گسترده: به دلیل سازگاری با فریمورک‌های اصلی هوش مصنوعی مانند Hugging Face Transformers و JAX، PyTorch و TensorFlow از طریق Keras 3.0، vLLM، Gemma.cpp، Llama.cpp و Ollama، به راحتی از Gemma 2 با ابزارها و گردش‌های کاری دلخواه خود استفاده کنید.

علاوه بر این، Gemma با NVIDIA TensorRT-LLM بهینه‌سازی شده است تا روی زیرساخت‌های شتاب‌دهنده NVIDIA یا به‌عنوان یک میکروسرویس استنتاج NVIDIA NIM با بهینه‌سازی برای NeMo NVIDIA در آینده اجرا شود. می‌توانید امروز را با Keras و Hugging Face تنظیم کنید. ما فعالانه در حال کار برای فعال کردن گزینه‌های تنظیم دقیق پارامترهای بیشتر هستیم.

استقرار بدون دردسر: از ماه آینده، مشتریان Google Cloud می‌توانند به راحتی Gemma 2 را بر روی Vertex AI پیاده‌سازی و مدیریت کنند.

پروژه‌های ساخته شده با Gemma

اولین راه‌اندازی Gemma گوگل منجر به بیش از 10 میلیون بارگیری و پروژه‌های الهام بخش بی‌شماری شد. به عنوان مثال، ناواراسا از Gemma برای ایجاد مدلی استفاده کرد که ریشه در تنوع زبانی هند دارد.

اکنون Gemma 2 به توسعه‌دهندگان کمک می‌کند تا پروژه‌های جاه‌طلبانه‌تری را آغاز کنند و سطوح جدیدی از عملکرد و پتانسیل را در خلاقیت‌های هوش مصنوعی خود باز کنند. گوگل به کشف معماری‌های جدید و توسعه انواع تخصصی Gemma برای مقابله با طیف وسیع‌تری از وظایف و چالش‌های هوش مصنوعی ادامه خواهد داد. این شامل یک مدل با پارامتر 2.6B آینده است که برای پر کردن بیشتر شکاف بین دسترسی سبک وزن و عملکرد قدرتمند طراحی شده است. در گزارش فنی می‌توانید درباره این نسخه آینده اطلاعات بیشتری کسب کنید.

تازه در حال شروع شدن است

Gemma 2 اکنون در استدیو هوش مصنوعی گوگل در دسترس است، بنابراین می‌توانید قابلیت‌های عملکرد کامل آن را در 27B بدون نیاز به سخت‌افزار آزمایش کنید. همچنین می‌توانید وزنه‌های مدل را از Kaggle و Hugging Face Models با Vertex AI Model Garden دانلود کنید.

برای فعال کردن دسترسی برای تحقیق و توسعه، Gemma 2 همچنین به صورت رایگان از طریق Kaggle یا از طریق یک ردیف رایگان برای نوت‌بوک‌های Colab در دسترس است. برای اولین بار مشتریان Google Cloud ممکن است واجد شرایط 300 دلار اعتبار باشند. محققان دانشگاهی می‌توانند برای برنامه تحقیقاتی آکادمیک Gemma 2 برای دریافت اعتبار Google Cloud برای تسریع تحقیقات خود درخواست دهند. درخواست‌ها اکنون تا 9 آگوست باز هستند.

منبع : گوگل

نوید رضایی
نوید رضایی