رویداد DevDay

رونمایی از آخرین به‌روز‌رسانی‌های OpenAI در رویداد DevDay

فهرست مطالب

برخلاف رویداد پرشور سال گذشته، OpenAI در روز ۱۰ مهر کنفرانس DevDay را برگزار کرد و برای ارائه بهتر به‌روزرسانی‌ها و بهبود‌های مجموعه ابزارهای هوش مصنوعی و APIهای موجود خود، از عرضه محصولات جدید خودداری کرد.

تمرکز این شرکت در سال جاری بر روی توانمندسازی توسعه‌دهندگان و نمایش داستان‌های جامعه بود که نشان‌دهنده تغییر در استراتژی با رقابتی شدن چشم‌انداز هوش مصنوعی است.

این شرکت در این رویداد از چهار نوآوری اصلی رونمایی کرد: Vision Fine-Tuning، Realtime API، Model Distillation و Prompt Caching. این ابزارهای جدید، محور استراتژیک OpenAI را در جهت توانمندسازی اکوسیستم توسعه‌دهنده‌اش به جای رقابت مستقیم در فضای اپلیکیشن برجسته می‌کنند.

۴ به‌روز‌رسانی‌های OpenAI در DevDay

۴ به‌روز‌رسانی‌های OpenAI در DevDay

Prompt Caching: یک موهبت برای بودجه توسعه‌دهندگان

یکی از مهم‌ترین اعلامیه‌ها، معرفی Prompt Caching است، ویژگی با هدف کاهش هزینه‌ها و تاخیر کم برای توسعه دهندگان.

این سیستم به طور خودکار 50٪ تخفیف بر روی توکن‌های ورودی که مدل اخیراً پردازش کرده است اعمال می‌کند، که به طور بالقوه منجر به صرفه جویی قابل توجهی برای برنامه‌هایی می‌شود که اغلب از زمینه آن مجدد استفاده می‌کنند.

اولیویه گودمن، رئیس محصول OpenAI برای پلتفرم، در یک کنفرانس مطبوعاتی کوچک در مقر این شرکت در سانفرانسیسکو که کنفرانس توسعه دهندگان را آغاز کرد، گفت: «ما بسیار مشغول بودیم. تنها دو سال پیش، GPT-3 برنده شد. اکنون، ما [آن] هزینه‌ها را تقریباً 1000 برابر کاهش داده‌ایم. من سعی می‌کردم نمونه‌ای از فناوری‌هایی بیاورم که هزینه‌های خود را تقریباً 1000 برابر در مدت دو سال کاهش دادند – و نمی‌توانم مثالی بیاورم.

این کاهش چشمگیر هزینه فرصت بزرگی را برای استارت‌آپ‌ها و شرکت‌ها فراهم می‌کند تا برنامه‌های جدیدی را که قبلاً به دلیل هزینه دور از دسترس بودند، کشف کنند.

Screenshot 2024 10 01 at 9.48.21 AM

جدول قیمت‌گذاری از OpenAI’s DevDay 2024 کاهش هزینه‌های عمده برای استفاده از مدل هوش مصنوعی با توکن‌های ورودی ذخیره‌شده تا 50 درصد صرفه‌جویی در مقایسه با توکن‌های کش نشده در مدل‌های مختلف GPT، را نشان می‌دهد. مدل جدید o1 قیمتی عالی را به نمایش می‌گذارد که نشان دهنده قابلیت‌های پیشرفته آن است.

Vision Fine-Tuning: مرز جدیدی در هوش مصنوعی بصری

یکی دیگر از اعلامیه‌های مهم، معرفی تنظیمات دقیق بینایی برای GPT-4o، آخرین مدل زبان بزرگ OpenAI است. این ویژگی به توسعه دهندگان اجازه می‌دهد تا قابلیت‌های درک بصری مدل را با استفاده از تصاویر و متن سفارشی کنند.

پیامدهای این به‌روزرسانی دامنه‌ای گسترده و تأثیرگذار بر زمینه‌هایی مانند وسایل نقلیه خودران، تصویربرداری پزشکی و عملکرد جستجوی بصری است. به گفته Grab،یک شرکت پیشرو در حمل و نقل غذا در جنوب شرقی آسیا، ،OpenAI قبلاً از این فناوری برای بهبود خدمات نقشه‌برداری خود استفاده کرده است.

طبق گزارش‌ها، Grab با استفاده از تنها 100 مثال، 20 درصد در دقت شمارش خطوط و 13 درصد افزایش در بومی‌سازی علائم محدودیت سرعت به دست آورد. این نرم افزار امکان تنظیم دقیق بینایی را برای بهبود چشمگیر خدمات مبتنی بر هوش مصنوعی در طیف گسترده‌ای از صنایع با استفاده از دسته‌های کوچک داده‌های آموزشی بصری نشان می‌دهد.

Realtime API: پر کردن شکاف در هوش مصنوعی مکالمه‌ای

هوش مصنوعی مکالمه‌ای

OpenAI همچنین از API Realtime خود که اکنون در نسخه بتا عمومی است، در DevDay رونمایی کرد. این پیشنهاد جدید توسعه دهندگان را قادر می‌سازد تا تجربیات چندوجهی با تاخیر کم، به ویژه در برنامه‌های گفتار به گفتار ایجاد کنند. این بدان معنی است که توسعه دهندگان می‌توانند شروع به اضافه کردن کنترل‌های صوتی ChatGPT به برنامه‌ها کنند.

برای نشان دادن پتانسیل API، OpenAI یک نسخه به‌روز شده از Wanderlust، یک برنامه برنامه‌ریزی سفر که در کنفرانس سال گذشته به نمایش گذاشته شد را به نمایش گذاشت. با استفاده از Realtime API، کاربران می‌توانند مستقیماً با برنامه صحبت کنند و در یک مکالمه طبیعی برای برنامه‌ریزی سفرهای خود شرکت کنند. این سیستم حتی برای تقلید گفت و گوی انسانی اجازه وقفه در وسط جمله را می‌دهد.

در حالی که برنامه‌ریزی سفر تنها یک مثال است، Realtime API طیف گسترده‌ای از امکانات را برای برنامه‌های کاربردی صدادار در صنایع مختلف باز می‌کند. از خدمات مشتری گرفته تا آموزش و ابزارهای دسترسی، توسعه‌دهندگان اکنون یک منبع جدید قدرتمند برای ایجاد تجربیات شهودی و پاسخ‌گوی مبتنی بر هوش مصنوعی دارند.

گودمنت توضیح داد: «زمانی که محصولاتی را طراحی می‌کنیم، اساساً شبیه استارت‌آپ‌ها و شرکت‌ها هستیم. و بنابراین در حالت آلفا، ما تعداد زیادی شرکت داریم که از APIها، مدل‌های جدید محصولات جدید نیز استفاده می‌کنند.» Realtime API اساساً روند ساخت دستیارهای صوتی و سایر ابزارهای هوش مصنوعی مکالمه‌ای را ساده می‌کند و نیاز به وصل کردن چندین مدل برای رونویسی، استنتاج و تبدیل متن به گفتار را از بین می‌برد.

پذیرندگان اولیه مانند Healthify، یک برنامه مربیگری تغذیه و تناسب اندام، و Speak، یک پلتفرم یادگیری زبان، از قبل Realtime API را در محصولات خود ادغام کرده‌اند. این پیاده‌سازی‌ها پتانسیل API را برای ایجاد تجربیات کاربری طبیعی‌تر و جذاب‌تر در زمینه‌های مختلف از مراقبت‌های بهداشتی تا آموزش نشان می‌دهد.

ساختار قیمت‌گذاری Realtime API، اگرچه با 0.06 دلار در دقیقه ورودی صدا و 0.24 دلار در دقیقه خروجی صدا ارزان نیست، اما همچنان می‌تواند ارزش پیشنهادی قابل توجهی برای توسعه‌دهندگانی باشد که به دنبال ایجاد برنامه‌های مبتنی بر صدا هستند.

Model Distillation: گامی به سوی هوش مصنوعی در دسترس‌تر

شاید متحول کننده‌ترین خبر، معرفی Model Distillation بود. این گردش کار یکپارچه به توسعه دهندگان اجازه می‌دهد تا از خروجی‌های مدل‌های پیشرفته مانند o1-preview و GPT-4o برای بهبود عملکرد مدل‌های کارآمدتر مانند GPT-4o mini استفاده کنند.

این رویکرد می‌تواند شرکت‌های کوچک‌تر را قادر سازد تا از قابلیت‌های مشابه مدل‌های پیشرفته بدون متحمل شدن هزینه‌های محاسباتی مشابه استفاده کنند. این به شکاف طولانی مدت در صنعت هوش مصنوعی بین سیستم‌های پیشرفته و پرمصرف و همتایان در دسترس‌‌تر اما کمتر توانمند آنها می‌پردازد.

یک استارت آپ کوچک فناوری پزشکی را در نظر بگیرید که یک ابزار تشخیصی مبتنی بر هوش مصنوعی را برای کلینیک‌های روستایی توسعه می‌دهد. با استفاده از Model Distillation، این شرکت می‌تواند یک مدل جمع‌وجور را آموزش دهد که بسیاری از قدرت‌های تشخیصی مدل‌های بزرگ‌تر را در حین کار بر روی لپ‌تاپ یا تبلت استاندارد به تصویر می‌کشد.

این می‌تواند قابلیت‌های پیشرفته هوش مصنوعی را به محیط‌های محدود به منابع بیاورد و به طور بالقوه نتایج مراقبت‌های بهداشتی را در مناطق محروم بهبود بخشد.

تغییر استراتژی OpenAI: ایجاد یک اکوسیستم هوش مصنوعی پایدار

مراسم DevDay 2024 محوری استراتژیک برای این شرکت بود و توسعه اکوسیستم را بر عرضه محصولات پرمخاطب اولویت می‌دهد. این رویکرد، اگرچه برای عموم مردم کمتر هیجان‌انگیز است، اما درک کاملی از چالش‌ها و فرصت‌های فعلی صنعت هوش مصنوعی را نشان می‌دهد.

رویداد آرام امسال به شدت با DevDay 2023 تضاد دارد، که با راه‌اندازی فروشگاه GPT و ابزارهای ایجاد GPT سفارشی، هیجانی شبیه معرفی آیفون ایجاد کرد.

با این حال، چشم انداز هوش مصنوعی از آن زمان به سرعت تکامل یافته است. رقبا پیشرفت‌های چشمگیری داشته‌اند و نگرانی‌ها در مورد در دسترس بودن داده‌ها برای آموزش تشدید شده است. به نظر می‌رسد تمرکز OpenAI بر اصلاح ابزارهای موجود و توانمندسازی توسعه دهندگان پاسخی حساب شده به این تغییرات باشد. با بهبود کارایی و مقرون به صرفه بودن مدل‌های خود، OpenAI قصد دارد مزیت رقابتی خود را حفظ کند و در عین حال نگرانی‌های مربوط به منابع و اثرات زیست‌محیطی را برطرف کند.

همانطور که OpenAI از یک مختل کننده به یک ارائه دهنده پلتفرم تبدیل می‌شود، موفقیت آن تا حد زیادی به توانایی آن در پرورش یک اکوسیستم توسعه دهنده پر رونق بستگی دارد.

این شرکت در رویداد DevDay با ارائه ابزارهای بهبود یافته، کاهش هزینه‌ها و افزایش پشتیبانی، زمینه را برای رشد و ثبات بلندمدت در بخش هوش مصنوعی فراهم می‌کند. در حالی که تاثیر فوری ممکن است کمتر قابل مشاهده باشد، این استراتژی در نهایت می‌تواند منجر به پذیرش پایدار و گسترده‌تر هوش مصنوعی در بسیاری از صنایع شود.

منبع : venturebeat

شبیه به همین مقاله

نظرت رو برامون بنویس

زیگپ: دستیار صوتی هوشمند

دستیار صوتی هوشمند

بازار

دانلود زیگپ