برخلاف رویداد پرشور سال گذشته، OpenAI در روز ۱۰ مهر کنفرانس DevDay را برگزار کرد و برای ارائه بهتر بهروزرسانیها و بهبودهای مجموعه ابزارهای هوش مصنوعی و APIهای موجود خود، از عرضه محصولات جدید خودداری کرد.
تمرکز این شرکت در سال جاری بر روی توانمندسازی توسعهدهندگان و نمایش داستانهای جامعه بود که نشاندهنده تغییر در استراتژی با رقابتی شدن چشمانداز هوش مصنوعی است.
این شرکت در این رویداد از چهار نوآوری اصلی رونمایی کرد: Vision Fine-Tuning، Realtime API، Model Distillation و Prompt Caching. این ابزارهای جدید، محور استراتژیک OpenAI را در جهت توانمندسازی اکوسیستم توسعهدهندهاش به جای رقابت مستقیم در فضای اپلیکیشن برجسته میکنند.
۴ بهروزرسانیهای OpenAI در DevDay
Prompt Caching: یک موهبت برای بودجه توسعهدهندگان
یکی از مهمترین اعلامیهها، معرفی Prompt Caching است، ویژگی با هدف کاهش هزینهها و تاخیر کم برای توسعه دهندگان.
این سیستم به طور خودکار 50٪ تخفیف بر روی توکنهای ورودی که مدل اخیراً پردازش کرده است اعمال میکند، که به طور بالقوه منجر به صرفه جویی قابل توجهی برای برنامههایی میشود که اغلب از زمینه آن مجدد استفاده میکنند.
اولیویه گودمن، رئیس محصول OpenAI برای پلتفرم، در یک کنفرانس مطبوعاتی کوچک در مقر این شرکت در سانفرانسیسکو که کنفرانس توسعه دهندگان را آغاز کرد، گفت: «ما بسیار مشغول بودیم. تنها دو سال پیش، GPT-3 برنده شد. اکنون، ما [آن] هزینهها را تقریباً 1000 برابر کاهش دادهایم. من سعی میکردم نمونهای از فناوریهایی بیاورم که هزینههای خود را تقریباً 1000 برابر در مدت دو سال کاهش دادند – و نمیتوانم مثالی بیاورم.
این کاهش چشمگیر هزینه فرصت بزرگی را برای استارتآپها و شرکتها فراهم میکند تا برنامههای جدیدی را که قبلاً به دلیل هزینه دور از دسترس بودند، کشف کنند.
جدول قیمتگذاری از OpenAI’s DevDay 2024 کاهش هزینههای عمده برای استفاده از مدل هوش مصنوعی با توکنهای ورودی ذخیرهشده تا 50 درصد صرفهجویی در مقایسه با توکنهای کش نشده در مدلهای مختلف GPT، را نشان میدهد. مدل جدید o1 قیمتی عالی را به نمایش میگذارد که نشان دهنده قابلیتهای پیشرفته آن است.
Vision Fine-Tuning: مرز جدیدی در هوش مصنوعی بصری
یکی دیگر از اعلامیههای مهم، معرفی تنظیمات دقیق بینایی برای GPT-4o، آخرین مدل زبان بزرگ OpenAI است. این ویژگی به توسعه دهندگان اجازه میدهد تا قابلیتهای درک بصری مدل را با استفاده از تصاویر و متن سفارشی کنند.
پیامدهای این بهروزرسانی دامنهای گسترده و تأثیرگذار بر زمینههایی مانند وسایل نقلیه خودران، تصویربرداری پزشکی و عملکرد جستجوی بصری است. به گفته Grab،یک شرکت پیشرو در حمل و نقل غذا در جنوب شرقی آسیا، ،OpenAI قبلاً از این فناوری برای بهبود خدمات نقشهبرداری خود استفاده کرده است.
طبق گزارشها، Grab با استفاده از تنها 100 مثال، 20 درصد در دقت شمارش خطوط و 13 درصد افزایش در بومیسازی علائم محدودیت سرعت به دست آورد. این نرم افزار امکان تنظیم دقیق بینایی را برای بهبود چشمگیر خدمات مبتنی بر هوش مصنوعی در طیف گستردهای از صنایع با استفاده از دستههای کوچک دادههای آموزشی بصری نشان میدهد.
Realtime API: پر کردن شکاف در هوش مصنوعی مکالمهای
OpenAI همچنین از API Realtime خود که اکنون در نسخه بتا عمومی است، در DevDay رونمایی کرد. این پیشنهاد جدید توسعه دهندگان را قادر میسازد تا تجربیات چندوجهی با تاخیر کم، به ویژه در برنامههای گفتار به گفتار ایجاد کنند. این بدان معنی است که توسعه دهندگان میتوانند شروع به اضافه کردن کنترلهای صوتی ChatGPT به برنامهها کنند.
برای نشان دادن پتانسیل API، OpenAI یک نسخه بهروز شده از Wanderlust، یک برنامه برنامهریزی سفر که در کنفرانس سال گذشته به نمایش گذاشته شد را به نمایش گذاشت. با استفاده از Realtime API، کاربران میتوانند مستقیماً با برنامه صحبت کنند و در یک مکالمه طبیعی برای برنامهریزی سفرهای خود شرکت کنند. این سیستم حتی برای تقلید گفت و گوی انسانی اجازه وقفه در وسط جمله را میدهد.
در حالی که برنامهریزی سفر تنها یک مثال است، Realtime API طیف گستردهای از امکانات را برای برنامههای کاربردی صدادار در صنایع مختلف باز میکند. از خدمات مشتری گرفته تا آموزش و ابزارهای دسترسی، توسعهدهندگان اکنون یک منبع جدید قدرتمند برای ایجاد تجربیات شهودی و پاسخگوی مبتنی بر هوش مصنوعی دارند.
گودمنت توضیح داد: «زمانی که محصولاتی را طراحی میکنیم، اساساً شبیه استارتآپها و شرکتها هستیم. و بنابراین در حالت آلفا، ما تعداد زیادی شرکت داریم که از APIها، مدلهای جدید محصولات جدید نیز استفاده میکنند.» Realtime API اساساً روند ساخت دستیارهای صوتی و سایر ابزارهای هوش مصنوعی مکالمهای را ساده میکند و نیاز به وصل کردن چندین مدل برای رونویسی، استنتاج و تبدیل متن به گفتار را از بین میبرد.
پذیرندگان اولیه مانند Healthify، یک برنامه مربیگری تغذیه و تناسب اندام، و Speak، یک پلتفرم یادگیری زبان، از قبل Realtime API را در محصولات خود ادغام کردهاند. این پیادهسازیها پتانسیل API را برای ایجاد تجربیات کاربری طبیعیتر و جذابتر در زمینههای مختلف از مراقبتهای بهداشتی تا آموزش نشان میدهد.
ساختار قیمتگذاری Realtime API، اگرچه با 0.06 دلار در دقیقه ورودی صدا و 0.24 دلار در دقیقه خروجی صدا ارزان نیست، اما همچنان میتواند ارزش پیشنهادی قابل توجهی برای توسعهدهندگانی باشد که به دنبال ایجاد برنامههای مبتنی بر صدا هستند.
Model Distillation: گامی به سوی هوش مصنوعی در دسترستر
شاید متحول کنندهترین خبر، معرفی Model Distillation بود. این گردش کار یکپارچه به توسعه دهندگان اجازه میدهد تا از خروجیهای مدلهای پیشرفته مانند o1-preview و GPT-4o برای بهبود عملکرد مدلهای کارآمدتر مانند GPT-4o mini استفاده کنند.
این رویکرد میتواند شرکتهای کوچکتر را قادر سازد تا از قابلیتهای مشابه مدلهای پیشرفته بدون متحمل شدن هزینههای محاسباتی مشابه استفاده کنند. این به شکاف طولانی مدت در صنعت هوش مصنوعی بین سیستمهای پیشرفته و پرمصرف و همتایان در دسترستر اما کمتر توانمند آنها میپردازد.
یک استارت آپ کوچک فناوری پزشکی را در نظر بگیرید که یک ابزار تشخیصی مبتنی بر هوش مصنوعی را برای کلینیکهای روستایی توسعه میدهد. با استفاده از Model Distillation، این شرکت میتواند یک مدل جمعوجور را آموزش دهد که بسیاری از قدرتهای تشخیصی مدلهای بزرگتر را در حین کار بر روی لپتاپ یا تبلت استاندارد به تصویر میکشد.
این میتواند قابلیتهای پیشرفته هوش مصنوعی را به محیطهای محدود به منابع بیاورد و به طور بالقوه نتایج مراقبتهای بهداشتی را در مناطق محروم بهبود بخشد.
تغییر استراتژی OpenAI: ایجاد یک اکوسیستم هوش مصنوعی پایدار
مراسم DevDay 2024 محوری استراتژیک برای این شرکت بود و توسعه اکوسیستم را بر عرضه محصولات پرمخاطب اولویت میدهد. این رویکرد، اگرچه برای عموم مردم کمتر هیجانانگیز است، اما درک کاملی از چالشها و فرصتهای فعلی صنعت هوش مصنوعی را نشان میدهد.
رویداد آرام امسال به شدت با DevDay 2023 تضاد دارد، که با راهاندازی فروشگاه GPT و ابزارهای ایجاد GPT سفارشی، هیجانی شبیه معرفی آیفون ایجاد کرد.
با این حال، چشم انداز هوش مصنوعی از آن زمان به سرعت تکامل یافته است. رقبا پیشرفتهای چشمگیری داشتهاند و نگرانیها در مورد در دسترس بودن دادهها برای آموزش تشدید شده است. به نظر میرسد تمرکز OpenAI بر اصلاح ابزارهای موجود و توانمندسازی توسعه دهندگان پاسخی حساب شده به این تغییرات باشد. با بهبود کارایی و مقرون به صرفه بودن مدلهای خود، OpenAI قصد دارد مزیت رقابتی خود را حفظ کند و در عین حال نگرانیهای مربوط به منابع و اثرات زیستمحیطی را برطرف کند.
همانطور که OpenAI از یک مختل کننده به یک ارائه دهنده پلتفرم تبدیل میشود، موفقیت آن تا حد زیادی به توانایی آن در پرورش یک اکوسیستم توسعه دهنده پر رونق بستگی دارد.
این شرکت در رویداد DevDay با ارائه ابزارهای بهبود یافته، کاهش هزینهها و افزایش پشتیبانی، زمینه را برای رشد و ثبات بلندمدت در بخش هوش مصنوعی فراهم میکند. در حالی که تاثیر فوری ممکن است کمتر قابل مشاهده باشد، این استراتژی در نهایت میتواند منجر به پذیرش پایدار و گستردهتر هوش مصنوعی در بسیاری از صنایع شود.
منبع : venturebeat