OpenAI روز دوشنبه یک مدل جدید هوش مصنوعی و نسخه دسکتاپ ChatGPT را به همراه رابط کاربری بهروز شده راهاندازی کرد که آخرین تلاش این شرکت برای گسترش استفاده از چتبات محبوب خود به شمار میرود. این نسخه GPT-4O نام دارد.
«میرا موراتی» مدیر فناوری این شرکت در یک رویداد پخش زنده گفت که این بهروزرسانی باعث میشود تا GPT-4 برای همه، از جمله کاربران رایگان OpenAI، در دسترس باشد.
او اضافه کرد که مدل جدید GPT-4O نسبت به نسخه قبلی «بسیار سریعتر» است و قابلیتهای بهبودیافتهای در متن، ویدیو و صدا دارد.
OpenAI در خبر هیجانانگیز دیگری اعلام کرد که در نهایت قصد دارد به کاربران امکان چت تصویری با ChatGPT را بدهد.
موراتی گفت: «این اولین باری است که ما واقعا گام بزرگی در زمینه سهولت استفاده از ChatGPT برای کاربران خود برداشتهایم.»
رونمایی OpenAI از نسخه جدید خود GPT-4O
OpenAI که توسط مایکروسافت پشتیبانی میشود، بیش از 80 میلیارد دلار توسط سرمایهگذاران ارزشگذاری شده است. این شرکت که در سال 2015 تاسیس شد، تحت فشار است تا در صدر بازار هوش مصنوعی زاینده باقی بماند و در عین حال راههایی برای کسب درآمد بیابد، زیرا مبالغ هنگفتی را برای پردازندهها و زیرساختها در راستای ساخت و آموزش مدلهای خود هزینه میکند.
حرف O در عبارت GPT-4O مخفف واژه Omni است.
موراتی گفت که مدل جدید به ChatGPT اجازه میدهد تا 50 زبان مختلف را با سرعت و کیفیت بهبودیافته مدیریت کند و همچنین از طریق API OpenAI در دسترس خواهد بود و این امکان را برای توسعهدهندگان فراهم میکند تا از امروز شروع به ساخت اپلیکیشنها با استفاده از مدل جدید کنند.
طبق گفته مدیر ارشد فناوری OpenAI، این مدل جدید نسبت به مدل GPT-Turbo دوبرابر سریعتر است و تنها نصف آن مدل هزینه دارد.
اعضای تیم OpenAI قابلیتهای صوتی مدل جدید را به نمایش گذاشتند، برای مثال، از آن خواستند تا شخصی را که قرار است در جمع سخنرانی انجام دهد آرام کنند تا استرس نداشته باشد.
«مارک چن» محقق OpenAI گفت که این مدل میتواند «احساسات شما را درک کند» و اضافه کرد که این مدل همچنین میتواند کاربرانی را که سعی در اخلال در کار آن دارند کنترل کند. این تیم همچنین از نرمافزار خواست تا حالت چهره کاربر را تجزیهوتحلیل و در مورد احساساتی که ممکن است آن فرد تجربه کند، اظهار نظر کند.
دستیار صوتی ChatGPT در پاسخ به کاربری که با آن حالواحوال کرده بود و ظاهرا صورت ناراحتی داشت گفت: «سلام، چه خبر؟ چطور میتونم روزت رو بهتر کنم؟»
بنابر پستی که در وبلاگ OpenAI منتشر شده، این شرکت قصد دارد در هفتههای آینده حالت صوتی را با دسترسی زودهنگام برای مشترکین پولی به ChatGPT Plus آزمایش کند. OpenAI همچنین گفت که مدل جدید میتواند به درخواستهای صوتی کاربران «در کمتر از ۲۳۲ میلیثانیه، با میانگین ۳۲۰ میلیثانیه، که مشابه زمان پاسخدهی انسان در یک مکالمه است» پاسخ دهد.
«چن» توانایی مدل را برای گفتن داستانی قبل از خواب نشان داد و از او خواست که لحن صدایش را به سمت دراماتیک یا رباتیک تغییر دهد. او حتی از برنامه خواست که داستان را بخواند.
علاوه بر این، مدل جدید OpenAI یعنی GPT-4O میتواند به عنوان یک مترجم حتی در حالت صوتی نیز عمل کند. «چن» در حالیکه خودش به انگلیسی و موراتی به زبان ایتالیایی صحبت میکرد، توانست توانایی ابزار را در ترجمه همزمان مکالمات موراتی به انگلیسی نشان دهد.
اعضای تیم همچنین توانایی مدل را در حل معادلات ریاضی و کمک به نوشتن کد نشان دادند و آن را به عنوان یک رقیب قویتر برای GitHub Copilot خود مایکروسافت معرفی کردند.
برای OpenAI، این راهاندازی یکی از بزرگترین اعلامیههای این شرکت از زمان آغاز به کار ChatGPT Enterprise در آگوست بود، که نسخه تجاری این چتبات محبوب محسوب میشد.
«برد لایت کپ» مدیر عملیات OpenAI در آن زمان به CNBC گفت که این ابزار به مدت «زیر یک سال» در حال توسعه و از کمک بیش از 20 شرکت در اندازهها و صنایع مختلف برخوردار بود.
در دورهای که تمام شرکتها در تمام صنایع در حال اضافه کردن چتباتها و امکانات مبتنی بر هوش مصنوعی به سرویسهای کلیدی خود هستند، OpenAI، مایکروسافت و گوگل، در راس رقابت داغ در دوره رشد طلایی هوش مصنوعی قرار دارند.
در اوایل این ماه، Anthropic رقیب OpenAI از اولین پیشنهاد سازمانی خود و نیز یک اپلیکیشن رایگان برای گوشیهای آیفون رونمایی کرد.
طبق گزارش PitchBook، در سال 2023، رکورد 29.1 میلیارد دلار در نزدیک به 700 معامله هوش مصنوعی مولد سرمایهگذاری شد که بیش از 260 درصد نسبت به سال قبل افزایش داشته است. پیشبینی میشود این بازار ظرف یک دهه به بیش از یک تریلیون دلار درآمد برسد.
برخی در این صنعت نگرانیهایی را در مورد سرعت عرضه خدمات جدید آزمایشنشده به بازار مطرح کردهاند و دانشگاهیان و متخصصان اخلاق از تمایل این فناوری به دامن زدن به سوگیری ناراحت هستند.
پس از راهاندازی ChatGPT در نوامبر 2022، در آن زمان رکوردها را به عنوان سریعترین برنامه مصرفکننده در حال رشد در تاریخ شکست و این چتبات اکنون حدود 100 میلیون کاربر فعال هفتگی دارد. OpenAI میگوید که بیش از 92 درصد از شرکت های بزرگ موسوم به Fortune 500 از این پلتفرم استفاده میکنند.
موراتی در جریان رویداد دوشنبه گفت که OpenAI میخواهد «طی چند هفته این قابلیتهای جدید را برای همه عرضه کند.»
روز دوشنبه در یک پست وبلاگی اعلام شد که مدل GPT-4O ابتدا در روز سهشنبه برای مشتریان ChatGPT Plus و Team و سپس بعدا برای Enterprise عرضه میشود.
این قابلیتها همچنین از دوشنبه با محدودیت استفاده، برای کاربران رایگان ChatGPT نیز در دسترس خواهد بود. کاربران ChatGPT Plus پنج برابر بیشتر از کاربران رایگان ظرفیت پیام خواهند داشت و مشتریان ChatGPT Team و Enterprise محدودیتهای استفاده بیشتری خواهند داشت.
موراتی مراسم پخش زنده را با تشکر از «جنسن هوانگ» مدیرعامل انویدیا و شرکتش به خاطر ارائه واحدهای پردازش گرافیکی (GPU) لازم برای تقویت فناوری OpenAI به پایان رساند.
او گفت: «من فقط میخواهم از تیم باورنکردنی OpenAI و همچنین از جنسن و تیم Nvidia تشکر کنم که پیشرفتهترین پردازندههای گرافیکی را برای امکانپذیر ساختن این نسخه آزمایشی امروز به ما ارائه کردند.»
آخرین بهروزرسانی GPT
آخرین بهروزسانی نرمافزار GPT، نسخه GPT-4 است که در ماه مارس سال 2023 منتشر شد.
GPT-4 به لطف دانش عمومی گستردهتر و تواناییهای حل مسئله، میتواند مشکلات دشوار را با دقت بیشتری حل کند.