یکی از مهمترین خبرهای این رونمایی، در دسترس قرار گرفتن GPT-4o برای تمامی کاربران، چه رایگان و چه پولی، است. قابلیتهای متن و تصویر این مدل از امروز برای همه کاربران فعال شده، اما قابلیت جدید Voice Mode آن در ابتدا بهصورت آزمایشی و برای کاربران پولی ارائه خواهد شد و بعداً در دسترس عموم قرار خواهد گرفت.
بیشتر بخوانید:
- ممنوعیت تبلیغات به بلاگرهای خارج از کشور
- پیام تسلیت معاون علمی رئیسجمهور در پی شهادت دکتر رئیسی و همراهان ایشان
میرا موراتی، مدیر ارشد فناوری OpenAI، در این مراسم گفت:
ما معتقدیم که GPT-4o پارادایم همکاری و تعامل میان انسان و کامپیوتر را تغییر میدهد. این مدل بهبودیافته قادر به درک متن، صدا و تصویر است و تیم ما ماهها تلاش کرده تا این قابلیتها را برای تمام کاربران ارائه دهد.
به گفته موراتی، GPT-4o نسبت به نسخه قبلی خود، بهینهتر شده و OpenAI API این مدل را نیز دو برابر سریعتر و 50 درصد ارزانتر کرده است. محدودیت این API نیز 5 برابر نسبت به GPT-4 توربو کاهش پیدا کرده است. یکی از بزرگترین ارتقاهای GPT-4o، قابلیت جدید گفتار زنده است. این قابلیت به هوش مصنوعی اجازه میدهد تا به طور مستقیم به صدا گوش دهد و نیازی به تبدیل صدا به متن قبل از پردازش آن ندارد. این موضوع باعث میشود تا تعامل با GPT-4o طبیعیتر و سریعتر از همیشه شود.
در یکی از دموهای ارائه شده، هوش مصنوعی میتوانست حتی صدای تنفس کاربر را تشخیص دهد و به او در مورد بهبود وضعیت تنفسش توصیه کند. همچنین، به نظر میرسید که هوش مصنوعی بلافاصله پس از اتمام صحبت کاربر، به او پاسخ میداد. GPT-4o کاربردهای متنوعی دارد. به عنوان مثال، میتوانید از این مدل برای ترجمه منوی رستوران، حل معادلات ریاضی، دریافت خلاصه متن، و یا حتی تشخیص احساسات افراد از طریق دوربین استفاده کنید.
با وجود اینکه GPT-4o برای کاربران رایگان نیز در دسترس است، اما کاربران پولی میتوانند روزانه درخواستهای بیشتری را به هوش مصنوعی ارسال کنند. OpenAI همچنین از نسخه دسکتاپ اپلیکیشن ChatGPT و قابلیتهای صوتی و تصویری جدید برای این چتبات رونمایی کرد. GPT-4o گامی بزرگ در جهت تعامل طبیعیتر و کارآمدتر با هوش مصنوعی است. این مدل قدرتمند و قابلدسترس، میتواند به افراد در زمینههای مختلف کمک کند و دنیای هوش مصنوعی را به مکانی جذابتر و کاربردیتر تبدیل کند.
بیشتر بخوانید:
امتیاز شما به این مطلب