Преди два дни OpenAI обяви ChatGPT 4o или GPT-4o – значително обновление на големия езиков модел (LLM), който се използва от повече от 100 милиона души.

Функциите, които ще бъдат пуснати през следващите няколко седмици, добавят реч и видео за всички потребители – безплатни или платени, а най-голямото заключение е каква разлика прави използването на глас и видео за взаимодействие с ChatGPT-4o, което според някои може да бъде “стъпката” към прехода за ChatGPT5.

Промените, както от OpenAI казаха на зрителите на живото предаване, са насочени към “намаляване на търканията” между “хората и машините” и “достъп до AI за всеки”.

В зашеметяваща демонстрация главният технологичен директор и презентатор Мира Мурати, заедно с разработчиците на ChatGPT, провеждат разговори в реално време с ChatGPT.

Ключови акценти от ChatGPT 4o

Ето и някои от ключовите елементи, които могат да бъдат важни за бъдещето:

  • Chat-GPT 4o на OpenAI въвежда възможности за реч и видео, позволявайки на потребителите да взаимодействат с модела чрез гласови и видео входове.
  • Обновяването има за цел да намали триенето между хората и машините, като използва усъвършенствани възможности на AI, за да създаде по-естествени и безпроблемни взаимодействия.
  • GPT-4o може да води разговори в реално време, да отговаря едновременно на няколко говорители и дори да симулира емоции, добавяйки дълбочина и богатство към взаимодействията.
  • Надстройката включва подобрения в качеството и скоростта на над 50 езика, както и настолна версия за потребителите на Mac.
  • OpenAI признава предизвикателствата, свързани със злоупотребата с възможностите за аудио и видео в реално време, и подчертава, че ще работи със заинтересованите страни за отговорно справяне с тези предизвикателства.
  • GPT-4o се пуска итеративно през следващите седмици, включително десктоп приложение, започвайки с macOS.

Представяне на GPT-4o

След като OpenAI “хвърли ръкавицата” на Google със своите AI търсачки, то сега ще има още по-голямо екзалтиране около платформата.

OpenAI заявява, че функциите, които ще бъдат пуснати през следващите няколко седмици, ще подобрят и качеството и скоростта на над 50 езика “за да донесем това изживяване на колкото се може повече хора”.

Обновяването включва и настолна версия, която се пуска днес за Mac и е достъпна за платените потребители.

Екипът говори за университетски преподаватели, предлагащи инструменти на своите студенти, или подкастъри, създаващи съдържание за своите потребители, и как можете да използвате данни в реално време в работата си.

OpenAI казва, че GPT-4o (‘o’ означава ‘Omni’) може да отговори на аудио входове за едва 232 милисекунди, със средно време от 320 милисекунди – подобно на времето за реакция при разговор между хора.

Въпреки че функциите ще бъдат достъпни безплатно, OpenAI също обсъди как Pro потребителите не са пренебрегнати, като могат да получат достъп до пет пъти по-голям капацитет.

Промените ще се отразят и на интерфейса за програмиране на приложения (API), като се казва, че API е 2 пъти по-бързо и 50% по-евтино.

Главният технологичен директор и презентатор на OpenAI Мира Мурати представя ChatGPT 4-o.

OpenAI заяви, че “GPT-4o представя нови предизвикателства пред аудиото в реално време и визията в реално време срещу злоупотребата и ние продължаваме да работим с различни заинтересовани страни … за да разберем как най-добре да въведем тези технологии в света.”

Oсвен технологичния аспект, пускането на GPT-4o дава и поглед върху бизнес стратегията на OpenAI. Намаляването на цените и предоставянето на повече функции на безплатните потребители показва фокус върху бързо разширяване на потребителската база, подобно на подхода на много технологични гиганти.

Позоваването на “магазина” Custom GPT пък загатва за потенциал за развитие на цяла екосистема около модела, задвижвана от общността на създателите. Това може да отвори вратата за безброй иновативни приложения в различни области и сфери.

Въпреки огромния потенциал, OpenAI признава и предизвикателствата, свързани с възможна злоупотреба с тези мощни инструменти. Отговорното въвеждане на тези технологии ще изисква непрекъснато сътрудничество между разработчици, регулатори и по-широката общественост.

OpenAI няма много избор, освен да се развива

Макар OpenAI да остава златният стандарт по отношение на качеството и възможностите, Groq успява да предложи сравними резултати чрез комбиниране на големи открити модели като Llama 3, при това на много по-конкурентни цени.

В крайна сметка, засилващата се конкуренция в сферата на генеративния AI е от полза за потребителите и бизнеса, тъй като стимулира иновациите и води до по-добри и по-достъпни решения. OpenAI ще трябва да продължи да бъде в авангарда на тази вълнуваща технологична надпревара, за да запази статута си на лидер в бързо развиващия се сектор на изкуствения интелект.