Коли цього місяця OpenAI представила останню версію свого надзвичайно популярного чат-бота ChatGPT, у нього з'явився новий голос з людськими інтонаціями та емоціями. Під час онлайн-демонстрації бот навчав дитину розв'язувати задачу з геометрії.
На превеликий жаль, демонстрація виявилася, по суті, заманюванням і підміною. Новий ChatGPT був випущений без більшості нових функцій, включаючи покращений голос (який, як повідомила мені компанія, вона відклала, щоб виправити помилки). Можливість використовувати відеокамеру телефону для аналізу в реальному часі чогось на кшталт математичної задачі також поки що недоступна.
На тлі затримки компанія також деактивувала голос ChatGPT, який, на думку деяких, був схожий на голос актриси Скарлетт Йоханссон, після того, як вона пригрозила судовим позовом, замінивши його на інший жіночий голос.
Наразі в новому ChatGPT з'явилася можливість завантажувати фотографії для аналізу ботом. Користувачі, як правило, можуть очікувати більш швидких і зрозумілих відповідей. Бот також може перекладати в реальному часі, але ChatGPT відповідатиме своїм старим, машинним голосом.
Тим не менш, це провідний чат-бот, який перевернув технологічну індустрію, тому його варто розглянути. Після того, як я спробував прискореного чат-бота протягом двох тижнів, у мене були змішані почуття. Він чудово справлявся з перекладом, але мав проблеми з математикою та фізикою. Загалом, я не побачив значного покращення порівняно з попередньою версією, ChatGPT-4. Я б точно не дозволив їй займатися з моєю дитиною.
Така тактика, коли компанії, що займаються розробкою штучного інтелекту, обіцяють дикі нові функції, а надають напівфабрикат, стає трендом, який неодмінно збиває людей з пантелику і розчаровує їх. Ai Pin вартістю 700 доларів, розмовляючий значок на лацкан від стартапу Humane, який фінансується генеральним директором OpenAI Семом Альтманом, був повсюдно розкритикований через те, що він перегрівався і випльовував нісенітниці. Meta також нещодавно додала до своїх додатків чат-бота зі штучним інтелектом, який погано справлявся з більшістю заявлених завдань, наприклад, з пошуком квитків на літак в Інтернеті.
Компанії випускають продукти зі штучним інтелектом у передчасному стані частково тому, що хочуть, щоб люди використовували технологію, щоб навчитися її вдосконалювати. У минулому, коли компанії представляли нові технологічні продукти, такі як телефони, ми отримували те, що нам показували - нові камери та яскравіші екрани. Завдяки штучному інтелекту компанії дають уявлення про потенційне майбутнє, демонструючи технології, які знаходяться в стадії розробки і працюють лише в обмежених, контрольованих умовах. Зрілий, надійний продукт може з'явитися, а може й ні.
Урок, який можна винести з усього цього, полягає в тому, що ми, як споживачі, повинні протистояти хайпу і повільно та обережно підходити до ШІ. Ми не повинні витрачати багато грошей на недопрацьовану технологію, поки не побачимо докази того, що інструменти працюють так, як їх рекламують.
Нова версія ChatGPT, яка називається GPT-4o ("o" як "omni"), тепер доступна для безкоштовного тестування на сайті та в додатку OpenAI. Користувачі, які не платять, можуть зробити кілька запитів, перш ніж закінчиться таймаут, а ті, хто має щомісячну підписку за 20 доларів, можуть поставити боту більшу кількість запитань.
В OpenAI кажуть, що ітеративний підхід до оновлення ChatGPT дозволив їм зібрати зворотній зв'язок для внесення поліпшень.
"Ми вважаємо, що важливо попередньо переглядати наші вдосконалені моделі, щоб дати людям уявлення про їхні можливості і допомогти нам зрозуміти їхнє реальне застосування", - йдеться в заяві компанії.
(Минулого року газета The New York Times подала до суду на OpenAI та її партнера, Microsoft, за використання захищених авторським правом новинних статей без дозволу для навчання чат-ботів).
Ось що варто знати про останню версію ChatGPT.
Геометрія та фізика
Щоб продемонструвати нові можливості ChatGPT-4o, OpenAI опублікувала відео за участю Сала Хана, виконавчого директора Академії Хана, освітньої некомерційної організації, та його сина Імрана. За допомогою відеокамери, спрямованої на задачу з геометрії, ChatGPT зміг крок за кроком пояснити Імрану, як її розв'язати.
Хоча функція відеоаналізу ChatGPT ще не випущена, я зміг завантажити фотографії геометричних задач. Деякі з них ChatGPT розв'язав правильно, але на більш складних задачах він спіткнувся.
В одній задачі про трикутники, що перетинаються, яку я відкопав на сайті для підготовки до SAT, бот зрозумів запитання, але дав неправильну відповідь.
Тейлор Нгуєн, вчитель фізики середньої школи в окрузі Оріндж, штат Каліфорнія, завантажив задачу з фізики про людину на гойдалці, яка зазвичай включається в тести з математики для старших класів. ChatGPT припустився кількох логічних помилок і дав неправильну відповідь, але завдяки зворотному зв'язку від пана Нгуєна зміг виправитися.
"Я зміг натренувати його, але я вчитель, - сказав він. "Як учень може знайти ці помилки? Вони роблять припущення, що чат-бот правий".
Я помітив, що ChatGPT-4o впорався з деякими обчисленнями ділення, які його попередники робили неправильно, тож є ознаки повільного вдосконалення. Але він також не впорався з базовим математичним завданням, з яким попередні версії та інші чат-боти, зокрема Meta AI та Gemini від Google, не могли впоратися: вміння рахувати. Коли я попросив ChatGPT-4o назвати слово з чотирьох складів, що починається на літеру "W", він відповів: "Чудово".
OpenAI заявила, що постійно працює над покращенням реакції своїх систем на складні математичні задачі.
Пан Хан, чия компанія використовує технологію OpenAI у своєму навчальному програмному забезпеченні Khanmigo, не відповів на прохання прокоментувати, чи залишить він репетитора ChatGPT наодинці зі своїм сином.
Міркування
OpenAI також підкреслила, що новий ChatGPT краще міркує або використовує логіку, щоб придумувати відповіді. Тож я запустив його в одному з моїх улюблених тестів: Я попросив його згенерувати головоломку "Де Волдо?". Коли він показав зображення гігантського Волдо, який стояв у натовпі, я сказав, що суть в тому, що його має бути важко знайти.
Тоді бот згенерував ще більшого Волдо.
Суббарао Камбхампаті, професор і дослідник штучного інтелекту в Університеті штату Арізона, також провів чат-бота через кілька тестів і сказав, що не побачив помітного поліпшення в міркуваннях порівняно з попередньою версією.
Він представив ChatGPT як головоломку з блоків:
Якщо блок С лежить на блоці А, а блок В лежить окремо на столі, чи можете ви сказати мені, як я можу скласти стопку блоків так, щоб блок А лежав на блоці В, а блок В - на блоці С, але без переміщення блоку С?
Відповідь полягає в тому, що за таких умов розташувати блоки неможливо, але, як і в попередніх версіях, ChatGPT-4o постійно знаходив рішення, яке передбачало переміщення блоку С. У цьому та інших тестах на міркування ChatGPT час від часу отримував зворотний зв'язок, щоб отримати правильну відповідь, що суперечить принципам роботи штучного інтелекту, каже пан Камбхампаті.
"Ви можете виправити це, але коли ви це робите, ви використовуєте свій власний інтелект", - сказав він.
OpenAI вказала на результати тестів, які показали, що GPT-4o набрав приблизно на два відсоткові пункти більше балів у відповідях на загальні питання, ніж попередні версії ChatGPT, що свідчить про те, що його навички міркування дещо покращилися.
Мова
OpenAI також заявив, що новий ChatGPT може виконувати переклад в реальному часі, що може допомогти вам розмовляти з кимось, хто розмовляє іноземною мовою.
Я протестував ChatGPT з мандаринською та кантонською мовами і підтвердив, що він добре перекладає фрази на кшталт "Я хотів би забронювати номер в готелі на наступний четвер" і "Мені потрібне двоспальне ліжко". Але акценти були трохи зміщені. (Чесно кажучи, моя ламана китайська не набагато краща.) OpenAI заявив, що все ще працює над покращенням акцентів.
ChatGPT-4o також виявився чудовим редактором. Коли я скормив йому написані мною абзаци, він швидко і ефективно видалив зайві слова і жаргон. Пристойна робота ChatGPT з перекладом дає мені впевненість, що незабаром ця функція стане ще більш корисною.
Підсумок
Головне, що OpenAI вдалося зробити з ChatGPT-4o - це зробити технологію безкоштовною для людей, щоб вони могли її спробувати. Безкоштовність - це правильна ціна: Оскільки ми допомагаємо навчати ці системи штучного інтелекту за допомогою наших даних, ми не повинні платити за них.
Найкраще в ШІ ще попереду, і, можливо, одного дня він стане хорошим репетитором з математики, з яким ми захочемо поговорити. Але ми повинні повірити в це, коли побачимо і почуємо.