Штучний інтелект навчився мислити в дечому краще, ніж пересічна людина

Штучний інтелект навчився мислити в дечому краще, ніж пересічна людина

23 Лютого 2026
0
365
23 Лютого 2026
12:52

Штучний інтелект навчився мислити в дечому краще, ніж пересічна людина

0
365
Google випустив оновлення моделі Gemini 3.1 Pro, яка, за його повідомленням, на 77.1% упоралася з тестами на логічне й абстрактне мислення, що більше, ніж у середньостатистичної немотивованої людини.
Штучний інтелект навчився мислити в дечому краще, ніж пересічна людина
Штучний інтелект навчився мислити в дечому краще, ніж пересічна людина

На картинці (звідси) — проста логічна задачка, схожа на головоломки з дитячих книжок або питання з тесту на IQ. Ми маємо знайти закономірність у розташуванні кольорових квадратиків на перших трьох парах картинок і розв’язати завдання з четвертою парою за знайденою аналогією.

Цей тест — частина бенчмарку ARC-AGI-2. Бенчмарк — це те, чим тестують нові моделі штучного інтелекту. Їх кілька — на логіку, мислення, на знання, на кодинг, розуміння мов тощо. 19 лютого Google випустив оновлення своєї моделі Gemini 3.1 Pro, а в релізі повідомив, що з задачками з цього бенчмарку ця модель впоралася на 77.1%, що більш ніж удвічі вище, ніж результат попередньої версії 3 Pro (31.1%).

Для порівняння: середньостатистична людина, втомлена, розконцентрована й немотивована, з такими задачками в рамках одного тесту дає собі раду приблизно на 60%. Тобто модель, за повідомленням її розробників, уже перевершила пересічного незацікавленого у змаганні користувача саме в логіці й виявленні закономірностей.

Як на мене, це не просто чергове покращення, а невеличка зміна парадигми — вперше модель ШІ зробила ривок саме в цьому бенчмарку, пов’язаному не з пошуком чогось в інтернеті або у власній пам’яті, а саме з логікою та абстрактним мисленням. Це називається «System 2 Thinking» — модель ніби «прокручує» в голові різні варіанти (алгоритми) і перевіряє їх на прикладах, перш ніж видати фінальну сітку пікселів. Це вже схоже на послідовне логічне мислення, притаманне людині, хоча ще й не дотягує до інтуїтивного.

Можливо, тим, хто вивчає психологію, цей тест здався знайомим. І це не помилка — він подібний до прогресивних матриць Равена, за допомогою яких випробовуваний бачить послідовність абстрактних фігур і має виявити логічне правило (симетрія, додавання, обертання). Це — частина психометричних методик, за якими вже кілька десятиліть вимірюють рівень інтелекту людини. Саме на їхній основі й формували деякі згадані бенчмарки.

Також Гугл інформує, що нова модель оптимізована для складних завдань із програмування (agentic coding), наукових досліджень і роботи з великими масивами даних, а ще додано можливість генерації коду анімації безпосередньо з текстових запитів, що дозволяє створювати анімацію з мінімальним розміром файлу, наприклад, для сайту, графіки, творчості. Ця модель, як анонсується, краще розуміє фізику та структуру об’єктів. 

У іншому тесті GPQA Diamond, який містить питання з фізики, біології та хімії рівня PhD (доктор наук), модель набрала 94,3%. Це ставить її на рівень вузькоспеціалізованого експерта-науковця, перевершуючи результати більшості конкурентів, таких як GPT 5.2 та Claude 4.6.

Проте все ж із інтуїтивним мисленням і життєвим досвідом я б це не став порівнювати — це просто пошук фактів серед усієї інформації, що «згодували» моделі її творці, з подальшими самостійними науковими висновками. Звісно, в цьому показнику модель значно перевищує пам’ять середньостатистичної людини, але це радше «енциклопедичний» інтелект, спричинений більшим обсягом пам’яті, ніж людське мислення. Проте це теж можна назвати значним прогресом у розвитку систем ШІ, бо може бути дуже помічним саме для науки.

Отже, штучний інтелект продовжує розвиватися, з’являються нові й нові можливості, особливо в частині абстрактного мислення та логічної (а не галюцинальної) обробки масивів наукових знань.

Проте високий бал ШІ в цих тестах не тотожний людському інтелекту. Людина використовує інтуїцію та життєвий досвід, а штучний інтелект — набори подібностей на основі закладених у нього знань. Конкретно ця модель — ще й послідовний «перебір» варіантів і можливостей і здатність зупинитися й переробити цей ланцюжок у разі помилки.

Проте за вимірюваним рівнем «інтелекту» ці моделі все ще на шляху до перевершення людини, що справді ознаменує собою революцію. Поки що конкретно ця модель за деякими бенчмарками, які можна порівнювати (ми ж не порівнюватимемо пам’ять машини й людини, правда ж?) досягає рівня обдарованості за людськими психометричними тестами.

Однак справді вражає не теперішній рівень «інтелекту» ШІ, а динаміка його розвитку, адже ще рік тому й ця, й інші моделі мали такіж результати, як і людина з деменцією. Так, дуже обізнаної, інформованої, але все ж у плані логіки й висновків — десь на рівні твердої розумової відсталості. А нині, якщо ви так і не змогли розгадати головоломку з початку цього тексту, — вже перевершує багатьох із нас. І ось саме ця швидкість еволюції дивує та бентежить найбільше.

LIKED THE ARTICLE?
СПОДОБАЛАСЯ СТАТТЯ?
Help us do more for you!
Допоможіть нам зробити для вас більше!
Команда «Детектора медіа» понад 20 років виконує роль watchdog'a українських медіа. Ми аналізуємо якість контенту і спонукаємо медіагравців дотримуватися професійних та етичних стандартів. Щоб інформація, яку отримуєте ви, була правдивою та повною.

До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування спільних ідей та отримувати більше ексклюзивної інформації про стан справ в українських медіа.

Мабуть, ще ніколи якісна журналістика не була такою важливою, як сьогодні.
* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.
0
365
Коментарі
0
оновити
Код:
Ім'я:
Текст:
Долучайтеся до Спільноти «Детектора медіа»!
Ми прагнемо об’єднати тих, хто вміє критично мислити та прагне змінювати український медіапростір на краще. Разом ми сильніші!
Спільнота ДМ
Використовуючи наш сайт ви даєте нам згоду на використання файлів cookie на вашому пристрої.
Даю згоду