КИЇВWEEKLY
  • Новини Києва
  • Україна
  • Війна в Україні
  • Економіка
  • Політика
  • Світ
  • Технології
  • Спорт
  • uk Українська
    • ar العربية
    • az Azərbaycan dili
    • bg Български
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
Субота, 14 Березня, 2026
No Result
View All Result
  • Новини Києва
  • Україна
  • Війна в Україні
  • Економіка
  • Політика
  • Світ
  • Технології
  • Спорт
  • uk Українська
    • ar العربية
    • az Azərbaycan dili
    • bg Български
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
КИЇВWEEKLY
No Result
View All Result
Home Технології

Вчені створили найскладніший тест для ШІ – результати вражають

14.03.2026
A A
0
10
SHARES
322
VIEWS
Share Share

Коли системи штучного інтелекту почали досягати надзвичайно високих результатів на давно використовуваних академічних тестах, дослідники помітили серйозну проблему: колись складні випробування перестали бути викликом для сучасних моделей. Відомі тести, такі як Massive Multitask Language Understanding (MMLU), які раніше вважалися вимогливими, більше не здатні адекватно оцінити можливості передових ШІ.

Щоб вирішити цю проблему, міжнародна група з майже тисячі вчених, серед яких професор з Texas A&M University, розробила новий тип випробування. Мета полягала у створенні екзамену, що поєднує широту знань, складність та глибину, засновану на експертних людських знаннях, з якими сучасні ШІ все ще справляються важко.

Результатом став “Останній екзамен людства” (Humanity’s Last Exam, HLE) — тест із 2500 питань, який охоплює математику, гуманітарні науки, природничі науки, давні мови та широкий спектр спеціалізованих академічних дисциплін. Деталі проєкту опубліковані у Nature, а додаткова інформація доступна на сайті lastexam.ai.

Серед багатьох учасників проєкту — доктор Тунг Нгуєн, асоційований професор кафедри комп’ютерних наук та інженерії Texas A&M, який допомагав створювати та вдосконалювати питання для екзамену.

“Коли ШІ починають показувати високі результати на людських тестах, може здатися, що вони наближаються до людського рівня розуміння. Але HLE нагадує: інтелект — це не лише впізнавання шаблонів, а глибина, контекст і спеціалізовані знання,” — пояснює Нгуєн.

Мета тесту не в тому, щоб “перехитрити” людину, а у визначенні сфер, де ШІ все ще відстає. Питання для HLE розробляли й перевіряли експерти з усього світу. Кожне завдання має чітку перевірювану відповідь і створене так, щоб його не можна було швидко вирішити через простий пошук в Інтернеті. Серед тем — переклад давніх написів Палміри, ідентифікація дрібних анатомічних структур у птахів та аналіз нюансів вимови біблійної давньоєврейської мови.

Всі питання перевіряли на провідних ШІ-моделях. Ті завдання, які могли правильно вирішити сучасні системи, вилучалися з фінальної версії. Раннє тестування показало ефективність такого підходу: навіть потужні моделі справлялися зі складними завданнями слабо. GPT-4o набрав лише 2,7%, Claude 3.5 Sonnet — 4,1%, OpenAI o1 — близько 8%. Найсильніші моделі, Gemini 3.1 Pro і Claude Opus 4.6, досягли точності 40–50%.

Нгуєн підкреслює, що відсутність точних оцінювальних інструментів може призвести до неправильного розуміння справжніх можливостей ШІ.

“Високі бали на тестах, розроблених для людей, не обов’язково відображають справжній інтелект. Вони вимірюють здатність виконувати завдання, створені для людського навчання, а не глибоке розуміння,” — каже він.

Попри драматичну назву, HLE не натякає на заміну людей машинами. Навпаки, тест показує, скільки знань і експертизи залишаються унікально людськими.

“Це не гонитва проти ШІ. Це спосіб зрозуміти сильні та слабкі сторони систем, щоб будувати безпечніші та надійніші технології,” — додає Нгуєн.

HLE створений як довготривалий, прозорий бенчмарк для майбутніх моделей ШІ. Деякі питання вже опубліковані, інші залишаються прихованими, щоб ШІ не могли просто запам’ятати відповіді.

“На даний момент HLE є одним із найчіткіших способів оцінити розрив між ШІ та людським інтелектом. І попри швидкий технологічний прогрес, цей розрив досі значний,” — підсумовує Нгуєн.

Проєкт демонструє силу міжнародної колаборації: до нього долучилися не лише комп’ютерні науковці, а й історики, фізики, лінгвісти та медичні дослідники. Така різноманітність дисциплін дозволила виявити прогалини у сучасних ШІ-системах — іронічно, але саме людська співпраця показала межі машинного розуміння.

Читайте також

Вчені виявили, що Гольфстрім почав зміщуватися на північ
Технології

Вчені виявили, що Гольфстрім почав зміщуватися на північ

14.03.2026
0

Вчені виявили, що зміни в течії Гольфстрім можуть допомогти передбачити можливий крах однієї з найважливіших океанічних систем на Землі — Атлантичної меридіональної циркуляції (AMOC). Саме ця система величезних океанічних течій...

Read moreDetails
Вчені знайшли спосіб зробити дешевий алюміній ціннішим за золото

Вчені знайшли спосіб зробити дешевий алюміній ціннішим за золото

13.03.2026
Вчені розгадали одну з головних таємниць людського дотику

Вчені розгадали одну з головних таємниць людського дотику

13.03.2026
Google Chrome усуває помилки з високим рейтингом CVSS

Google Chrome усуває помилки з високим рейтингом CVSS

13.03.2026
NASA знову відправляє людей до Місяця

NASA знову відправляє людей до Місяця

13.03.2026
Next Post
В Україні сонячно та тепло: прогноз погоди на 14 березня

В Україні сонячно та тепло: прогноз погоди на 14 березня

0 0 голоси
Рейтинг статті
Підписатися
Сповістити про
guest
guest
0 Коментарі
Найстаріші
Найновіше Найбільше голосів
Зворотній зв'язок в режимі реального часу
Переглянути всі коментарі

ТОП новини

  • Стало відомо, скільки заробляє новий очільник «Енергоатома» Ковтонюк

    Стало відомо, скільки заробляє новий очільник «Енергоатома» Ковтонюк

    10 shares
    Share 4 Tweet 3
  • Почему жители Киева все чаще обращаются к полиграфу – тренды и реальные кейсы

    10 shares
    Share 4 Tweet 3
  • У Києві на тлі аварійного відключення світла на правому березі впав тиск води – водоканал

    10 shares
    Share 4 Tweet 3
  • Уряд скоротив терміни повернення акцизів: як це вдарить по бізнесу

    10 shares
    Share 4 Tweet 3
  • Ціни на пальне 12 березня 2026: скільки коштують бензин, дизель та газ на АЗС

    10 shares
    Share 4 Tweet 3

Останні новини

Кількість загиблих від атаки рф на Київщину зросла до чотирьох, 15 постраждалих

Кількість загиблих від атаки рф на Київщину зросла до чотирьох, 15 постраждалих

51 хвилина ago
“Ціла Санта-Барбара”: Зеленський пояснив, чому переносяться переговори з РФ

“Ціла Санта-Барбара”: Зеленський пояснив, чому переносяться переговори з РФ

2 години ago
У Києві та Бучанському районі – екстрені відключення світла

У Києві та Бучанському районі – екстрені відключення світла

2 години ago
Забруднення Дністра: Молдова звернулася до ЄС по екстрену допомогу

Забруднення Дністра: Молдова звернулася до ЄС по екстрену допомогу

2 години ago
У кількох районах Києва через обстріл зупинився електротранспорт та зникло світло

У кількох районах Києва через обстріл зупинився електротранспорт та зникло світло

2 години ago
No Result
View All Result

Дайджест

У Києві та Бучанському районі – екстрені відключення світла

Забруднення Дністра: Молдова звернулася до ЄС по екстрену допомогу

У кількох районах Києва через обстріл зупинився електротранспорт та зникло світло

Суд Відня закрив справу Фірташа

Ракетна атака на Бровари: є загиблий та поранені

Під ударом Київ, Суми та Запорізька область: все про нічну атаку РФ на Україну

Вибір редактора

Трамп про дрони: США не потрібна допомога України
Світ

Трамп про дрони: США не потрібна допомога України

14.03.2026
0

image: afp Президент сказав, що країна сама контролює захист від іранських безпілотників. Президент США Дональд Трамп заявив,...

Кількість загиблих від атаки рф на Київщину зросла до чотирьох, 15 постраждалих

Кількість загиблих від атаки рф на Київщину зросла до чотирьох, 15 постраждалих

14.03.2026
“Ціла Санта-Барбара”: Зеленський пояснив, чому переносяться переговори з РФ

“Ціла Санта-Барбара”: Зеленський пояснив, чому переносяться переговори з РФ

14.03.2026
У Києві та Бучанському районі – екстрені відключення світла

У Києві та Бучанському районі – екстрені відключення світла

14.03.2026
Забруднення Дністра: Молдова звернулася до ЄС по екстрену допомогу

Забруднення Дністра: Молдова звернулася до ЄС по екстрену допомогу

14.03.2026
  • Про нас
  • Політика конфіденційності
  • Редакційна політика
  • Наші контакти
  • Платне розміщення матеріалів
  • Sitemap
Реклама: digestmediaholding@gmail.com

Використання будь-яких матеріалів, опублікованих на сайті, дозволяється лише за умови обов’язкового та коректного зазначення активного посилання на ресурс kyivweekly.com. Це правило поширюється на всі типи контенту — новини, аналітику, авторські статті, мультимедійні матеріали та інші публікації.

Для інтернет-видань і онлайн-платформ гіперпосилання має бути відкритим і доступним для індексації пошуковими системами. Рекомендовано розміщувати його безпосередньо в підзаголовку матеріалу або в першому абзаці тексту, щоб забезпечити коректне посилання на джерело та підвищити прозорість походження інформації.
Редакція вебсайту не завжди поділяє думки, висловлені авторами публікацій, оскільки вони можуть містити суб’єктивні оцінки чи аналітичні висновки. Водночас редакція не несе відповідальності за зміст поданих матеріалів, їхню точність чи можливі наслідки використання інформації читачами.


© 2016-2026 Останні новини Києва та України

No Result
View All Result
  • Новини Києва
  • Україна
  • Війна
  • Економіка
  • Політика
  • Світ
  • Технології

Використання будь-яких матеріалів, опублікованих на сайті, дозволяється лише за умови обов’язкового та коректного зазначення активного посилання на ресурс kyivweekly.com. Це правило поширюється на всі типи контенту — новини, аналітику, авторські статті, мультимедійні матеріали та інші публікації.

Для інтернет-видань і онлайн-платформ гіперпосилання має бути відкритим і доступним для індексації пошуковими системами. Рекомендовано розміщувати його безпосередньо в підзаголовку матеріалу або в першому абзаці тексту, щоб забезпечити коректне посилання на джерело та підвищити прозорість походження інформації.
Редакція вебсайту не завжди поділяє думки, висловлені авторами публікацій, оскільки вони можуть містити суб’єктивні оцінки чи аналітичні висновки. Водночас редакція не несе відповідальності за зміст поданих матеріалів, їхню точність чи можливі наслідки використання інформації читачами.


© 2016-2026 Останні новини Києва та України

wpDiscuz