У Британії професорам вишу відправили згенеровані ШІ відповіді на іспит і вони цього не помітили
Дослідники з британського Університету Редінга обдурили власних професорів, таємно надіславши їм згенеровані штучним інтелектом відповіді на іспит. Вони отримали кращі оцінки, ніж справжні студенти.
Цей експеримент показує високі ризики обману у роботах, які можна робити вдома, пише The Guardian.
У рамках проєкту дослідники створили фальшиві студентські облікові записи. Через них вони надсилали викладачам невідредаговані відповіді на іспити, згенеровані ChatGPT-4. Це відбувалося під час домашнього онлайн-оцінювання бакалаврських курсів.
Викладачі університету запідозрили лише одну з 33 робіт. Решта відповідей ШІ отримали оцінки вищі, ніж середні у справжніх студентів.
За словами дослідників, їхні висновки свідчать про те, що ШІ, зокрема ChatGPT, тепер проходять "тест Тюрінга" – він був створений ще у 1950 році для визначення здатності машини проявляти інтелектуально обумовлену поведінку. Саме тому вони здатні залишатися непоміченими навіть досвідченими викладачами.
Автори зауважують, що здатність ШІ демонструвати більш абстрактні міркування буде покращуватися, а можливість виявити це – зменшуватиметься. Отже, проблема академічної доброчесності поглиблюватиметься.
"Ми не обов'язково повернемося повністю до рукописних іспитів, але світова освітня галузь повинна буде розвиватися перед обличчям штучного інтелекту", – сказав співавтор дослідження Пітер Скарф.
Інший автор експерименту, професор Етьєн Рош зазначив, що варто встановити чіткі правила використання ШІ.
"Ми повинні домовитися про те, як ми очікуємо, що студенти будуть використовувати ШІ та визнавати його роль у своїй роботі. Те ж саме стосується інших сфер життя, щоб запобігти кризі довіри в суспільстві", – говорить він.
На дослідження відреагували й у самому виші. Елізабет МакКрам, проректорка з питань освіти Університету Редінга, сказала, що їхній заклад наразі "відходить" від використання онлайн-іспитів і розробляє можливі альтернативи.
"Деякі іспити допоможуть студентам використовувати ШІ. Навчать їх використовувати його критично й етично; розвиватимуть їхню ШІ-грамотність і забезпечать необхідними навичками для сучасного робочого місця. Інші оцінювання будуть виконані без використання ШІ", – заявила вона.
У примітках до дослідження автори іронічно зазначили, що вони, можливо, використовували ШІ для його підготовки та написання.
"Чи вважаєте ви це "шахрайством"? Якщо так, а ми заперечуємо використання GPT-4 (або будь-якого іншого ШІ), як би ви спробували довести, що ми брешемо?" – написали вони.
Однак зрештою представник Університету Редінга підтвердив, що дослідження все ж провели й написали люди.
Нагадаємо, штучний інтелект опановує сарказм: дослідники розробили детектор, що розпізнає глузливий підтекст.