Тест Тьюринга придумали как проверку: сможет ли машина разговаривать так, чтобы человек не понял, кто перед ним — живой собеседник или программа.
Похоже, момент настал.
В новом исследовании участники пять минут переписывались сразу с двумя собеседниками: одним человеком и одной ИИ-системой. Потом нужно было угадать, кто из них настоящий.
И тут случилось самое неприятное для нашей самооценки.
GPT-4.5 приняли за человека в 73% случаев. То есть чаще, чем реальных людей. Другая современная модель, LLaMa, показала результат примерно на уровне человека — 56%.
Но главный фокус был не в знаниях. ИИ не победил потому, что знал больше. Он победил потому, что научился выглядеть живым: отвечать неидеально, шутить, сбиваться, быть прямым, немного ошибаться и не звучать как инструкция к холодильнику.
Без специальной настройки всё было заметно слабее: GPT-4.5 принимали за человека только в 36% случаев. А значит, решает не только модель, но и маска, которую на неё надевают.
Учёные теперь говорят, что сам тест Тьюринга пора переосмыслить. Раньше он должен был проверять “разумность” машины. Теперь он всё больше проверяет другое: насколько легко нас обмануть в интернете.
И это уже не философская игра. Если бот может казаться человеком убедительнее человека, то в комментариях, переписках и соцсетях старый вопрос “с кем я говорю?” становится гораздо менее смешным.










