Алгоритм xFakeSci разоблачает фальшивые научные статьи, созданные искусственным интеллектом

Логотип компании
09.08.2024Автор
Алгоритм xFakeSci разоблачает фальшивые научные статьи, созданные искусственным интеллектом

Фото: Dilok Klaisataporn / Shutterstock

Алгоритм, разработанный Ахмедом Абдином Хамедом, позволяет с точностью до 94% выявлять публикации, созданные с помощью ИИ, таких как ChatGPT. Этот результат вдвое превосходит эффективность традиционных методов анализа данных.

В эпоху, когда искусственный интеллект не только помогает, но и создает проблемы, ученые из Университета Бингемтона представили решение, способное разоблачить фальшивые научные статьи. Суть работы алгоритма проста: он анализирует тексты и выявляет специфические паттерны, которые отличают настоящие научные статьи от подделок. Например, одно из ключевых отличий — количество и качество биграмм, то есть пар слов, часто встречающихся вместе. В поддельных статьях их значительно меньше, и они слабо связаны с другими элементами текста. Настоящие научные статьи, наоборот, богаты разнообразными и сложными словосочетаниями.

Исследование, опубликованное в Scientific Reports, показало, что xFakeSci может распознать фальшивки в таких важных медицинских темах, как болезнь Альцгеймера, рак и депрессия. Для тестирования алгоритма были созданы 50 поддельных статей на каждую из этих тем. Все они были сгенерированы с использованием тех же ключевых слов, что и настоящие статьи из базы данных PubMed.

Результаты впечатляют: xFakeSci успешно выявил 94% поддельных публикаций, тогда как традиционные методы справляются лишь с 38–52% таких задач. Однако, как признает сам Хамед, алгоритм не всесилен: около 6% поддельных статей все еще могут пройти незамеченными. «Это как игра в кошки-мышки: ИИ становится умнее, и мы должны не отставать», — шутит Хамед.

Алгоритм xFakeSci разоблачает фальшивые научные статьи, созданные искусственным интеллектом. Рис. 1

Алгоритм xFakeSci был протестирован не только на последних публикациях, но и на статьях прошлых лет, что подтвердило его стабильность и надежность. Впереди у команды Хамеда амбициозные планы: расширить спектр тем и адаптировать алгоритм для других областей науки, таких как инженерия и гуманитарные науки.

Ранее IT-World сообщал об инициативе поискового гиганта – Google внедрила новые меры, чтобы усложнить выдачу в поиске и распространение поддельного контента, созданного с помощью искусственного интеллекта.

Итак, пока ИИ продолжает генерировать тексты, которые могут ввести в заблуждение даже опытного исследователя, xFakeSci становится необходимым инструментом для защиты науки от дезинформации. В эпоху, когда каждый клик может стать частью глобальной игры в фейковые новости, такие технологии как xFakeSci и новые инициативы Google — это щит, который поможет сохранить качество получаемой информации.

Читайте также
Одной из самых критичных инженерных систем центра обработки данных (ЦОД) можно назвать систему электроснабжения. На нее вместе с системой бесперебойного питания может приходиться до 25% от общей стоимости. Поэтому, прежде чем приобрести то или иное решение, бизнес тщательно взвешивает не только его преимущества, но и недостатки, а также связанные с ним риски.

Похожие статьи