Институт искусственного ума Аллена в Сиэтле на прошлой недельке представил систему Semantic Scholar, которая дает экстремальное сжатие обширных научно-технических статей, чтоб уменьшить время на их исследование.
Это исследовательский инструмент на базе ИИ, который может понадобиться в научной среде. Благодаря функции реферирования он может просматривать большущее количество научной литературы, сводя обработанный материал практически к одному предложению.
Услугами Semantic Scholar в месяц пользовались 7 млн. юзеров, в его базе находятся 10 млн. статей по информатике. По словам 1-го из разрабов системы Дэна Велда, существующая база данных будет часто пополняться – в том числе статьями и по иным дисциплинам.
Это далековато не 1-ая программка обработки естественного языка для обобщения документов. Обычно для решения данной задачки употребляется один из 2-ух подходов – или экстрактивный, делающий выбор в пользу репрезентативного текста и его дословного использования в резюме, или абстрактный, когда употребляются методы генерации естественного языка при разработке резюме с уникальной формулировкой.
В отличие от их у Semantic Scholar очень высочайшая степень сжатия. Например, резюме статьи из 5000 слов составит всего 21 слово, другими словами 1:238. У наиблежайшего соперника Semantic Scholar этот показатель составляет 1:36.
Институт Аллена дает собственный код полностью безвозмездно всем желающим, также приглашает посетить собственный демо веб-сайт scitldr.apps.allenai.org. К истинному времени хранилище Semantic Scholar заполнено только английскими материалами, но с течением времени оно пополнится документами и на остальных языках.Источник — Semantic Scholar
Источник: