Показать еще

СОДЕРЖАНИЕ

  • Нейросеть обучили сленгу даркнета
  • Технология научилась определять опасные объявления и сигнализировать об утечках данных
  • Пока что нейронка «понимает» только английский язык
  • promo

Исследователи Корейского института науки и технологий обучили нейронную сеть определять киберугрозы на основе изучения текстов в даркнете

В Южной Корее исследователи обучили нейронную сеть DarkBERT понимать сленг участников даркнета. Об этом пишет Tom’s Hardware со ссылкой на техническую документацию нейронки. Сообщается, что южнокорейские ученые из института передовых технологий обучила DarkBERT на основе массива текстовых данных из даркнета (порядка 6 млн веб-страниц) с использованием языковой модели RoBERTa.

Схема работы DarkBERT. Источник: arxiv.org

Последние новости криптовалют, аналитика и прогнозы — все самое интересное в нашем новостном Телеграм-канале. Подписывайтесь, чтобы не пропустить ничего важного.

Особенность разработки заключается в том, что сленг в даркнете имеет определенные свойства, которые позволяют злоумышленникам не привлекать к себе внимание. Например, русскоязычные хакеры в даркнете часто прибегают к англицизму и даже меняют синтаксис, чтобы завуалировать публичную переписку на форумах.

Обучив нейросеть, ученые смогли определять утечки конфиденциальных данных в интернете. Например, система могла определять: являются ли опубликованные данные новой утечкой или же по сути являются копией ранее опубликованных материалов. Также нейросеть научилась определять по наличию ключевых слов объявления о продаже незаконных психотропных веществ. Утверждается, что решение способно упростить работу правоохранительных органов по поимке правонарушителей.

Впрочем, исследователи признают, что у DarkBERT есть ограничения. Например, пока что технология воспринимает только английский язык. Более того, процесс обучения пока далек от автоматизации, поскольку из-за различных версток сайта приходится в ручном режиме составлять массивы данных для обучения нейросети.

Несмотря на хайп вокруг нейронных сетей, пока что технология далека от идеала. Например, нейросети ChatGPT и Sage получили «тройку» за экзамен по истории в Уральском федеральном университете. Как уверяет доцент кафедры истории РФ УрФУ Михаил Киселев, алгоритм чат-ботов имитирует самостоятельные рассуждения, выдумывая на ровном месте факты и ссылаясь на несуществующие научные работы.

Топ криптоплатформ | Апрель 2024

Trusted

Согласно правилам Trust Project, BeInCrypto стремится предоставлять только непредвзятую и правдивую информацию. Цель этой новостной статьи — осветить событие точно и своевременно. Тем не менее, BeInCrypto рекомендует читателям самостоятельно проверять информацию и консультироваться со специалистом, прежде чем принимать любые финансовые решения на основе этого контента. Также обратите внимание, что наши «Условия и положения», «Политика конфиденциальности» и «Дисклеймеры» были обновлены.

2167c714-82e6-49de-8f9c-ea512025eb67.jpg
Денис Омельченко
Новостной корреспондент рынка криптовалютных активов и блокчейна с 2016 года. Колумнист новостного отдела Currency.com и новостной репортер англоязычного издания iHodl.com. Обозревал блокчейн-стартапы для криптокошелька Atomic Wallet и поддерживал развитие сообщества криптовалютного проекта Amoveo в качестве SMM-менеджера.
READ FULL BIO
Sponsored
Sponsored