Fecebook розпізнаватиме текст на відео та забраженнях, аби боротись зі спамом

Fecebook розпізнаватиме текст на відео та забраженнях, аби боротись зі спамом

Компанія Facebook оголосила про запуск нейромережі Rosetta, що зможе розпізнавати текст на зображеннях і відео. Такий алгоритм покликаний допомагати модераторам в боротьбі зі спамом, та образливим контентом.

Про це повідомляється в офіційному блозі Facebook.

«Значна кількість фотографій в Facebook, і Instagram містять текст в різних формах. Він може бути накладений на зображення в мемі або зображений на фотографії вітрини, вуличного знака або меню ресторану. Ми побудували і розгорнули великомасштабну систему машинного навчання під назвою Rosetta. Вона витягує текст з більш ніж мільярда загальнодоступних зображень Facebook і Instagram на самих різних мовах, а потім щодня і в режимі реального часу вводить його в модель розпізнавання тексту», – розповідають розробники.

Нейромережа використовує технологію оптичного розпізнавання тексту, яка була створена Facebook в 2015 році. З її допомогою можна визначити прямокутні області, які містять текст, а потім провести розпізнавання і переведення картинки в текст. Крім фотографій і мемів, нейромережа також здатна покадрово сканувати відеоролики.

«Текст, витягнутий з зображень, використовується в різних моделях навчання на верхньому рівні, таких як ті, які покращують якість пошуку фотографій, автоматично ідентифікують контент, який порушує нашу політику ненависті на платформі різними мовами і підвищує точність класифікації фотографій в новинній стрічці», – відзначили в Facebook.

Розпізнавання тексту алгоритмами зі штучним інтелектом не є принципово новим кроком – робити це вміють багато існуючих програм, проте жодна з них не здатна впоратися з такими обсягами контенту, які пропонує Facebook.

За словами розробників, Rosetta, зможе розпізнавати меми та допоможе модераторам зрозуміти їх зміст. Автори технології вважають, що вона в перспективі допоможе ідентифікувати спам або образливий контент. Разом з цим вони визнають, що алгоритм потребує свого вдосконалення.

«Моделі розпізнавання тексту переважно зосереджені на наборах даних англійською мовою або з використанням латинки. Для підтримки глобальної платформи ми продовжуємо інвестувати в розширення моделі розпізнавання тексту для широкого числа мов, які використовуються в Facebook. З єдиної моделлю для великої кількості мов ми ризикуємо опинитися посередніми для кожної мови, що ускладнює завдання», – зізнаються розробники

Нагадаємо, раніше Facebook оголосила про запуск міжнародного відеосервісу.

Syla.news

Коментувати

371 огляди
cool good eh love2 cute confused notgood numb disgusting fail

Copyright © 2018 syla.news. Згідно статті 26 Закону України "Про інформаційні агентства" право власності на продукцію інформаційного агентства охороняється чинним законодавством України.

up