16:45 02.10.2013 |   1056



Больше десяти лет ученые Массачусетского технологического института разрабатывали технологию анализа текстов, способную понимать тонкости языка, — аллюзии, жаргон, термины культуры, сокращения и метафоры, которыми насыщено онлайн-общение.

Luminoso - МТИ
Источник: MIT News Office

Больше десяти лет ученые Массачусетского технологического института разрабатывали технологию «здравомыслящего» анализа текстов, способную понимать тонкости языка, — аллюзии, жаргон, термины культуры, сокращения и метафоры, которыми насыщено онлайн-общение.

В 2010 году технологию было решено коммерциализовать, когда появились заказчики, которым она понадобилась для анализа высказываемых в Интернете мнений об их продукции. Ученые основали компанию Luminoso Technologies, и сегодня она предлагает систему, которая оперативно анализирует огромные объемы текста из Интернета и с помощью базы энциклопедических знаний выясняет тематику высказываний и выражаемые мнения.

Всего за несколько лет Luminoso обзавелась крупными клиентами, включая BP, Mars и Scotts. База знаний для технологии составляется с помощью краудсорсингового проекта Open Mind Common Sense. Его участники, — рядовые пользователи Интернета, — заносят в базу сведения: определения, взаимосвязи слов и простые истины вроде «солнце — горячее».

Система по контексту понимает, в каком из значений употребляются многозначные слова и способна, например, автоматически отобразить в виде облака слов все особенности, которые покупателям некоторого товара нравятся или не нравятся в нем.


Теги: