Облачный сервис Google облегчает подготовку данных для машинного обучения




07:58 13.03.2017 |   4681



Как утверждают в компании, сервис Dataprep автоматически распознает схемы данных, соединения и аномалии наподобие отсутствующих или дублирующихся значений, не требуя программирования.

Появившийся в облаке Google Cloud сервис Dataprep упрощает задачу предварительной обработки данных для машинного обучения. По словам специалистов Google, он автоматически распознает схемы данных, соединения и аномалии наподобие отсутствующих или дублирующихся значений, не требуя программирования. После анализа Dataprep помогает составить набор правил обработки в формате Apache Streams для импорта в сервисы Google Cloud Dataflow, BigQuery и другие.

Сервис подготовки данных для машинного обучения пользуется им и сам — для выяснения, какие из правил оказываются наиболее полезными для заказчиков.

На конференции Google Cloud Next также было объявлено об улучшении сервиса BigQuery: добавлен механизм Commercial Datasets, позволяющий напрямую загружать для обработки в хранилище информацию с сайтов AccuWeather, Dow Jones, Xignite, HouseCanary и Remine. BigQuery теперь также может опрашивать Bigtable — облачную NoSQL-базу Google для приложений, требующих быстрого доступа к данным.

Еще два объявления — пользователи рекламных сервисов Google смогут отправлять в BigQuery их статистику для анализа; в сервисе Google Cloud SQL помимо PostgreSQL отныне доступны экземпляры MySQL.


Теги: Облачные сервисы СУБД Google Машинное обучение BigQuery
На ту же тему: