Тесты цифровой техники

Wild PR

Бум мобильных приложений: как компании адаптируются к новой реальности

09.04.2024
OS Day 2024: «Архитектурные аспекты безопасности операционных систем»

22.05.2024
Национальная бизнес-премия и конференция WOWBIZ за достижения в различных функциях бизнеса: управление финансами, PR и маркетинг, производство, логистика, IT

08.06.2024
South HUB – конференция в формате кэмпа для C-level в ИТ

18.09.2024
10-я конференция по нагрузочному тестированию


	18.04.2024 В Петербурге назвали самых востребованных голосовых помощников Городские голосовые помощники с искусственным интеллектом в 2023 году чаще всего обрабатывали звонки петербуржцев при обращениях в службу «122» и Горо...... 09.04.2024 Цифровой сервис «Развитие территорий» расскажет о работах по благоустройству рядом с домом В Санкт-Петербурге расширился набор цифровых сервисов для жителей. Запущен новый сервис «Развитие территорий», которым можно воспользоваться в городск...... 09.04.2024 Яндекс представил Карты с персональными рекомендациями Яндекс разработал новую технологию персональных рекомендаций. Она умеет подбирать места в городе для пользователей на основе их истории построения мар...... Переход на ITSZ.ru


	18.04.2024 В России на 30% вырос спрос на ИБ-специалистов, умеющих работать с искусственным интеллектом В России провели исследование рынка труда в сфере информационной безопасности. Аналитики выяснили, что спрос на ИБ-специалистов, имеющих навыки работы...... 09.04.2024 Яндекс представил Карты с персональными рекомендациями Яндекс разработал новую технологию персональных рекомендаций. Она умеет подбирать места в городе для пользователей на основе их истории построения мар...... Переход на NNIT.ru

Новости на ITSZ Новости на NNIT

«Инфосистемы Джет» построила Data Lake для НЛМК

(Официальное сообщение компании (пресс-релиз))

Данный материал размещен пользователем сайта. Мнение редакции может не совпадать с мнением автора

09.09.2019 15:51
версия для печати

Эксперты «Инфосистемы Джет» разработали для мирового лидера сталелитейной промышленности систему анализа данных и моделирования (САДиМ), которая отвечает за доступность и качество данных, а также предоставляет инструментарий для вычислений и анализа. Внедренная система уже сейчас позволяет группе НЛМК эффективнее вести разработку цифровых сервисов и моделей машинного обучения для оптимизации производственных процессов.

В цехах и на агрегатах предприятия эксплуатируются десятки систем, которые накапливают и обрабатывают информацию о производственных и технологических процессах. Кроме того, в помещениях установлены десятки тысяч датчиков, которые непрерывно собирают и передают данные. Подразделению Data Science НЛМК требовался удобный инструмент для работы с получаемыми данными под разрабатываемые модели машинного обучения (ML).

Для решения задачи Центр программных решений ИТ-компании «Инфосистемы Джет» совместно с командой НЛМК создали Data Lake емкостью 300 терабайт на базе отечественного дистрибутива распределенной платформы хранения Hadoop. Для решения задач сбора, передачи, трансформации и накопления данных были использованы такие сервисы, как Apache Kafka, Apache NiFi, Apache Hive.

В рамках проекта специалисты запустили регулярную загрузку данных в Data Lake из более чем 70 источников (датчиков, а также MES и АСУ ТП), загрузили исторические данные за последние несколько лет работы предприятия и разработали карты данных технологических и производственных процессов отдельных цехов.

В рамках проекта команда «Инфосистемы Джет» разработала для НЛМК модель унифицированной витрины данных, а также процессы загрузки в неё, реализовала управление мета-данными средствами Apache Atlas (тэгирование, поиск и т.д.), настроила централизованную ролевую модель и её интеграцию с Active Directory. Это дало возможность дата-сайнтистам НЛМК оперативнее получать в Data Lake доступ к нужным им данным.

Для контроля работы Data Lake был также настроен комплексный мониторинг состояния сервисов системы в Zabbix, а также разработаны автотесты для контроля целостности и полноты данных. Для особо важных и уязвимых данных была создана возможность резервного копирования: то есть, в случае непреднамеренного уничтожения данных пользователем их можно будет восстановить.

«Создание озера данных, которое действительно приносит экономическую пользу заказчику – это непростая задача как с технической, так и с организационной точки зрения. И тут дело не только в железе, интеграции и программировании. Очень важна готовность производства собирать и передавать качественные данные, а потом использовать результаты анализа этих данных для принятия производственных решений. В сотрудничестве с коллегами из НЛМК, которые со стороны всех подразделений проявили высокий профессионализм и заинтересованность, нам удалось оперативно создать решение, сделавшее производство действительно цифровым», — подчеркивает Владимир Молодых, директор по разработке и внедрению программного обеспечения «Инфосистемы Джет».

Автор: Кузнецов Никита Сергеевич

Рубрики: Интеграция, ПО

наверх