European Union

Процедура BG05M2OP001-1.002 „Изграждане и развитие на центрове за компетентност“

Оперативна програма „Наука и образование за интелигентен растеж“ 2014 – 2020

Проект BG05M2OP001-1.002-0002

„Дигитализация на икономиката в среда на Големи данни (ДИГД)“

Начало на проекта: 30.03.2018 / Край на проекта: 11.2023

ЦК-ДИГД

Център за компетентност по „Дигитализация на икономиката в среда на Големи данни“ (ЦК-ДИГД)


Центърът за компетентност по „Дигитализация на икономиката в среда на Големи данни“ (ЦК-ДИГД) е ИКТ комплексна инфраструктура с интегрирани научноизследователски организационни структури и със специален фокус върху прилагане на научните резултати в различни бизнес области. Научноизследователският комплекс е базиран върху съвременни научни и технологични световни достижения, международни и индустриални стандарти, и най-добри бизнес практики, чрез използване на интегрираните технологии.




Инфраструктурата на ЦК-ДИГД се базира на интегрирано преливане между цифровизирани бизнес процеси и обработка на Големи данни – процес, изграден върху ИКТ ресурси на самия Център. Изграждането на функционалности за обработка на големи данни при дигитализиране на бизнес процеси се основава на възможностите за вграждане и предлагане на изследване и анализ на добри световни практики. 


Концептуална ИКТ архитектура на ЦК-ДИГД





От гледна точка на работа с големи данни, ЦК-ДИГД изгражда Хранилище за данни (Data Lake), базирано на  Система за големи данни Hadoop в централизиран и разпределен вид, както и на  система за управление на съдържанието (CMS), управляваща също неструктурирани данни.

Изгражда се централизирана Hadoop система с обем над 4,5 Petabytes, като в партньорите-университети на ЦК-ДИГД са инсталирани множество сървъри, служещи както за изграждане на децентрализирани Hadoop системи, така и за разпределена Hadoop система, увеличаваща обема на централизираната система, а също и предоставяща възможност за регионално-департаментно функциониране и защита на данни.

Предвидени са специални средства за защита, които да осигурят надеждност на различни потребителски и изследователски данни и процеси, като е обърнато внимание на 8 нива на информационна сигурност:

  • Идентифициране на потребители чрез име и парола
  • Централизирано автентикиране на потребителите чрез използване на LDAP сървър (например MS Active Directory)
  • Централизирано автентикиране на потребителите чрез използване на Kerberos server на Hadoop системата
  • Създаване на права на достъп до процеси и сегментиране на данните за отделен потребител
  • Създаване на контрол на достъпа на потребители до HDFS файлове и директории
  • Създаване на централизиран лист за управление на достъпа до Hadoop клъстера
  • Създаване на механизъм за пълен одит – данните от къде са дошли и за какво са били използвани, кой потребител прави опити за достъп до данни и задачи и от кой IP адрес
  • Защитна стена с IPS

От гледна точка на предоставяне на възможност за създаване на процеси с Изкуствен интелект върху данни от Hadoop, се предвиждат средства за Machine learning, съществуващи в екосистемата на Hadoop (Spark) и средства за Deep learning посредством включване на MS SQL Server, обработващ данни от Hadoop посредством функцията си PolyBase.

Предвижда се специален фокус върху работа с NoSQL бази данни.

Дигитализацията на икономическите процеси се предвижда да се извършва чрез 2 групи системи – ERP системи и Системи за управление на бизнес процеси и тяхното дигитализиране (Business process management – BPM):

  • Изграждат се два вида ERP системи – ERP базирана на Oracle EBS, предназначена за големи и средни предприятия, и ERP базирана на Windows-базирани продукти, предназначени за микро и малки предприятия.
  • Изграждате се две Системи за ВРМ – едната е със сложни и комплексни функции и  е предназначена за големи и средни предприятия, а другата е предназначена за микро и малки предприятия.

ERP системата и ВРМ системата могат да се представят като Системи за иновативна дигитализация за микро и малки предприятия.

Предвидена е интеграция на Hadoop системата с различни бази данни - Бази данни на основата на Oracle БД и Бази данни на основа на Microsoft SQL Server. По този начин се получава интеграция на структурирани данни, разположени в Релационни бази данни, и на неструктурирани данни, разположени в Hadoop, осигурявайки интеграция на всяка от двата типа ERP системи с Hadoop системата за големи данни. От друга страна, интеграцията на Hadoop системата с MS SQL server (работещ в Windows и Linux среди) дава възможност за изграждане на системи с произволна форма на дигитализация, даже стартиращи от начално ниво и изпълнима както в Windows, така и в Linux среди. За провеждане на самостоятелни анализи на големи данни могат да се използват: средствата на екосистемата на Hadoop системата; на Oracle системите за анализ (данните от Hadoop стават видими за Oracle ERP системата); и на специално предвиденият за инсталиране статистически продукт, който работи с директни данни от Hadoop система. 

Инфраструктурата на ЦК-ДИГД ще бъде достъпна както на принципите на хостинг услугите, така и чрез облачни услуги (ЦК-ДИГД се изгражда като частен облак).

ЦК-ДИГД ще предлага следните възможности за национално и интернационално използване:

  • Опериране на Системи за дигитализация на бизнес процеси с данни, разположени в многопрофилно Хранилище за данни (Data Lake) със структурирани и неструктурирани данни, чрез облачна и/или хостинг инфраструктура с достъп както от страната на високоскоростни мрежи, така и от Интернет, от точки както в България, така в чужбина
  • Провеждане на изследвания за дигитализация на икономически бизнес процеси в среда на Големи данни
  • Предлагане на научноизследователски и системни научно-приложни услуги
  • Възможност за външни потребители на облачна / хостинг инфраструктура да присъединяват свои изчислителни ресурси като временни виртуални ресурси на ЦК-ДИГД инфраструктурата, за да използват централизирани и свои данни за изследване (структурирани, полу-структурирани и неструктурирани данни, данни от Internet of Things устройства и др.)
  • Използване на Облачната инфраструктура за съхранение на свои Големи данни от външни потребители
  • Разработване на иновативни методи за събиране и обработка на Големи данни
  • Развитие на технологии за дигитализация на бизнес процеси в основни икономически области


Централна част на изградената инфраструктура (разположена в УНСС)




Изследователи и експерти към ЦК-ДИГД

Към ЦК-ДИГД са разкрити над 70 позиции за изследователи и експерти за управление, които са заети от специалисти и преподаватели от партньорите - 5 Университета (УНСС, ПУ „Паисий Хилендарски“, ТУ Габрово, ИУ Варна, РУ „Ангел Кънчев“) и институт ИИКТ на БАН.


Процес на изграждане на ЦК-ДИГД

Проектът е на стойност 13 333 868,86 лв., от които 75% са предназначени за инфраструктура, като до момента усвоените и включени в работа компоненти са на стойност около 70% от средствата на проекта. Проектът е с продължителност до м. ноември 2023 година. Предвидено е и се създават условия, ЦК-ДИГД с неговата инфраструктура и изследователи, да продължат след 2023 година, като се създават предпоставки за неговото организационно позициониране в икономическия свят. 

  • Съществуват определени насоки от ЕК / JRC за насочване на центровете по компетентност за участие в проекти в следващата програмна рамка.
  • Започна процесът на привличане на бизнес фирми, които да използват създадената научна инфраструктура.
  • Допълнително мотивиране за бизнес инициативи се предвижда чрез изграждане на Startup и Spinoff компании, които да предлагат гъвкавост, динамичност и стабилитет на използване на изградената инфраструктура и да формират бизнес насоченост чрез специализирана експертиза.

Към момента (15.3.2021) са изградени, са в процес на пускане, или са в процес на обявяване за изграждане, следните компоненти на ЦК-ДИГД:

  • Завършени са всички строително-монтажни дейности за изграждане на Център за данни на ЦК-ДИГД, разположен в УНСС и отговарящ на международните стандарти за дейтацентър;
  • Завършено е придобиването на необходимите хардуерни елементи на центъра и за основните изследователи работещи по създаването на ЦК-ДИГД – централизираната част и тези в отделните партньори;
  • Изградена е централизираната система Hadoop работеща под управление на софтуера на Cloudera, която система се състои от Производствена Hadoop система и Прототипно-тестова-разработваща Hadoop система. Производствената система е изградена на базата на около 40 сървъра всеки от тях с множество процесори, 128 GB RAM и множество дискови масиви, с използване на високоскоростни връзки от типа на 10Gbps, 40Gbps и 100Gbps;
  • В процес на завършване е създаването на ERP системата на базата на Oracle продуктите, която ще бъде интегрирана със системата Hadoop. Предвижда се нейното завършване да стане до края на м. март 2021 година;
  • Изградена е първоначална-прототипна връзка на ЦК-ДИГД с Интернет, използвайки 1Gbps връзка;
  • Обявена е обществена поръчка за създаване на  Национална специализирана високоскоростна мрежа за интегриране между партньорите и за обслужване на IoT устройства, която да осигурява MAN достъп със скорост 10Gbps, WAN достъп и достъп на IoT устройства от Национална LoRaWAN мрежа, от интернационална LoRaWAN мрежа и от устройства свързани в GSM мрежа. Очаква се тази обществена поръчка да завърши до края на 2021 година;
  • Обявена е обществена поръчка за създаване на Система за Управление на Бизнес Процеси (Business Process Management - BPM) за големи и средни предприятия. Очаква се тази обществена поръчка да завърши до края на 2021 година;
  • Предстои в рамките на няколко месеца обявяването на обществена поръчка за Система за иновативна дигитализация включваща Система за проектиране и изпълнение на бизнес процесите за микро и малки предприятия. Очаква се тази обществена поръчка да завърши до края на 2021 година;
  • Предвижда се хардуерно-софтуерно и системно интегриране на инфраструктурните компоненти в 5-те партньора на проекта до 2022 г.;
  • Предвижда се хардуерно оптимизиране на инфраструктурата с оглед увеличаване на бързодействието до края на 2022 година;
  • Предвижда се софтуерно оптимизиране и добавяне на нови статистически софтуерни системи, системи за анализ на Големи данни и комплексни ИКТ решения за работа с Големи данни до м. ноември 2023 г.

Научноизследователска и развойна дейност

В рамките на научноизследователската дейност по проекта до момента са разработени следните услуги на ЦК-ДИГД:

Базови научноизследователски услуги:

  • Стратегии за дигитализация в избраните 8 бизнес области: Счетоводство и управление на активите; Финансово управление; Логистика, транспорт, снабдяване и Управление веригите на доставки и на услуги (SCM); Маркетинг, продажби, управление на поръчките и управление отношенията с клиенти (CRM); Управление на човешките ресурси; Управление на недвижими имоти (икономика на строителството); Управление на производство; и Управление и организация на IoТ и управление на склад;
  • Услуги за дигитализация на бизнес процеси в избраните 8 бизнес области: Счетоводство и управление на активите; Финансово управление; Логистика, транспорт, снабдяване и Управление веригите на доставки и на услуги (SCM); Маркетинг, продажби, управление на поръчките и управление отношенията с клиенти (CRM); Управление на човешките ресурси; Управление на недвижими имоти (икономика на строителството); Управление на производство; и Управление и организация на IoТ и управление на склад;
  • Услуги за избор на ИКТ продукти
  • Услуги за предоставяне на ресурсите на ЦК-ДИГД

Създаване на ИКТ прототипни продукти:

  • Проектиране на хардуерни системи, свързани с обработка на големи данни
  • Проектиране на методи, модели и алгоритми за обработка на големи данни