Kluczowa różnica: Data Mining to w rzeczywistości analiza danych. Jest to komputerowy proces przeszukiwania i analizowania ogromnych zbiorów danych, które zostały skompilowane przez komputer lub zostały wprowadzone do komputera. Magazyn danych jest procesem gromadzenia informacji lub danych w hurtowni danych. Hurtownia danych to baza danych służąca do przechowywania danych.
Celem eksploracji danych, znanej również jako odkrywanie wiedzy, jest umożliwienie firmom widzenia tych zachowań, trendów i / lub relacji oraz umożliwienie im uwzględnienia ich w decyzjach. Pozwala to firmom podejmować proaktywne, oparte na wiedzy decyzje.
Termin "eksploracja danych" wynika z faktu, że proces eksploracji danych, czyli wyszukiwanie powiązań między danymi, przypomina wydobycie i poszukiwanie materiałów szlachetnych. Narzędzia do eksploracji danych używają sztucznej inteligencji, uczenia maszynowego, statystyk i systemów baz danych do znajdowania korelacji między danymi. Narzędzia te pomagają odpowiedzieć na pytania biznesowe, które tradycyjnie były zbyt czasochłonne do rozwiązania.
Eksploracja danych obejmuje różne etapy, w tym etap analizy wstępnej, aspekty zarządzania bazami danych i danymi, wstępne przetwarzanie danych, rozważania dotyczące modelu i wnioskowania, wskaźniki ciekawości, kwestie dotyczące złożoności, przetwarzanie wykrytych struktur, wizualizację i aktualizacje online.
Celem hurtowni danych jest zapewnienie użytkownikowi elastycznego dostępu do danych. Magazyn danych odnosi się ogólnie do kombinacji wielu różnych baz danych w całym przedsiębiorstwie.
Główną różnicą między hurtownią danych a eksploracją danych jest to, że hurtownie danych to proces kompilowania i organizowania danych w jedną wspólną bazę danych, podczas gdy eksploracja danych jest procesem wyodrębniania znaczących danych z tej bazy danych. Eksploracja danych może być wykonana tylko po zakończeniu hurtowni danych.