米利唐_后腰_乌克兰足球超级联赛_中国竞彩欧赔 - 足球竞彩分析

集團官網
  • 國家級全民數字素養與技能培訓基地
  • 河南省第一批產教融合型企業建設培育單位
  • 鄭州市數字技能人才(碼農)培養評價聯盟

Hadoop數據倉庫的主要特征有哪些?

編輯:云和數據 日期:2023-03-01 17:45

數據倉庫(英語:Data Warehouse,簡稱數倉、DW),是一個用于存儲、分析、報告的數據系統。數據倉庫的目的是構建面向分析的集成化數據環境,分析結果為企業提供決策支持(Decision Support)。

數據倉庫本身并不“生產”任何數據,其數據來源于不同外部系統; 同時數據倉庫自身也不需要“消費”任何的數據,其結果開放給各個外部應用使用。

Hadoop數據倉庫的主要特征有面向主題性、集成性、非易失性和時變性,接下來對這四個特性做詳細介紹。

面向主題性(Subject-Oriented)

主題是一個抽象的概念,是較高層次上企業信息系統中的數據綜合、歸類并進行分析利用的抽象。在邏輯意義上,它是對應企業中某一宏觀分析領域所涉及的分析對象。

傳統OLTP系統對數據的劃分并不適用于決策分析。而基于主題組織的數據則不同,它們被劃分為各自獨立的領域,每個領域有各自的邏輯內涵但互不交叉,在抽象層次上對數據進行完整、一致和準確的描述。

1672394027869_保險性.png

集成性(Integrated)

主題相關的數據通常會分布在多個操作型系統中,彼此分散、獨立、異構。因此在數據進入數據倉庫之前,必然要經過統一與綜合,對數據進行抽取、清理、轉換和匯總,這一步是數據倉庫

建設中最關鍵、最復雜的一步,所要完成的工作有: 要統一源數據中所有矛盾之處;如字段的同名異義、異名同義、單位不統一、字長不一致等等。

進行數據綜合和計算。數據倉庫中的數據綜合工作可以在從原有數據庫抽取數據時生成,但許多是在數據倉庫內部生成的,即進入數據倉庫以后進行綜合生成的。

下圖說明了保險公司綜合數據的簡單處理過程,其中數據倉庫中與“承保”主題有關的數據來自于多個不同的操作 型系統。

這些系統內部數據的命名可能不同,數據格式也可能不同。把不同來源的數據存儲到數據倉庫之前,需要去除這些不一致。

1672394310574_集成性.png

非易失性、非異變性(Non-Volatile)

數據倉庫是分析數據的平臺,而不是創造數據的平臺。我們是通過數倉去分析數據中的規律,而不是去創造修改其中的規律。因此數據進入數據倉庫后,它便穩定且不會改變。

數據倉庫的數據反映的是一段相當長的時間內歷史數據的內容,數據倉庫的用戶對數據的操作大多是數據查詢或比較復雜的挖掘,一旦數據進入數據倉庫以后,一般情況下被較長時間保留。

數據倉庫中一般有大量的查詢操作,但修改和刪除操作很少。

時變性(Time-Variant)

數據倉庫包含各種粒度的歷史數據,數據可能與某個特定日期、星期、月份、季度或者年份有關。當業務變化后會失去時效性。因此數據倉庫的數據需要隨著時間更新,以適應決策的需要。

從這個角度講,數據倉庫建設是一個項目,更是一個過程。

相關內容

搶先一步 鴻蒙(HarmonyOS)應用開發者高級認證 免費考! 適合人群計算機相關專業在校生(技師、中職、高職、本科、研究生)對鴻蒙(HarmonyOS)有興趣的非計算機相關專業在校生目前正在從事移動應用的開發者目前正在從事計算機行業相關的人計算機專業高校老師所有對鴻蒙(HarmonyOS)有興趣的人 培訓方案掌握鴻蒙的核心概念和端云一體化開發、... 什么是Java的多態性(polymorphism)?它有哪些不同的形式? 多態性是Java面向對象編程的一個重要概念,它允許不同的對象以一致的方式響應同一個方法調用,具體表現為對象在運行時可以表現出多個不同的形態。多態性主要有兩種不同的形式:編譯時多態性(靜態多態性)和運行時多態性(動態多態性)。1. 編譯時多態性(靜態多態性):   ... 如何學習和搭建Hadoop開發環境? Hadoop是大數據處理領域的重要平臺,能夠處理和分析大量數據。為了有效地利用Hadoop,我們需要學習其基礎知識,并正確搭建開發環境。下面是詳細的學習和搭建指南。一、學習Hadoop基礎掌握基礎概念和原理Hadoop主要由HDFS和MapReduce兩部分組成。HDFS是分布式文件系統,Ma... UI 設計學習如何進階成為高手 我總結了六種方法,幫助你走出舒適區,提高技能,成長為自信且經驗豐富的UI設計高手一位經驗豐富的 UI 設計師,往往十分看中應用程序界面的吸引力和視覺刺激,確保滿足用戶期望和需求。但是,如果你已經在 UI 設計圈摸爬滾打多年,仍然沒有出色的作品,那你極有可能是因為陷入了一個舒適圈,UI技能一直原... 在Java中Executor和Executors的區別? 在Java中,Executor和Executors都與線程池和并發執行有關,但它們是不同的概念和類。1.ExecutorExecutor是一個接口,位于java.util.concurrent包中,用于表示一個執行任務的執行器。它只定義了一個方法:void execute(Runnable c... String類型的常見命令有哪些? String類型,也就是字符串類型,是Redis中最簡單的存儲類型。其value是字符串,不過根據字符串的格式不同,又可以分為3類:string是普通字符串,int整數類型,可以做自增、自減操作,float浮點類型,可以做自增、自減操作。String的常見命令有:SET:添加或者修改已經存在的...