Membuat Desain Datawarehouse dengan MS SQL 2005

Posted on December 23, 2007

Beberapa praktisi di bidang teknologi Business Intelligence mengutarakan sebuah fakta bahwa hampir 80% kesalahan fatal dari pengembangan sebuah proyek BI / datawarehouse adalah kesalahan assessment kebutuhan dan desain dari star schema. Star schema sendiri merupakan sebuah desain standard di teori datawarehouse untuk membuat sebuah database siap dijadikan menjadi Cube atau bentuk MultiDimensional Database. Beberapa kaidah yang perlu diperhatikan dalam membuat desain datawarehouse adalah sebagai berikut :

  1. Apakah di dalam 1 database star schema akan dipakai oleh lebih dari 1 buah fokus bisnis proses. Fokus bisnis proses itu merupakan sebuah proses pekerjaan yang akan kita ukur pekerjaannya contohnya adalah sales, purchasing, human resource, production dan masih banyak lainnya. Jika nantinya di dalam sebuah star schema design akan menggunakan lebih dari 1 fokus bisnis proses berarti kita harus mempersiapkan tabel - tabel dimension yang nanti-nya bisa digunakan untuk semua proses fokus bisnis.
  2. Kebutuhan minimal desain 1 buah database star schema adalah terdiri dari minimal 1 buah fact table , 1 measure dan 1 buah dimension table.
  3. Kebutuhan sebuah tabel dimension terhadap surrogate key harus disesuaikan dengan proses bisnis yang mengacu kepada dimension table tersebut.
  4. Keberadaan data yang terdapat didalam dimension table dan fact table harus dijaga dengan menggunakan referential integrity antara dimension tabel dan fact table-nya.

secara umum gambaran dari diagram star schema seperti ini :

Tabel sales yang berada di tengah-tengah itu yang akan menjadi fact table-nya. Kemudian tabel store,time,product,promotion dan customer mereka itulah yang disebut sebagai tabel-tabel dimensi.

Di dalam tulisan ini saya menyajikan contoh pembuatan desain database star schema dengan menggunakan data sumber OLTP-nya menggunakan database AdventureWorks database. Di dalam contoh ini saya menggunakan proses bisnis purchasing yang menggunakan sumber data fact table-nya menggunakan 2 buah tabel yaitu : purchasing.purchasingOrderHeader dan purchasing.purchasingOrderDetail. Hasil desain yang saya buat secara umum mempunyai deskripsi susunan dimension dan fact table dan measure sebagai berikut :

Dimension Table :
dimTime
Year
|- Quarter
|- Month

dimProduct
Category
|- SubCategory
|- Product

dimEmployee (Parent Child Dimension table)
ManagerID
|- EmployeeFullName

dimShipMethod
ShipMethodNamedimVendor
VendorCountry
|- VendorProvince
|- VendorCity
|- VendorName

Fact Table :
Measures :
OrderQuantity
LineTotal
ReceivedQuantity

Berikut desain starschema fisik-nya :

Script database ini bisa di ambil di http://miimlc.metrodata.co.id/forum/files/folders/microsoft_training/entry54.aspx

Sekian dulu tulisan saya tentang pembuatan desain datawarehouse POAdventureWorks, tulisan saya berikut-nya tentang proses ETL (Extraction Transform and Loading) dari adventureworks ke POAdventureworks dengan menggunakan SSIS 2005.

Feel free for your comment.

» Filed Under Database

Comments

2 Responses to “Membuat Desain Datawarehouse dengan MS SQL 2005”

  1. ardhi on May 9th, 2008 3:39 pm

    Mas Sony, aku lagi skripsi tentang data mining nich..
    Boleh minta bantuannya program export table dari excel(*.xls) ke SQL server 2005, program VB.net 2005 kayak apa?
    Thx baget yah..
    Kirim ke email aja..makasih..

  2. Sony on May 9th, 2008 4:45 pm

    Pake SSIS aja (SQL Server Integration Services)-nya SQL 2005.Udah ada tools-nya untuk ambil data dari excel ke SQL 2005.

Leave a Reply




  • About

    I'm not a geek I' just a person who like to share knowledge that I have. Born in Bandung 36 years ago. Right now I'm a free man not belong to any company .