Komponen dan Fitur Data Warehouse

 NAMA : MUTIARA NAIBAHO

NPM: 19312060

Komponen dan Fitur Data Warehouse?

 

FiFitur data watehouse

·         Berorientasi Subjek

·         Data yang Terintegrasi

·         Data time variant

·         Non Volatile

·        Butiran Data

 

 

1. Berorientasi Subjek.

Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi) dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya.



2. Terintegrasi

Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data pada sumber berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat di-enkode sebagai 0 dan 1 di satu tempat dan ”m” dan ”f” di tempat lain.

Contoh lain misalnya : Data dari macam-macam aplikasi transaksi (untuk bank misalnya: tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada yang spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk kredit ada kolateral, untuk rekening koran ada overdraft) didalam data warehouse data-data yang sama harus diintegrasikan disatu database, termasuk misalnya diseragamkan formatnya (sederhana tetapi paling sering terjadi – aplikasi-aplikasi sering dibeli vendor berbeda, dibuat dengan/dijalankan di teknologi berbeda-beda)

3. Memiliki dimensi waktu (Time variant)

Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse.

Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi kode pos, maka yang lama dan yang baru ada semua didalam data warehouse kita. Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah.

 

4. Non-volatile

Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat ‘hanya-baca), Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem operasional.

Data dalam database operasional akan secara berkala atau periodik dipindahkan kedalam data warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan, dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada gambar 2 dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi pada database data warehouse hanya bisa dibaca.



 

Komponen dalam Data Warehouse

1. Gudang



komponen pertamanya adalah gudang itu sendiri. Bentuknya bisa berbeda-beda. jenis bentuk-bentuk itu di antaranya:

  • ·        typical relational database
  • ·        analytics database
  • ·        data warehouse appliance
  • ·        cloud-hosted database

2. Tools untuk ETL



Komponen kedua dari data warehouse adalah tool ETL. ETL merupakan singkatan dari extracttransform, dan load.

Ia merupakan sebuah proses pengambilan data. Setelah itu, data dimodifikasi formatnya. Pada akhirnya, deretan informasi itu dimasukkan ke data warehouse.Untuk melakukan proses ini, kamu membutuhkan sebuah tool. Nantinya, ia akan memengaruhi waktu, metode, serta tipe modifikasi dari data.

3. Metadata



Metadata merupakan keterangan singkat dalam data. Fungsinya adalah memberikan konteks agar informasi bisa menjadi lebih jelas.

Sebagai contoh, coba lihat data ini:

Budi 67.000 Rp3.000.000

Kamu tentu bingung, apa maksud dari data tersebut? Nah, dengan metadata, semuanya jadi lebih mudah dipahami. Misalnya:

Nama pelanggan: Budi

Jumlah pesanan: 67.000

Total pembayaran: Rp3.000.000

Selain konteks data, metadata juga memuat:

  • ·      Sumber data
  • ·         berapa kali data diubah atau di-reload dari sumber
  • ·         transformasi atau modifikasi dalam proses ETL
  • ·         dan lain-lain

4. Tools untuk akses



Coba bayangkan, ada banyak data yang berjejer di gudang data. Deretan angka dan huruf ini tentu membuatmu bingung.

Lantas, bagaimana cara membaca dan menganalisis semuanya? Apakah kamu melihat dan mencari semuanya, satu per satu?

Tentu saja tidak. Proses itu takkan efisien. Nah, tools akses data warehouse adalah solusi masalah ini. 

Lewatnya, kamu mengabaikan banyak data yang tak perlu di back end. Hanya ada berbagai data yang kamu butuhkan di front end alias tool akses.

Misalnya, kamu mencari nama pelanggan. Kamu tinggal memilih menu “Customer Name” di tool akses.

Ada beberapa jenis tool yang bisa dipilih, di antaranya adalah:

  • ·         query dan reporting
  • ·         data mining
  • ·         tools untuk OLAP
  • ·         pengembangan aplikasi sendiri

·       

5. Manajemen gudang data


Dengan perannya yang penting dan isinya yang kompleks, harus ada pihak yang mengelola gudang data.

Hal-hal yang harus dipikirkan dalam mengelola gudang itu di antaranya:

  • ·         keamanan
  • ·         pembaruan data
  • ·         pemilihan prioritas tugas
  • ·         menjaga kualitas gudang data
  • ·         mengatur backup dan disaster recovery jika terjadi hal yang tak diinginkan
  • ·         dan lain-lain


 

 


Komentar

Postingan populer dari blog ini

Jelaskan tentang snowflake schema dalam data warehouse

jelaskan tentang star schema dalam data warehouse