Komponen dan Fitur Data Warehouse
NAMA : MUTIARA NAIBAHO
NPM: 19312060
Komponen
dan Fitur Data Warehouse?
FiFitur data watehouse
·
Berorientasi Subjek
·
Data yang Terintegrasi
·
Data time variant
·
Non Volatile
·
Butiran Data
1.
Berorientasi Subjek.
Data
warehouse terorganisasi di seputar subjek kunci (atau
entitas-entitas peringkat tinggi) dalam perusahaan, Data warehouse adalah
tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek
merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan
manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya.
2.
Terintegrasi
Data
yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan
yang konsisten, format-format, struktur terkodekan, serta
karakteristik-karakteristik yang berhubungan, Sumber data yang ada dalam data
warehouse tidak hanya berasal dari database operasional (internal source)
tetapi juga berasal dari data diluar sistem (external source). Data pada sumber
berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat di-enkode sebagai 0 dan 1
di satu tempat dan ”m” dan ”f” di tempat lain.
Contoh
lain misalnya : Data dari macam-macam aplikasi transaksi (untuk bank
misalnya: tabungan, kredit, rekening koran) semua mengandung data nasabah, ada
yang sama ada yang spesifik (yang sama misalnya: nama dan alamat, yang spesifik
misalnya: untuk kredit ada kolateral, untuk rekening koran ada overdraft)
didalam data warehouse data-data yang sama harus diintegrasikan disatu
database, termasuk misalnya diseragamkan formatnya (sederhana tetapi paling
sering terjadi – aplikasi-aplikasi sering dibeli vendor berbeda, dibuat
dengan/dijalankan di teknologi berbeda-beda)
3.
Memiliki dimensi waktu (Time variant)
Data yang tersimpan dalam
data warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman
bisnis untuk tiap waktu tertentu, Data warehouse menyimpan sejarah (historical
data). Bandingkan dengan kebutuhan sistem operasional yang hampir semuanya
adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting
didalam data warehouse.
Didalam
data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi
terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan
masuk ke data warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi kode pos, maka yang lama dan
yang baru ada semua didalam data warehouse kita. Sekali lagi,
data warehouse yang bagus adalah yang menyimpan sejarah.
4.
Non-volatile
Data yang tersimpan dalam
data warehouse diambil dari system operasional yang sedang berjalan, tetapi
tidak dapat diperbaharui (di-update) oleh pengguna (bersifat ‘hanya-baca),
Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak
akan pernah di update atau dihapus (delete) Terlihat, bahwa keempat
karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu
data warehouse bisa efektif memiliki data untuk mendukung
pengambilan-keputusan. Dan, implementasi keempat karakteristik ini membutuhkan
struktur data dari data warehouse yang berbeda dengan database sistem
operasional.
Data dalam database
operasional akan secara berkala atau periodik dipindahkan kedalam data
warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu,
perbulan, dan lain sebagainya. Sekali masuk ke dalam data warehouse, data
adalah read-only . Pada gambar 2 dibawah ini bisa dilihat bahwa database OLTP
bisa dibaca, diupdate, dan dihapus. Tetapi pada database data warehouse hanya
bisa dibaca.
Komponen dalam Data
Warehouse
1. Gudang
komponen pertamanya adalah gudang itu sendiri. Bentuknya bisa berbeda-beda. jenis bentuk-bentuk itu di antaranya:
- · typical relational database
- · analytics database
- · data warehouse appliance
- · cloud-hosted database
2. Tools untuk
ETL
Komponen kedua dari data warehouse adalah tool ETL. ETL merupakan singkatan dari extract, transform, dan load.
Ia merupakan sebuah proses pengambilan data. Setelah itu, data dimodifikasi formatnya. Pada akhirnya, deretan informasi itu dimasukkan ke data warehouse.Untuk melakukan proses ini, kamu membutuhkan sebuah tool. Nantinya, ia akan memengaruhi waktu, metode, serta tipe modifikasi dari data.
3. Metadata
Metadata merupakan keterangan singkat dalam data. Fungsinya adalah
memberikan konteks agar informasi bisa menjadi lebih jelas.
Sebagai contoh, coba lihat data ini:
Budi 67.000 Rp3.000.000
Kamu tentu bingung, apa maksud dari data
tersebut? Nah, dengan metadata, semuanya jadi lebih mudah
dipahami. Misalnya:
Nama pelanggan: Budi
Jumlah pesanan: 67.000
Total pembayaran: Rp3.000.000
Selain konteks data, metadata juga
memuat:
- · Sumber data
- ·
berapa kali data diubah
atau di-reload dari sumber
- ·
transformasi atau
modifikasi dalam proses ETL
- ·
dan lain-lain
4. Tools untuk
akses
Coba bayangkan, ada banyak data yang berjejer di
gudang data. Deretan angka dan huruf ini tentu membuatmu bingung.
Lantas, bagaimana cara membaca dan menganalisis
semuanya? Apakah kamu melihat dan mencari semuanya, satu per satu?
Tentu saja tidak. Proses itu takkan efisien.
Nah, tools akses data warehouse adalah solusi
masalah ini.
Lewatnya, kamu mengabaikan banyak data yang tak
perlu di back end. Hanya ada berbagai data yang kamu butuhkan
di front end alias tool akses.
Misalnya, kamu mencari nama pelanggan. Kamu
tinggal memilih menu “Customer Name” di tool akses.
Ada beberapa jenis tool yang
bisa dipilih, di antaranya adalah:
- ·
query dan reporting
- · data mining
- ·
tools untuk OLAP
- ·
pengembangan aplikasi
sendiri
·
5. Manajemen gudang data
Dengan perannya yang penting dan isinya yang
kompleks, harus ada pihak yang mengelola gudang data.
Hal-hal yang harus dipikirkan dalam mengelola
gudang itu di antaranya:
- ·
keamanan
- ·
pembaruan data
- ·
pemilihan prioritas
tugas
- ·
menjaga kualitas gudang
data
- ·
mengatur backup dan disaster
recovery jika terjadi hal yang tak diinginkan
- ·
dan lain-lain
Komentar
Posting Komentar