Soal-Soal UTS Data Mining Jurusan Teknik Informatika



Jelaskan pengertian datamining dan KDD!

Serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata.

Sebutkan hal-hal yang melatarbelakangi datamining?

Melimpahnya data (overload data) yang dialami oleh berbagai institusi, perusahaan atau organisasi.
Merlimpahnya data ini merupakan akumulasi data transaksi yang terekam bertahun-tahun..
Data–data tersebut merupakan data transaksi yang umumnya diproses menggunakan aplikasi komputer yang biasa disebut dengan OLTP (On Line Transaction Processing).

Sebutkan dan jelaskan manfaat penggunaan datamining?

Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya,  mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing). Data mining juga diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya:
Bagaimana mengetahui hilangnya pelanggan karena pesaing
Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain.
Bagaimana memprediski tingkat penjualan
Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu item.
Bagaimana memprediksi prilaku bisnis di masa yang akan datang
Remote sensor yang ditempatkan pada suatu satelit
Telescope yang digunakan untuk memindai langit
Simulasi saintifik yang membangkitkan data dalam ukuran terabytes
Dari sudut pandang keilmuan
Data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misalnya:

Sebutkan dan jelaskan manfaat secara singkat tahap KDD?

KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut
Pembersihan data dan integrasi data (cleaning and integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database datawarehouse.

Sebutkan dan jelaskan berbagai metode seleksi?

Sampling, adalah seleksi subset representatif dari populasi data yang besar.
Denoising, adalah proses menghilangkan noise dari data yang akan ditransformasikan
Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
Sebutkan dan jelaskan berbagai metode transformasi?
Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
Normalisation, membagi setiap data yang dicentering dengan standar deviasi dari atribut bersangkutan.
Scaling, mengubah data sehingga berada dalam skala tertentu.
Sebutkan dan jelaskan minimal 4 fungsi yang umum diterapkan dalam datamining?
Assosiation, adalah proses untuk menemukan aturan assosiatif antarasuatu kombinasi item dalam suatu waktu
Secuence, hampir sama dengan association bedanya seccuencediterapkan lebih dari satu periode.
Clastering, adalah proses pengelompokan sejumlah data/obyek kedalam kelompok-kelompok data (klaster) sehingga setiap klaster akanberisi data yang saling mirip.
Classification, adalah proses penemuan model atau fungsi yangmenjelaskan atau membedakan konsep atau kelas data, dengan tujuanuntuk dapat memperkirakan kelas dari suatu objek yang labelnya tidakdiketahui.


Berikan 4 contoh dan penjelasan implementasi datamining?


Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik.

Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihatdari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harusditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalahuntuk menambah layanan otomatis khusus untuk transaksi-transaksi yangmasih dilayani secara manual. Dengan demikian jumlah operator penerimatransaksi manual tetap bisa ditekan minimal.

Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru inimenggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis standar.  (www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkinsudah saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi ini untuk mendeteksi aliran dana BLBI.

Asuransi
Australian Health Insurance Commision menggunakan data mining untukmengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil menghemat satu juta dollar per tahunnya. ATentu saja ini tidak hanya bias diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya.

Jelaskan pengetian dari metodologi datamining berikut ini?

Regresi, Adalah fungsi pembelajaran yang memetakan sebuah unsure data ke sebuah variable prediksi bernilai nyata.
Jaringan syaraf tiruan, Adalah jaringan dari sekelompok unit pemroses kecil yang dimodelkan berdasarkan jaringan saraf manusia. JST merupakan sistem adaptif yang dapat merubah strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun internal yang mengalir melalui jaringan tersebut.
Pohon keputusan,  adalah digunakan untuk memodelkan persoalan yang terdiri dari serangkaian keputusan yang mengarah ke solusi. Tiap simpul dalam menyatakan keputusan, sedangkan daun menyatakan solusi.
Algoritma genetika, adalah teknik pencarian yang di dalam ilmu komputer untuk menemukan penyelesaian perkiraan untuk optimisasi dan masalah pencarian. Atau juga dapat disebut kelas khusus dari algoritma evolusioner dengan menggunakan teknik yang terinspirasi oleh biologi evolusioner seperti warisan, mutasi, seleksi alam dan rekombinasi (atau crossover)

Jelaskan pengertian datawarehousing dari inmon dan Poe!

Menurut W.H. Inmon dan Richard D.H., data warehousing adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.
Menurut Vidette Poe, data warehousing merupakan basisdata yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Jelaskan pengertian dari istilah-istilah warehousing berikut ini?
Datamart, adalah Data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisinis tertentu dalam perusahaan.
OLAP, adalah sebuah pendekatan secara cepat menyediakan jawaban-jawaban terhadap kueri analitik yang multidimensi di dalam alam. OLAP adalah bagian dari kategori yang lebih global dari pemikiran bisnis, yang juga merangkum hubungan antara pelaporan dan penggalian data.
Dimention Table, adalah satu kumpulan tabel teman untuk meja fakta.
Fact Table, adalah tabel yang berisi pengukuran tentang meter atau fakta cara bisnis . itu sering ditempatkan pada memusat skema bintang dan dikelilingi oleh tabel ukuran

Jelaskan perbedaan-perbedaan antara data operasional dengan data warehouse?

Data Operasional
Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu
Fokusnya pada desain basisdata dan proses
Berisi rincian atau detail data
Relasi antar table berdasar aturan terkini(selalu mengikuti aturan terbaru)
Data Warehouse
Dirancang berdasar pada subjek-subjek tertentu (utama)
Focusnya pada pemodelan data dan desain data
Berisi data-data history yang akan dipakai dalam proses analisis
Banyak aturan bisnis dapat tersaji antara tabel-tabel

Sebutkan dan jelaskan secara singkat tugas-tugas yang dilakukan data warehouse?

Pembuatan laporan, Pembuatan laporan merupakan salah satu kegunaan data warehousing yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
On-Line Analytical Processing (OLAP), Dengan adanya data warehouse, semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya.
Proses informasi eksekutif, data warehousing dapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehousing segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehousing menjadi target informatif bagi pengguna.


Sebutkan 4 keuntungan menggunakan data warehouse!


Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari basisdata OLTP ke data warehouse
Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Sebutkan dan jelaskan secara singkat tiga jenis dasar sistem data warehouse?
Data Warehouse Fungsional, Data warehouse dibuat lebih dari satu dan dikelompokan berdasar fungsi yang ada di dalam perusahaan seperti fungsi keuangan, marketing dan personalia.
Data Warehouse Terpusta, Sumber data dikumpulkan dalam satu tempat tempat terpusat, kemudian data tersebar ke dalam fungsinya masing-masing sesuai kebutuhan perusahaan.
Data Warehouse Terdistribusi, dalam warehouse ini digunakan gateway yang berfungsi sebagai jemabatan penghubung antara data warehouse dengan workstation yang menggunakan sistem beranek ragam. Jadi dapat perusahaan dapat mengakses sumber data yang berada di luar lokasi perusahaan.


Sebutkan 3 jenis dasar dan kelebihan dari 3 jenis dasar sistem data warehouse!


Data Warehouse Fungsional, yaitu sistem mudah dibangun dengan biaya relatif murah.
Data Warehouse Terpusat, yaitu data benar-benar terpadu karena konsistensinya yang tinggi.
Data Warehouse Terdistribusi,nya yaitu data tetap konsisten karena sebelum data di gunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi.

Sebutkan dan jelaskan komponen dari struktur data warehouse!

Current detail data, data detail yg aktif saat ini
Older detail data, “Merupakan data historis dari curen detail data
Lightly summarized data, merupakan hasil ringkasan dari curen detail data
Highly summarized data, Merupakan hasil ringkasan yang bersifat totalitas
Metadata, data tentang data

 

Sebutkan dan jelaskan 4 tahap awal metodologi dalam perancangan  basis data untuk data warehouse?

Predictive modeling,Adalah untuk membantu model untuk memprediksi suatu nilai yang mempunyai cirri-ciri tertentu.
Association analysis, adalah untuk menghasilkan sejumlah rule yang menjelaskan sejumlah data yang terhubung kuat satu dengan yang lainnya.
Clustering,Adalah untuk mengelompokan data yang sejenis sehingga data yang berada di cluster yang sama mempunyai banyak kesamaan dibandingkan dengan data yang ada di cluster yang berbeda.
Anomaly detection, adalah untuk menemukan anomaly atau outlier yaitu data yang berbeda dengan data-data yang lainnya.

Belum ada Komentar untuk "Soal-Soal UTS Data Mining Jurusan Teknik Informatika"

Posting Komentar

Electric Smart Cars - Rational Reasons and Results When Buying One There are many reasons for buying any electric smart car, hybrid electric or plugin hybrid electric vehicle. The soaring costs of gas is likely the biggest and most pressing issue when considering buying an electric car. The environment and the planet is another concern. Whatever the reason, buying any BEV, PHEV or green planet-friendly automobile instead of that fossil-fuel burning internal combustion engine car, we'll certainly have a positive effect on helping save the planet and save you money as well. In order to make a smart electric car buying decisions, it is important to understand what the different types of electric-powered vehicles, and how smart electric cars work. There are three types of electric assisted vehicle that utilize an electric motor of some kind. The battery electric vehicle (BEV) is as the name suggests-a battery powered vehicle. There is no other power source for the vehicle, no internal combustion engine (ICE) running on gasoline, and therefore the battery must be charged between uses, and will discharge during use until it runs out. At this point the vehicle can no longer run, so you'll need to be near a charging point before you run out of gas, I mean electric juice. Two types of hybrid electric vehicles offer the best of both the electric and the ICE vehicle worlds. The hybrid electric vehicle (HEV) uses an electric motor to either propel the car or to increase the power. Generally the result of this is to extend the distance that it can travel on a tank of fuel, giving the hybrid electric car better fuel economy. Lastly there is the plug-in hybrid electric vehicle (PHEV). This runs in a largely similar way to the HEV but with one major difference-the battery can be plugged into a charging point, in order to completely charge the battery to its maximum capacity. The HEV by comparison can only charge its battery with the current generated by its ICE, or through regenerative breaking (a process in which energy is reclaimed during breaking rather than lost). By fully charging the battery the use of electrical power can be prolonged, and the use of gasoline reduced, making the PHEV the more economical of the hybrid electric vehicles. The drive-train of a BEV is very simple-a battery powers the motor, which propels the electric vehicle. The hybrid electric vehicles will run an ICE and electric motor either in parallel or in series, with both the ICE and electric motor being able to move the electric or hybrid electric vehicle. A capacitor allows energy to be channeled back into the battery too, and in the case of the PHEV a separate charging circuit like that of the BEV is included to separately charge the hybrid electric vehicle. There are two types of battery that are used in BEV, PHEV and HEV cars. Nickel metal hydride batteries are an older technology, and one that suffers from battery degradation more quickly than others. Newer, lithium-ion batteries are far more efficient, as well as longer lasting in both electric and hybrid electric vehicles. They don't suffer from memory formation like nickel metal hydride batteries, and tend to be able to provide more power for the engine than the alternative. Older hybrid electric vehicles may still use lead-acid batteries, but these are generally now considered bad for the environment, and are no longer used. There are pros and cons to making the move to an electric or hybrid vehicle. They are cheaper to run than ICE cars and have good speed, and hybrid electric vehicles have good range too. But the BEV class can run generally for only up to 40-200 miles, leading to what is known as range anxiety. Hybrid electric vehicles overcome by using the ICE as well, giving vastly superior range. Another downside is that the batteries wear out and need replacing. This is an expensive part on the car, and on a BEV the battery failure means that the car will completely fail to run. A hybrid at least has its ICE on which to fall back. However, the overall running costs to the owner are far less than for a vehicle with an ICE. The electric or hybrid electric vehicle has less moving parts and so less chances of failure that needs repair. Fuel efficiency of a hybrid is hugely increased, saving money for every mile driven, and for a BEV is even less as electrical energy is cheaper than gas. One of the biggest benefits to these vehicles is to the planet. Our oil reserves are finite and dwindling, and their continued use in this way further pollutes the environment. Moving to electric or hybrid electric vehicles will drastically reduce the pollutants emitted, and will slow the rate at which our planet's natural resources are exhausted. As far as the economy is concerned, electric and hybrid vehicles could be very positive development. The production of large numbers of these vehicles would require the building or converting manufacturing factories, and the hiring of workers to staff the factories. Claims are often made that our economy is heavily reliant on oil, and that moving away from it would destroy us, but the truth is quite different. By embracing these technologies, our economy can shift its dependence from oil onto alternatives, just as our motoring needs do. An all-electric or hybrid vehicle may cost a little more to insure than a gas vehicle. Though a small saving is possible thanks to the improved risk profile of people who own electric vehicles, other costs are higher. However, repairing electric or hybrid vehicles currently costs more because there are fewer of these vehicles on the road, and because spare parts are less abundant. This increases repair costs, which insurance companies pass on to owners. Savings in running costs can help offset this. Options are varied when considering purchasing one of these cars, giving potential owners a good range of choice when it comes to the power, size and range of their vehicle. The following are currently available or soon to be released, highway ready environmentally-friendly cars. Full details are not available for some of those cars that are not yet on sale. The Nissan Leaf is an all electric car doing 100 miles per charge and up to 90 mph, and starting at $33,720. This is a modern looking car with a reasonable range, and a competitive pricing. The Tesla Roaster is also all-electric, with an incredible 245 miles per charge, 125 mph top speed, and costs starting at $101,500. This is a stunning looking car with an equally stunning performance-and a range like no other electric car. The Smart-ED all-electric model has a 98 mile maximum range, and a top speed of 60 mph. This small car will be perfect for city driving. Starting at $599 a month for a four year lease. Ford's own all electric car-the Ford Focus has yet to be released but is expected to have a range in excess of 100 miles per charge. This car will be available from late 2011, and looks to provide all of the high-tech options that people may want, in a very stylish exterior. Final price and other details have yet to be released. Chevrolet's Volt is a PHEV that is capable of speeds of 100 mph. Fuel economy depends on how often you charge the battery, with official figures released at 60 mpg using gas and electric combined. Prices start at $32,780, giving this a reasonable price tag along with good performance. Toyota's Prius is a PHEV that has an incredible range of 475 miles on a single tank of gas, when using combined gas and the electric motor. Unfortunately, since it won't be available till early 2012 there are no more details regarding performance and pricing. A full hybrid version of the Toyota Prius is also available, with a base price of $23,520. With a combined mileage of 50mpg and a top speed of 112 mph, it has enough power and efficiency for anyone. This is a tried and trusted hybrid car with a good reputation. Ford's Fusion has a hybrid version as well, with a starting price of $19,820. With a 700 mile range per full tank of fuel, and 41 mpg, it is powerful and sleek, and has the range to take you wherever you want to go. The Escalade hybrid from Cadillac is a luxury SUV, and so it's price tag is a little larger, at $74,135. Fuel efficiency is good for an SUV at up to 23 mpg and a range of up to 575 miles per tank. This SUV balances the needs of a larger family with the desire to be a little more environmentally friendly, and does so with incredible style.

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel