Analysing the Web

Statistics / Regression Analysis

Dalam statistik , analisis regresi termasuk setiap teknik untuk pemodelan dan menganalisis beberapa variabel, ketika fokusnya adalah pada hubungan antara variabel dependen dan satu atau lebih variabel independen . Lebih khusus, analisis regresi membantu satu memahami bagaimana nilai khas perubahan variabel dependen ketika salah satu dari variabel independen bervariasi, sedangkan variabel independen lainnya yang dilaksanakan tetap. Umumnya, analisis regresi memperkirakan ekspektasi bersyarat dari variabel dependen yang diberikan variabel independen – yaitu, nilai rata-rata dari variabel dependen ketika variabel independen diadakan tetap. Kurang umum, fokusnya adalah pada kuantil , atau parameter lokasi distribusi bersyarat dari variabel dependen yang diberikan variabel independen. Dalam semua kasus, target estimasi merupakan fungsi dari variabel independen yang disebut fungsi regresi. Dalam analisis regresi, juga kepentingan untuk menggambarkan variasi dari variabel dependen sekitar fungsi regresi, yang dapat dijelaskan oleh distribusi probabilitas .

Analisis regresi digunakan secara luas untuk prediksi dan peramalan , dimana penggunaannya bersifat substansial tumpang tindih dengan bidang mesin belajar . Analisis regresi juga digunakan untuk memahami yang antara variabel independen yang berhubungan dengan variabel dependen, dan untuk mengeksplorasi bentuk hubungan ini. Dalam keadaan terbatas, analisis regresi dapat digunakan untuk menyimpulkan hubungan kausal antara variabel independen dan dependen.

Sebuah tubuh besar teknik untuk melakukan analisis regresi telah dikembangkan. Familiar metode seperti regresi linier dan kuadrat terkecil biasa regresi parametrik , dalam fungsi regresi didefinisikan dalam istilah dari jumlah terbatas yang tidak diketahui parameter yang diestimasi dari data . regresi nonparametrik mengacu pada teknik yang memungkinkan fungsi regresi untuk berbaring di suatu tertentu set fungsi , yang mungkin tak terbatas-dimensi .

Kinerja metode analisis regresi dalam praktek tergantung pada bentuk proses data-menghasilkan, dan bagaimana kaitannya dengan pendekatan regresi yang digunakan. Karena bentuk sejati dari proses data-menghasilkan pada umumnya tidak diketahui, analisis regresi sering tergantung sampai batas tertentu untuk membuat asumsi tentang proses ini. Asumsi ini kadang-kadang (tetapi tidak selalu) dapat diuji jika sejumlah besar data yang tersedia. Regresi model untuk prediksi sering berguna bahkan ketika asumsi tersebut cukup dilanggar, meskipun mereka mungkin tidak berfungsi secara optimal. Namun, di banyak aplikasi, terutama dengan kecil efek atau pertanyaan dari kausalitas berdasarkan data observasi , metode regresi memberikan hasil yang menyesatkan.

Web Minning

Web mining adalah ekstraksi pola-pola penting dan bermanfaat namun tersimpan secara implisit pada kumpulan data yang relatif besar pada layanan world wide web. Web mining teridiri atas tiga bagian yaitu: web content mining, web structure mining, dan web usage mining

Web content mining adalah suatu proses otomatis untuk menemukan informasi yang berguna dari dokumen atau data. Pada prinsipnya teknik ini mengekstraksi kata kunci yang terkandung pada dokumen. Isi data web antara lain dapat berupa teks, citra, audio, video, metadata, dan hyperlink. Ada dua strategi yang umum digunakan: pertama langsung melakukan mining terhadap data, dan kedua melakukan pencarian serta mengimprove hasil pencarian seperti layaknya search engine.

Web struncture mining dikenal juga  sebagai web log mining adalah teknik yang digunakan untuk menemukan struktur link dari hyperlink dan membangun rangkuman website dan halaman  web. Salah satu manfaatnya adlah untuk  menentukan pagerank pada suatu halaman web.

Web usage mining adalah teknik untuk mengenali perilaku pelanggan dan struktur web melalui informasi yang diperoleh dari log, click stream, cookies, dan query. Berbagai tool yang sudah ada antara lain WebLogMiner yang melakukan mining terhadap data log. Teknik yang lebih canggih digunakan untuk melakukan OLAP. Manfaat web usage mining adalah untuk kustomosasi halaman berdasarkan profil pengguna, menentukan ketertarikan pelanggan terhadap produk tertentu, dan menentukan target market yang sesuai.

Tahapan Web Minning

tahapan pada web mining dibagi menjadi tiga kelompok yaitu preprocess, process, dan, post process. Tahapan preprocess meliputi data cleaning, transaction identification, integration, dan transformation. Pada tahap process diterapkan sejumlah formulasi statistik antara lain untuk mengurangi jumlah atribut dengan cara membuang atribut yang tidak berpengaruh (information gain). Pada tahap ini dapat juga dilakukan teknik clustering, asosiasi, dan klasifikasi. Pada tahap post processing dilakukan analisis lebih lanjut untuk mengolah hasil mining pada tahapan sebelumnya. Hal ini perlu dilakukan sebab sering sekali hasil yang diperoleh pada tahap process tidak memberikan sesuatu yang dapat digunakan secara langsung, sehingga diperlukan teknik lainnya seperti visualisasi grafik dan analisis statistik lainnya.

Sumber : Wikipedia

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s