Sumber : https://dimensionless.in/how-to-train-decision-tree-classifier-for-churn-prediction/

DQLab Telco merupakan perusahaan Telco yang sudah mempunyai banyak cabang tersebar dimana-mana. Sejak berdiri pada tahun 2019, DQLab Telco konsisten untuk memperhatikan customer experience nya sehingga tidak akan di tinggalkan pelanggan.

Walaupun baru berumur 1 tahun lebih sedikit, DQLab Telco sudah mempunyai banyak pelanggan yang beralih langganan ke kompetitior. Pihak management ingin mengurangi jumlah pelanggan yang beralih (churn) dengan menggunakan machine learning.

Pada projek kali ini, akan dilakukan Pemodelan Machine Learning dengan menggunakan data bulan lalu, yakni Juni 2020.

Langkah yang akan dilakukan adalah,

  1. Melakukan Exploratory Data Analysis
  2. Melakukan Data Pre-Processing
  3. Melakukan Pemodelan Machine Learning
  4. Menentukan Model Terbaik

Import Library yang dibutuhkan


Sumber : Google

Machine Learning adalah teknik dimana komputer dapat mengekstraksi atau mempelajari pola dari suatu data, kemudian dengan pola yang telah dipelajari dari data historis, komputer mampu mengenali dan memprediksi trend, hasil atau kejadian di masa mendatang atau dari observasi baru tanpa perlu diprogram secara eksplisit.

Dalam pembuatan model machine learning tentunya dibutuhkan data. Sekumpulan data yang digunakan dalam machine learning disebut DATASET, yang kemudian dibagi/di-split menjadi training dataset dan test dataset.

TRAINING DATASET digunakan untuk membuat/melatih model machine learning, sedangkan TEST DATASET digunakan untuk menguji performa/akurasi dari model yang telah dilatih/di-training.

Teknik atau pendekatan yang digunakan untuk membangun model disebut ALGORITHM


Sumber : Google

Fungsi di SQL

Untuk menjadi analis data, kita perlu tahu soal SQL atau Structure Query Language. SQL ini nantinya akan jadi tools yang membantu dalam menganalisis data perusahaan. SQL ini sangat berguna ketika perusahaan perlu merilis data penjualan tahun lalu. Jadi sangat dibutuhkan analis data untuk mengolahnya menjadi data berbentuk agregasi, bukan lagi raw data.

Fungsi Scalar vs Fungsi Aggregate

Fungsi adalah metode yang digunakan untuk melakukan operasi data di database. Operasi ini bisa berupa kalkulasi numerik seperti sum, count, avg, etc; atau operasi non-numerik seperti string concatenations dan sub-strings. …


Sistem Database Relasional

Sumber : Google

Seluruh sistem digital di dunia saat ini dipastikan menggunakan sistem database dalam menyimpan data yang dimilikinya. Data digital yang disimpan dapat berasal dari data profil pelanggan hingga seluruh transaksi yang dilakukan oleh pelanggan selesai dilakukan.

Untuk mengolah seluruh data ini, terdapat satu konstruksi bahasa standar yang disebut dengan SQL (Structured Query Language).

Dengan standar ini, SQL telah terbukti mampu meningkatkan produktivitas dan memungkinkan berbagai aplikasi yang dibangun dapat “berkomunikasi” dengan baik ke database. SQL bahkan diterapkan di dunia Big Data, sehingga pengadopsian bahasa ini meningkat.

Ini artinya jika Anda ingin berkarir di ranah data, SQL adalah syarat…

Fuji Lestari

I am interested in learning data analyzing.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store