Implementation of K-Means Clustering in Gritkost: A Next-Level Housing Concept to Boost Student Grit

Catatan Penulis:
Halaman ini memuat Executive Summary dari esai ilmiah yang diajukan pada kompetisi Statistics Essay Competition (Satria Data 2023). Proyek ini menggabungkan konsep properti (kos) dengan analitik data untuk pengembangan karakter.

📄 Baca Full Paper (PDF)


1. Executive Summary & Problem Context

Menghadapi era Pendidikan 5.0, kemampuan kognitif saja tidak lagi cukup. Mahasiswa membutuhkan kemampuan non-kognitif, salah satunya adalah GRIT (kombinasi antara passion dan kegigihan/perseverance). Angela Lee Duckworth menyatakan bahwa Grit adalah prediktor kesuksesan yang lebih akurat dibandingkan bakat semata.

Namun, banyak mahasiswa belum menyadari tingkat Grit mereka, dan fasilitas tempat tinggal (kos-kosan) saat ini umumnya hanya berfungsi sebagai tempat istirahat tanpa nilai tambah edukatif. Proyek ini mengusulkan Gritkost, sebuah konsep Next Level Boarding House yang tidak hanya menyediakan fasilitas fisik, tetapi juga program pengembangan diri berbasis data.

Kerangka Penelitian Gritkost
Figure 1. Research Framework: Alur Metodologi Pengembangan Gritkost [Image of research framework diagram]

Peran saya dalam proyek ini adalah merancang metode Customer Segmentation menggunakan algoritma Machine Learning untuk mengelompokkan penghuni kos berdasarkan profil psikologis mereka, sehingga program pembinaan dapat dilakukan secara tepat sasaran (Personalized Development Program).

2. Technical Implementation: Unsupervised Learning

Untuk menentukan strategi pembinaan yang tepat, saya melakukan analisis klasterisasi terhadap 135 responden mahasiswa tingkat akhir menggunakan metode K-Means Clustering dengan bantuan software RStudio.

A. Data Collection & Preprocessing

  • Instrument: Menggunakan modifikasi Grit Scale dari Angela Lee Duckworth yang terdiri dari 12 butir pernyataan (6 butir dimensi Konsistensi Minat, 6 butir dimensi Ketekunan Berusaha).
  • Sampling: Teknik Probability Cluster Sampling terhadap 140 responden (5 data dihapus karena missing value saat data cleaning).
  • Transformation: Mengonversi skala Likert (STS s.d SS) menjadi bobot numerik (1-5) untuk keperluan kalkulasi matematis.

B. Modeling Process (K-Means Algorithm)

  • Determination of K: Menggunakan Elbow Method dengan menghitung nilai Sum of Square Error (SSE). Hasil analisis menunjukkan jumlah kluster ideal adalah k = 4.
  • Distance Metric: Menggunakan Euclidean Distance untuk menghitung jarak antara titik data dengan centroid.
  • Iteration: Algoritma melakukan iterasi sebanyak 3 kali hingga posisi centroid stabil dan tidak berubah.
Visualisasi K-Means Clustering
Figure 2. Visualisasi Hasil K-Means Clustering: Persebaran 4 Tipe Karakter Mahasiswa

C. Model Evaluation

Kualitas klaster dievaluasi menggunakan tiga parameter utama:

  • WSS (Within Sum of Squares): Semakin rendah, semakin homogen data dalam satu klaster.
  • BSS (Between Sum of Squares) / TSS (Total Sum of Squares) Ratio: Diperoleh nilai rasio sebesar 0.6795. Nilai yang mendekati 1 menandakan bahwa pengelompokan berhasil merepresentasikan persebaran data dengan baik (terpisah secara signifikan).

3. Business Insight: The 4 Student Personas

Hasil dari K-Means Clustering menghasilkan 4 tipologi mahasiswa yang menjadi dasar penyusunan kurikulum program Gritkost. Penerjemahan hasil statistik ke dalam strategi bisnis adalah sebagai berikut:

Cluster Typology Name Characteristics Recommended Action
1 The Achiever High Passion, High Perseverance Fasilitasi prestasi, jadikan mentor sebaya.
2 The Pivoter Low Passion, Low Perseverance Bantu eksplorasi minat baru & latihan disiplin dasar.
3 The Planner High Passion, Low Perseverance Fokus pada eksekusi dan konsistensi (ketahanan).
4 The Executor Low Passion, High Perseverance Bantu penemuan jati diri & arah tujuan jangka panjang.

Tools & Technologies Used:

R Language (RStudio) K-Means Clustering Data Visualization Statistical Analysis