Central System of UMKM (CSU): Optimizing National Economic Recovery through Integrated Data Science (K-Means Clustering, Naive Bayes, MBA)
1. Executive Summary & Problem Context
Pandemi Covid-19 memberikan pukulan telak bagi perekonomian Indonesia, menyebabkan kontraksi Produk Domestik Bruto (PDB) sebesar 5.32% pada tahun 2020. Merespons hal ini, pemerintah meluncurkan program Pemulihan Ekonomi Nasional (PC-PEN). Namun, ironisnya, realisasi anggaran khususnya untuk klaster dukungan UMKM seringkali tidak optimal. Data menunjukkan bahwa pada tahun 2021, penyerapan anggaran hanya mencapai 71.5%.
Figure 1. Data Gap: Perbandingan Alokasi vs Realisasi Anggaran PC-PEN (Sumber: BPS)
Masalah utamanya adalah disconnectivity (ketidaterhubungan). Bantuan tersedia, namun data calon penerima seringkali tidak valid, penyaluran tidak tepat sasaran, dan UMKM kesulitan mengakses pasar serta permodalan. Proyek ini mengusulkan Central System of UMKM (CSU), sebuah ekosistem digital terintegrasi yang menghubungkan 5 pilar ekonomi: UMKM, Masyarakat, Pemberi Modal, Pemerintah, dan Akademisi.
Figure 2. Arsitektur Ekosistem Terintegrasi CSU
2. Technical Implementation: Data-Driven Features
Untuk menjawab hal tersebut, saya mengimplementasikan tiga modul utama berbasis data menggunakan bahasa pemrograman R (RStudio):
A. Smart Funding System (Fitur U-Fund)
- Objective: Mengotomatisasi proses Credit Scoring untuk menentukan kelayakan UMKM menerima bantuan pemerintah atau pinjaman bank atau pemberi modal lainnya, hal ini juga dilakukan agar meminimalisir risiko kredit macet.
- Methodology: Supervised Learning menggunakan algoritma Naive Bayes Classifier (Library: e1071).
- Process:
- Mengintegrasikan data profil usaha, laporan keuangan, dan riwayat pinjaman.
- Melakukan perhitungan probabilitas posterior untuk dua kelas target: "Layak" vs "Tidak Layak".
- Untuk atribut numerik (seperti omzet/besar pinjaman), digunakan pendekatan Distribusi Gaussian untuk menghitung likelihood.
- Outcome: Sistem dapat memfilter pengajuan secara otomatis sebelum diverifikasi manual, meningkatkan efisiensi penyaluran dana.
B. Market Intelligence (Fitur U-Product)
- Objective: Meningkatkan volume penjualan UMKM melalui strategi cross-selling dan product bundling yang berbasis data transaksi riil.
- Methodology: Association Rule Mining menggunakan Algoritma Apriori (Library: arules).
- Process:
- Menganalisis pola transaksi belanja konsumen untuk menemukan hubungan antar-item (If buy A, then buy B).
- Menetapkan metrik evaluasi: Support (frekuensi kemunculan), Confidence (kuatnya hubungan), dan Lift (validitas korelasi).
- Simulasi data menunjukkan adanya strong rules, contoh: Konsumen yang membeli Butter & Yogurt memiliki probabilitas tinggi untuk membeli Whole Milk.
Figure 4. Top Association Rules (Strong Rules) berdasarkan nilai Lift Ratio tertinggi
- Outcome: Rekomendasi paket produk yang presisi bagi UMKM untuk menyusun strategi promosi yang efektif.
C. HR Analytics & Talent Segmentation (Fitur U-Job)
- Objective: Membantu UMKM yang seringkali tidak memiliki tim HRD untuk menyeleksi pelamar kerja secara efisien berdasarkan kualifikasi.
- Methodology: Unsupervised Learning menggunakan K-Means Clustering (Library: factoextra).
- Process:
- Data Preprocessing: Melakukan transformasi data kategorik (Pendidikan, Pengalaman) menjadi numerik.
- Menghitung jarak antar data pelamar menggunakan Euclidean Distance.
- Mengelompokkan pelamar ke dalam Cluster berdasarkan kemiripan profil (misal: Cluster 1 untuk "Fresh Graduate High Potential", Cluster 2 untuk "Experienced").
Figure 5. Visualisasi Cluster Pelamar Kerja (K-Means Output)
- Outcome: Efisiensi proses rekrutmen UMKM dengan langsung menyasar kandidat dari cluster yang paling relevan.
3. Strategic Value & Impact
Berdasarkan analisis SWOT, kekuatan utama CSU terletak pada integrasi data hulu-ke-hilir. Tidak seperti aplikasi marketplace biasa, CSU memanfaatkan data perilaku (transaksi), data finansial, dan data demografis untuk menciptakan siklus ekonomi yang tertutup (closed-loop economy).
Tools & Technologies Used:
R Language
Naive Bayes (e1071)
Apriori (arules)
K-Means (factoextra)
Catatan Penulis: Halaman ini memuat Executive Summary (Ringkasan Eksekutif) dari proyek ini. Untuk melihat analisis mendalam, metodologi lengkap, dan detail teknis (Full Paper), silakan akses dokumen PDF melalui tombol di bawah ini.
📄 Baca Full Paper (PDF)Project ini merupakan demonstrasi bagaimana Sains Data dapat diterapkan pada masalah makro-ekonomi (Government Tech) untuk memberikan dampak nyata bagi sektor riil. Project ini diajukan dalam perlombaan Satria Data 2022.

Post a Comment