๐Ÿ“˜ Pertemuan 15

Proyek Mini: Analisis Data Nyata

Tujuan Pembelajaran

Setelah pertemuan ini, mahasiswa diharapkan mampu:

  • Mengintegrasikan seluruh kemampuan analisis data
  • Bekerja dalam kelompok untuk menyelesaikan proyek data
  • Melakukan analisis lengkap dari pembersihan hingga interpretasi
  • Mempresentasikan hasil analisis secara profesional
  • Berpikir kritis terhadap data nyata

Rencana Pembelajaran

Konsep Proyek Mini

Pertemuan ini dirancang sebagai proyek akhir mini sebelum UAS. Mahasiswa diminta bekerja dalam kelompok kecil (3โ€“4 orang) untuk menganalisis dataset publik yang lebih besar.

Tujuan pembelajaran: melatih kolaborasi, komunikasi hasil analisis, dan kemampuan berpikir kritis terhadap data nyata.

Manfaat Proyek Kelompok:
Kolaborasi Tim

Belajar bekerja sama dan membagi tugas

Komunikasi

Melatih presentasi dan diskusi hasil

Critical Thinking

Menganalisis data dengan cara berpikir kritis

Project Management

Mengelola waktu dan sumber daya proyek

Tahapan Proyek

Alur Kerja Proyek Mini:
1
Pemilihan Dataset & Tim

Bentuk kelompok 3-4 orang dan pilih dataset sesuai minat

Minggu 1
2
Data Cleaning & Preprocessing

Bersihkan data, tangani missing values, dan format data

Minggu 1-2
3
Exploratory Data Analysis (EDA)

Eksplorasi pola, statistik deskriptif, dan korelasi

Minggu 2
4
Visualisasi Data

Buat grafik informatif menggunakan Matplotlib/Seaborn/Plotly

Minggu 2
5
Interpretasi & Kesimpulan

Tarik insight bermakna dari hasil analisis

Minggu 3
6
Presentasi Hasil

Presentasikan laporan notebook di kelas

Minggu 3

Pilihan Dataset

Contoh Dataset yang Bisa Digunakan:
E-Commerce
  • Data penjualan online
  • Analisis produk terlaris
  • Segmentasi pelanggan
Kaggle
Keuangan
  • Harga saham
  • Analisis return investasi
  • Prediksi tren pasar
Yahoo Finance
Demografi
  • Data penduduk
  • Analisis kesejahteraan
  • Pola migrasi
BPS
Kesehatan
  • Data COVID-19
  • Analisis penyakit
  • Efektivitas vaksin
Kemenkes
๐Ÿ“Œ Sumber Dataset:

Realisasi / Praktik

Contoh Implementasi Proyek:
1. Import Libraries & Load Dataset
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

# Load dataset (contoh: E-Commerce)
df = pd.read_csv('ecommerce_data.csv')
print(df.head())
print(df.info())
2. Data Cleaning
# Cek missing values
print(df.isnull().sum())

# Handle missing values
df['Age'].fillna(df['Age'].median(), inplace=True)
df.dropna(subset=['Customer_ID'], inplace=True)

# Remove duplicates
df = df.drop_duplicates()

# Format kolom tanggal
df['Purchase_Date'] = pd.to_datetime(df['Purchase_Date'])

print(f"Data setelah cleaning: {df.shape}")
3. Exploratory Data Analysis
# Statistik deskriptif
print(df.describe())

# Analisis per kategori
category_sales = df.groupby('Category')['Sales'].sum().sort_values(ascending=False)
print(category_sales)

# Korelasi antar variabel numerik
correlation = df[['Age', 'Sales', 'Quantity']].corr()
print(correlation)
4. Visualisasi Interaktif
# Visualisasi dengan Seaborn
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# Distribusi Penjualan
sns.histplot(df['Sales'], kde=True, ax=axes[0,0], color='skyblue')
axes[0,0].set_title('Distribusi Penjualan')

# Top 10 Produk
top_products = df.groupby('Product')['Sales'].sum().nlargest(10)
top_products.plot(kind='barh', ax=axes[0,1], color='coral')
axes[0,1].set_title('Top 10 Produk Terlaris')

# Penjualan per Kategori
category_sales.plot(kind='pie', ax=axes[1,0], autopct='%1.1f%%')
axes[1,0].set_title('Proporsi Penjualan per Kategori')

# Trend Penjualan Bulanan
monthly_sales = df.groupby(df['Purchase_Date'].dt.to_period('M'))['Sales'].sum()
monthly_sales.plot(ax=axes[1,1], marker='o', color='green')
axes[1,1].set_title('Trend Penjualan Bulanan')

plt.tight_layout()
plt.show()

# Visualisasi interaktif dengan Plotly
fig = px.scatter(df, x='Age', y='Sales', color='Category', 
                 size='Quantity', hover_data=['Product'],
                 title='Analisis Penjualan berdasarkan Usia dan Kategori')
fig.show()
5. Kesimpulan & Insight
# Kesimpulan berdasarkan analisis
insights = """
KESIMPULAN ANALISIS E-COMMERCE:

1. Produk Terlaris:
   - Produk kategori Elektronik mendominasi penjualan (45%)
   - Top 3 produk: Laptop, Smartphone, Tablet

2. Demografi Pelanggan:
   - Rentang usia 25-35 tahun adalah pembeli terbanyak
   - Rata-rata transaksi: Rp 500.000

3. Trend Penjualan:
   - Penjualan meningkat 20% pada bulan 11-12 (periode promo)
   - Penurunan di bulan 2-3 (pasca hari raya)

4. Rekomendasi:
   - Fokus marketing pada segmen usia 25-35 tahun
   - Tingkatkan stok elektronik menjelang akhir tahun
   - Buat program loyalitas untuk meningkatkan repeat purchase
"""
print(insights)

Format Presentasi

Struktur Presentasi (15-20 menit):
  1. Pendahuluan (2 menit)
    • Perkenalan tim
    • Latar belakang masalah
    • Tujuan analisis
  2. Dataset & Metodologi (3 menit)
    • Sumber dan deskripsi dataset
    • Metode pembersihan data
    • Tools yang digunakan
  3. Hasil Analisis (8 menit)
    • Temuan statistik utama
    • Visualisasi data penting
    • Pola dan trend yang ditemukan
  4. Kesimpulan & Rekomendasi (5 menit)
    • Insight utama
    • Rekomendasi actionable
    • Limitasi analisis
  5. Q&A (5 menit)
    • Tanya jawab dengan audiens
โš ๏ธ Tips Presentasi:
  • Gunakan visual yang jelas dan menarik
  • Hindari terlalu banyak teks di slide
  • Sampaikan insight, bukan hanya angka
  • Latihan presentasi sebelum hari H

Kriteria Penilaian

Rubrik Penilaian Proyek Mini:
Aspek Bobot Kriteria
Data Cleaning 15%
  • Handling missing values
  • Menghapus duplikat
  • Format data konsisten
EDA & Analisis 30%
  • Statistik deskriptif lengkap
  • Identifikasi pola & trend
  • Analisis mendalam
Visualisasi 25%
  • Grafik informatif & jelas
  • Variasi jenis visualisasi
  • Estetika & readability
Interpretasi 20%
  • Insight bermakna
  • Rekomendasi actionable
  • Kesimpulan logis
Presentasi 10%
  • Penyampaian jelas
  • Kerja sama tim
  • Menjawab pertanyaan

Semangat Mengerjakan Proyek!

Proyek ini membantu mahasiswa memahami alur kerja penuh data sains dan memperkuat kemampuan analitis sebelum menghadapi UAS.