Cheatsheet 2
Oke, ini cheat-sheet Python (pandas) buat subset, grouping, dan filtering — dari paling dasar sampai yang sering dipakai di data real. Contohnya aku sesuaikan dengan data kamu (provinsi, kab, gender, dll).
1️⃣ SUBSET (ambil sebagian data)
a) Subset kolom
b) Subset baris (index-based)
c) Subset baris + kondisi
2️⃣ FILTER (kondisi logika)
a) Filter satu kondisi
b) Multiple kondisi (&, |)
⚠️ WAJIB pakai tanda kurung!
c) Filter dengan isin
d) Filter string (contains, startswith)
e) Filter angka
3️⃣ GROUPING (ringkas data)
a) Group by satu kolom
Sama dengan:
b) Group + agregasi
c) Group by multiple kolom
d) Banyak agregasi sekaligus
4️⃣ SUBSET + GROUP + FILTER (REAL CASE)
❓ Jumlah kelompok per provinsi, hanya yang > 1000
❓ Distribusi gender per provinsi
❓ Kelompok perempuan di Jawa Barat
5️⃣ FILTER DENGAN query() (lebih readable)
Dengan in:
6️⃣ GROUP + FILTER (HAVING-style)
Contoh: provinsi dengan ≥ 100 kelompok perempuan
7️⃣ Best practice (penting banget)
✔️ Jangan lupa normalisasi dulu
✔️ Hindari chained indexing
❌
✔️