# Cheatsheet 2 Oke, ini **cheat-sheet Python (pandas)** buat **subset, grouping, dan filtering** — dari **paling dasar sampai yang sering dipakai di data real**. Contohnya aku sesuaikan dengan data kamu (provinsi, kab, gender, dll). --- # 1️⃣ SUBSET (ambil sebagian data) ## a) Subset kolom ## b) Subset baris (index-based) ## c) Subset baris + kondisi --- # 2️⃣ FILTER (kondisi logika) ## a) Filter satu kondisi ## b) Multiple kondisi (`&`, `|`) ⚠️ WAJIB pakai tanda kurung! --- ## c) Filter dengan `isin` ## d) Filter string (`contains`, `startswith`) --- ## e) Filter angka --- # 3️⃣ GROUPING (ringkas data) ## a) Group by satu kolom Sama dengan: --- ## b) Group + agregasi --- ## c) Group by multiple kolom --- ## d) Banyak agregasi sekaligus --- # 4️⃣ SUBSET + GROUP + FILTER (REAL CASE) ### ❓ Jumlah kelompok per provinsi, hanya yang > 1000 --- ### ❓ Distribusi gender per provinsi --- ### ❓ Kelompok perempuan di Jawa Barat --- # 5️⃣ FILTER DENGAN `query()` (lebih readable) Dengan `in`: --- # 6️⃣ GROUP + FILTER (HAVING-style) Contoh: **provinsi dengan ≥ 100 kelompok perempuan** --- # 7️⃣ Best practice (penting banget) ### ✔️ Jangan lupa normalisasi dulu ### ✔️ Hindari chained indexing ❌ ✔️ --- ## TL;DR (pola paling sering)