Cheatsheet 2

Oke, ini cheat-sheet Python (pandas) buat subset, grouping, dan filtering — dari paling dasar sampai yang sering dipakai di data real. Contohnya aku sesuaikan dengan data kamu (provinsi, kab, gender, dll).

1️⃣ SUBSET (ambil sebagian data)

a) Subset kolom

b) Subset baris (index-based)

c) Subset baris + kondisi

2️⃣ FILTER (kondisi logika)

a) Filter satu kondisi

b) Multiple kondisi (`&`, `|`)

⚠️ WAJIB pakai tanda kurung!

c) Filter dengan `isin`

d) Filter string (`contains`, `startswith`)

e) Filter angka

3️⃣ GROUPING (ringkas data)

a) Group by satu kolom

Sama dengan:

b) Group + agregasi

c) Group by multiple kolom

d) Banyak agregasi sekaligus

4️⃣ SUBSET + GROUP + FILTER (REAL CASE)

❓ Jumlah kelompok per provinsi, hanya yang > 1000

❓ Distribusi gender per provinsi

❓ Kelompok perempuan di Jawa Barat

5️⃣ FILTER DENGAN `query()` (lebih readable)

Dengan in:

6️⃣ GROUP + FILTER (HAVING-style)

Contoh: provinsi dengan ≥ 100 kelompok perempuan

7️⃣ Best practice (penting banget)

✔️ Jangan lupa normalisasi dulu

✔️ Hindari chained indexing

❌

✔️

Cheatsheet 1

Cheatsheet 2

1️⃣ SUBSET (ambil sebagian data)

a) Subset kolom

b) Subset baris (index-based)

c) Subset baris + kondisi

2️⃣ FILTER (kondisi logika)

a) Filter satu kondisi

b) Multiple kondisi (`&`, `|`)

c) Filter dengan `isin`

d) Filter string (`contains`, `startswith`)

e) Filter angka

3️⃣ GROUPING (ringkas data)

a) Group by satu kolom

b) Group + agregasi

c) Group by multiple kolom

d) Banyak agregasi sekaligus

4️⃣ SUBSET + GROUP + FILTER (REAL CASE)

❓ Jumlah kelompok per provinsi, hanya yang > 1000

❓ Distribusi gender per provinsi

❓ Kelompok perempuan di Jawa Barat

5️⃣ FILTER DENGAN `query()` (lebih readable)

6️⃣ GROUP + FILTER (HAVING-style)

7️⃣ Best practice (penting banget)

✔️ Jangan lupa normalisasi dulu

✔️ Hindari chained indexing

TL;DR (pola paling sering)

No Comments

Cheatsheet 1

Cheatsheet 2

1️⃣ SUBSET (ambil sebagian data)

a) Subset kolom

b) Subset baris (index-based)

c) Subset baris + kondisi

2️⃣ FILTER (kondisi logika)

a) Filter satu kondisi

b) Multiple kondisi (&, |)

c) Filter dengan isin

d) Filter string (contains, startswith)

e) Filter angka

3️⃣ GROUPING (ringkas data)

a) Group by satu kolom

b) Group + agregasi

c) Group by multiple kolom

d) Banyak agregasi sekaligus

4️⃣ SUBSET + GROUP + FILTER (REAL CASE)

❓ Jumlah kelompok per provinsi, hanya yang > 1000

❓ Distribusi gender per provinsi

❓ Kelompok perempuan di Jawa Barat

5️⃣ FILTER DENGAN query() (lebih readable)

6️⃣ GROUP + FILTER (HAVING-style)

7️⃣ Best practice (penting banget)

✔️ Jangan lupa normalisasi dulu

✔️ Hindari chained indexing

TL;DR (pola paling sering)

No Comments

b) Multiple kondisi (`&`, `|`)

c) Filter dengan `isin`

d) Filter string (`contains`, `startswith`)

5️⃣ FILTER DENGAN `query()` (lebih readable)