from google.colab import files

import pandas as pd
import numpy as np
import seaborn as sns                       #visualisation
import matplotlib.pyplot as plt             #visualisation
import pickle

from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler

from sklearn import metrics
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.metrics import accuracy_score
from sklearn.metrics import ConfusionMatrixDisplay
from sklearn.model_selection import GridSearchCV

import time

%matplotlib inline
sns.set(color_codes=True)


from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


df = pd.read_csv('/content/drive/MyDrive/B/Freelance/Project Waste Management - Braincore/metadata_cleaned.csv')


df.head()


df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60962 entries, 0 to 60961
Data columns (total 21 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   No                     60962 non-null  int64  
 1   tanggal                60962 non-null  object 
 2   hari                   60962 non-null  int64  
 3   bulan                  60962 non-null  int64  
 4   tahun                  60962 non-null  int64  
 5   nopol                  60962 non-null  object 
 6   barang                 60962 non-null  object 
 7   supplier               60962 non-null  object 
 8   netto_kg               60962 non-null  int64  
 9   jam                    60962 non-null  object 
 10  sopir                  60962 non-null  object 
 11  admin                  60962 non-null  object 
 12  kelurahan              60962 non-null  object 
 13  kecamatan              60962 non-null  object 
 14  kabkot                 60962 non-null  object 
 15  curah_hujan_kecamatan  60962 non-null  float64
 16  hari_hujan_kecamatan   60962 non-null  float64
 17  Luas                   60962 non-null  float64
 18  Jml_RT                 60962 non-null  float64
 19  Jml_RW                 60962 non-null  float64
 20  Jml_penduduk           60962 non-null  float64
dtypes: float64(6), int64(5), object(10)
memory usage: 9.8+ MB


df.isnull().sum()

No                       0
tanggal                  0
hari                     0
bulan                    0
tahun                    0
nopol                    0
barang                   0
supplier                 0
netto_kg                 0
jam                      0
sopir                    0
admin                    0
kelurahan                0
kecamatan                0
kabkot                   0
curah_hujan_kecamatan    0
hari_hujan_kecamatan     0
Luas                     0
Jml_RT                   0
Jml_RW                   0
Jml_penduduk             0
dtype: int64


df_cleaned = df.drop(columns=["No", "tanggal","jam","nopol", "sopir","admin","kabkot"])


df_cleaned = df_cleaned.dropna()


df_cleaned.isnull().sum()

hari                     0
bulan                    0
tahun                    0
barang                   0
supplier                 0
netto_kg                 0
kelurahan                0
kecamatan                0
curah_hujan_kecamatan    0
hari_hujan_kecamatan     0
Luas                     0
Jml_RT                   0
Jml_RW                   0
Jml_penduduk             0
dtype: int64


df_cleaned.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60962 entries, 0 to 60961
Data columns (total 14 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   hari                   60962 non-null  int64  
 1   bulan                  60962 non-null  int64  
 2   tahun                  60962 non-null  int64  
 3   barang                 60962 non-null  object 
 4   supplier               60962 non-null  object 
 5   netto_kg               60962 non-null  int64  
 6   kelurahan              60962 non-null  object 
 7   kecamatan              60962 non-null  object 
 8   curah_hujan_kecamatan  60962 non-null  float64
 9   hari_hujan_kecamatan   60962 non-null  float64
 10  Luas                   60962 non-null  float64
 11  Jml_RT                 60962 non-null  float64
 12  Jml_RW                 60962 non-null  float64
 13  Jml_penduduk           60962 non-null  float64
dtypes: float64(6), int64(4), object(4)
memory usage: 6.5+ MB


df_cleaned.groupby('kelurahan').size().sort_values(ascending = False).head(20)

kelurahan
Kedungsari              16818
Potrobangsan             6107
Kramat Utara             4264
Magersari                4145
-                        3751
Kemiri Rejo              2435
Rejowinangun Selatan     2417
Tidar Utara              2398
Tidar Selatan            2359
Wates                    2063
Jurangombo Utara         1999
Magelang                 1984
Kramat Selatan           1979
Jurangombo Selatan       1761
Panjang                  1744
Jurangombo               1496
Gelangan                 1264
Jurangombo UTara          944
Cacaban                   551
Rejowinangun Utara        483
dtype: int64


df_cleaned.groupby('kecamatan').size().sort_values(ascending = False).head(20)

kecamatan
Magelang Utara      32844
Magelang Selatan    17738
Magelang Tengah     10380
dtype: int64


df_cleaned.groupby('barang').size().sort_values(ascending = False).head(60)

barang
Sampah             59487
Sampah Terpilah     1468
0                      7
dtype: int64


df_cleaned['kelurahan'] = df_cleaned['kelurahan'].replace('-', 'daerah lainnya')


df_filtered = df_cleaned.copy()


statistics_data = []

for column in df_filtered.columns:
    if df_filtered[column].dtype in ['int64', 'float64']:
        column_stats = {
            "Nama Kolom": column,
            "Mean": df_filtered[column].mean(),
            "Median": df_filtered[column].median(),
            "Skewness": df_filtered[column].skew()
        }
        statistics_data.append(column_stats)

# Dataframe yang menampung Statitics Data
statistics_df = pd.DataFrame(statistics_data)


statistics_df


statistics_df['Nama Kolom'].unique() # Untuk melihat kolom apa saja yang ada

array(['hari', 'bulan', 'tahun', 'netto_kg', 'curah_hujan_kecamatan',
       'hari_hujan_kecamatan', 'Luas', 'Jml_RT', 'Jml_RW', 'Jml_penduduk'],
      dtype=object)


# Membuat histogram dari kolom 'netto_kg'
plt.hist(df_filtered['netto_kg'], bins=30, color='skyblue', edgecolor='black')
plt.title('Histogram dari Kolom netto_kg')
plt.xlabel('Nilai netto_kg')
plt.ylabel('Frekuensi')
plt.grid(True)
plt.show()


import pandas as pd

# Assuming df is your DataFrame
outliers_data = []

for column in df_filtered.columns:
    if df[column].dtype in ['int64', 'float64']:
        Q1 = df_filtered[column].quantile(0.25)
        Q3 = df_filtered[column].quantile(0.75)
        IQR = Q3 - Q1
        lower_fence = Q1 - 1.5 * IQR
        upper_fence = Q3 + 1.5 * IQR
        column_outliers = df_filtered[(df_filtered[column] < lower_fence) | (df_filtered[column] > upper_fence)]

        outliers_data.append({
            "Nama Kolom": column,
            "Outliers Count": len(column_outliers),
        })

# Create a new DataFrame for the outliers
outliers_df = pd.DataFrame(outliers_data)


outliers_df


df_filtered.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60962 entries, 0 to 60961
Data columns (total 14 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   hari                   60962 non-null  int64  
 1   bulan                  60962 non-null  int64  
 2   tahun                  60962 non-null  int64  
 3   barang                 60962 non-null  object 
 4   supplier               60962 non-null  object 
 5   netto_kg               60962 non-null  int64  
 6   kelurahan              60962 non-null  object 
 7   kecamatan              60962 non-null  object 
 8   curah_hujan_kecamatan  60962 non-null  float64
 9   hari_hujan_kecamatan   60962 non-null  float64
 10  Luas                   60962 non-null  float64
 11  Jml_RT                 60962 non-null  float64
 12  Jml_RW                 60962 non-null  float64
 13  Jml_penduduk           60962 non-null  float64
dtypes: float64(6), int64(4), object(4)
memory usage: 6.5+ MB


df_encoded = pd.get_dummies(df_filtered)


df_encoded.head()


scaler = StandardScaler() #Object Scaler


cols = df_encoded.columns
X_scaled_data_std = scaler.fit_transform(df_encoded)
X_scaled_data_std = pd.DataFrame(X_scaled_data_std, columns = [cols])
# original_data = scaler.inverse_transform(scaled_data)


X_scaled_data_std.head()


import pandas as pd

# Assuming df is your DataFrame
outliers_data = []

for column in X_scaled_data_std.columns:
    if X_scaled_data_std[column].dtype in ['int64', 'float64']:
        Q1 = X_scaled_data_std[column].quantile(0.25)
        Q3 = X_scaled_data_std[column].quantile(0.75)
        IQR = Q3 - Q1
        lower_fence = Q1 - 1.5 * IQR
        upper_fence = Q3 + 1.5 * IQR
        column_outliers = X_scaled_data_std[(X_scaled_data_std[column] < lower_fence) | (X_scaled_data_std[column] > upper_fence)]

        outliers_data.append({
            "Nama Kolom": column,
            "Outliers Count": len(column_outliers),
        })

# Create a new DataFrame for the outliers
outliers_df = pd.DataFrame(outliers_data)
outliers_df = outliers_df.sort_values(by = 'Outliers Count', ascending = False)


outliers_df.head(5)


from sklearn.decomposition import PCA


# Initialize the PCA model with the desired number of components
pca = PCA(n_components=0.95)

# Fit and transform the data
transformed_data = pca.fit_transform(X_scaled_data_std)


# Buat DataFrame dengan kolom PCA-1, PCA-2, dst.
column_names = [f'PCA-{i}' for i in range(1, transformed_data.shape[1] + 1)]
hasil_pca_sklearn = pd.DataFrame(data=transformed_data, columns=column_names)


hasil_pca_sklearn.head()


from sklearn.cluster import KMeans


inersia_values = []
for i in range(1, 16):
    kmeans_std = KMeans(n_clusters = i, init = 'k-means++', n_init = 'auto', max_iter = 500, tol = 0.0001)
    kmeans_std.fit(transformed_data)
    inersia_values.append(kmeans_std.inertia_)


inersia_values

[5271270.035740352,
 5131165.894359691,
 5031317.03969268,
 4838981.128236856,
 4644537.79546481,
 4619557.649490674,
 4438874.476294214,
 4299005.693560923,
 4188074.5779152345,
 4051333.644232177,
 3894325.5683385585,
 3752001.685744552,
 3508539.249921481,
 3443415.571620225,
 3430408.868824492]


# Plot Elbow Method with Labels
plt.figure(figsize=(10, 6))
plt.plot(range(1, 16), inersia_values, marker='o', linestyle='-', color='b')

# Menambahkan label untuk setiap titik data
for i, inertia in enumerate(inersia_values):
    plt.text(i + 1.2, inertia, f'{inertia:.2f}', ha='left', va='bottom', fontsize=10)

plt.title('Elbow Method for Optimal Clusters', fontsize=16)
plt.xlabel('Number of Clusters', fontsize=14)
plt.ylabel('Inertia Value', fontsize=14)
plt.xticks(range(1, 16))
plt.grid(True, linestyle='--', alpha=0.7)
plt.show()


data = transformed_data.copy()


# Apply K-means clustering
km_2_pca = KMeans(n_clusters = 5,random_state=42, init = 'k-means++', n_init = 'auto', max_iter = 500, tol = 0.0001)
km_2_pca.fit(hasil_pca_sklearn)
predicted_labels = km_2_pca.labels_


predicted_labels

array([1, 2, 2, ..., 1, 1, 1], dtype=int32)


km_2_pca.cluster_centers_[:, 0], km_2_pca.cluster_centers_[:, 1]

(array([ 2.15667261, -0.71425583,  1.35234738,  3.33890378,  1.17086794]),
 array([-3.41945694,  1.10286539, -2.86655097,  2.94056511, -2.82957173]))


# Create a larger figure
plt.figure(figsize=(15, 12))

# Plot the K-means clustered data points
plt.scatter(data[:, 0], data[:, 1], c=predicted_labels, cmap='viridis', edgecolor='k', s=50, alpha=0.8, label='Original Data')

# Plot the cluster centers
plt.scatter(km_2_pca.cluster_centers_[:, 0], km_2_pca.cluster_centers_[:, 1], c='red', marker='X', s=200, label='Cluster Centers')

# Add labels and title
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.title('K-means Clustering with PCA')

# Show the legend
plt.legend()

# Show the plot
plt.show()


# Tambahkan kolom 'cluster' ke DataFrame 'data'
df_filtered['cluster'] = km_2_pca.labels_


df_filtered.groupby('cluster').count()


cluster_stats = df_filtered.groupby('cluster').mean()
cluster_stats

<ipython-input-155-6609616e7b9f>:1: FutureWarning: The default value of numeric_only in DataFrameGroupBy.mean is deprecated. In a future version, numeric_only will default to False. Either specify numeric_only or select only columns which should be valid for the function.
  cluster_stats = df_filtered.groupby('cluster').mean()


# Simpan DataFrame ke dalam file Excel
df_filtered.to_excel("data_hasil_clustering.xlsx", index=False)


df_filtered.groupby('barang').size().sort_values(ascending = False).head(60)

barang
Sampah             59487
Sampah Terpilah     1468
0                      7
dtype: int64


df_tdk_terpilah = df_filtered.loc[df_filtered["barang"] == "Sampah"]
df_tdk_terpilah.groupby('barang').size().sort_values(ascending = False).head(60)

barang
Sampah    59487
dtype: int64


df_tdk_terpilah.groupby('cluster').mean()

<ipython-input-159-ae725d11cdea>:1: FutureWarning: The default value of numeric_only in DataFrameGroupBy.mean is deprecated. In a future version, numeric_only will default to False. Either specify numeric_only or select only columns which should be valid for the function.
  df_tdk_terpilah.groupby('cluster').mean()


df_tdk_terpilah.groupby('kecamatan').size().sort_values(ascending = False).head(60)

kecamatan
Magelang Utara      31421
Magelang Selatan    17701
Magelang Tengah     10365
dtype: int64


df_tdk_terpilah.groupby('kelurahan').size().sort_values(ascending = False).head(60)

kelurahan
Kedungsari              16805
Potrobangsan             4708
Kramat Utara             4259
Magersari                4138
daerah lainnya           3746
Kemiri Rejo              2429
Rejowinangun Selatan     2414
Tidar Utara              2396
Tidar Selatan            2355
Wates                    2059
Jurangombo Utara         1997
Magelang                 1982
Kramat Selatan           1979
Jurangombo Selatan       1761
Panjang                  1741
Jurangombo               1495
Gelangan                 1263
Jurangombo UTara          927
Cacaban                   551
Rejowinangun Utara        482
dtype: int64


df_terpilah = df_filtered.loc[df_filtered["barang"] == "Sampah Terpilah"]
df_terpilah.groupby('barang').size().sort_values(ascending = False).head(60)

barang
Sampah Terpilah    1468
dtype: int64


df_terpilah.groupby('cluster').mean()

<ipython-input-163-2d41d87171a3>:1: FutureWarning: The default value of numeric_only in DataFrameGroupBy.mean is deprecated. In a future version, numeric_only will default to False. Either specify numeric_only or select only columns which should be valid for the function.
  df_terpilah.groupby('cluster').mean()


df_terpilah.groupby('kecamatan').size().sort_values(ascending = False).head(60)

kecamatan
Magelang Utara      1419
Magelang Selatan      34
Magelang Tengah       15
dtype: int64


df_terpilah.groupby('kelurahan').size().sort_values(ascending = False).head(60)

kelurahan
Potrobangsan            1399
Jurangombo UTara          17
Kedungsari                10
Magersari                  6
Kemiri Rejo                6
Wates                      4
Tidar Selatan              4
daerah lainnya             4
Kramat Utara               4
Panjang                    3
Rejowinangun Selatan       3
Magelang                   2
Tidar Utara                2
Jurangombo                 1
Rejowinangun Utara         1
Jurangombo Utara           1
Gelangan                   1
dtype: int64

	No	tanggal	hari	bulan	tahun	nopol	barang	supplier	netto_kg	jam	...	admin	kelurahan	kecamatan	kabkot	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk
0	3	31/12/2023	31	12	2023	AA 6249 XA	Sampah	dlh kota magelang	300	15:31	...	Kurniawan BW	Kedungsari	Magelang Utara	Kota Magelang	211.0	17.0	6.29	306.0	49.0	42224.0
1	4	31/12/2023	31	12	2023	AA 8013 XA	Sampah	pasar rejowinangun	550	15:15	...	Kurniawan BW	Rejowinangun Selatan	Magelang Selatan	Kota Magelang	211.0	17.0	6.29	306.0	49.0	42224.0
2	5	31/12/2023	31	12	2023	AA 8022 XA	Sampah	depo tidar selatan	2270	13:51	...	Kurniawan BW	Tidar Utara	Magelang Selatan	Kota Magelang	211.0	17.0	6.29	306.0	49.0	42224.0
3	6	31/12/2023	31	12	2023	AA 9574 FA	Sampah	dlh kota magelang	500	11:49	...	Eksta Gama Pratama Y	Kedungsari	Magelang Utara	Kota Magelang	211.0	17.0	6.29	306.0	49.0	42224.0
4	7	31/12/2023	31	12	2023	AA 8022 XA	Sampah	depo magersari	1620	11:42	...	Eksta Gama Pratama Y	Magersari	Magelang Selatan	Kota Magelang	211.0	17.0	6.29	306.0	49.0	42224.0

	Nama Kolom	Mean	Median	Skewness
0	hari	15.882730	16.00	-0.007126
1	bulan	6.494767	7.00	-0.038623
2	tahun	2020.960287	2021.00	0.055451
3	netto_kg	1314.508087	1000.00	1.132437
4	curah_hujan_kecamatan	238.502897	211.00	1.052124
5	hari_hujan_kecamatan	15.264017	17.00	-0.756171
6	Luas	6.314622	6.29	-0.637359
7	Jml_RT	319.291493	306.00	2.251425
8	Jml_RW	55.289016	49.00	0.976135
9	Jml_penduduk	42579.514353	42224.00	0.726480

	hari	bulan	tahun	netto_kg	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk	...	kelurahan_Rejowinangun Selatan	kelurahan_Tidar Utara	kecamatan_Magelang Selatan	kecamatan_Magelang Utara
0	31	12	2023	300	211.0	17.0	6.29	306.0	49.0	42224.0	...	0	0	0	1
1	31	12	2023	550	211.0	17.0	6.29	306.0	49.0	42224.0	...	1	0	1	0
2	31	12	2023	2270	211.0	17.0	6.29	306.0	49.0	42224.0	...	0	1	1	0
3	31	12	2023	500	211.0	17.0	6.29	306.0	49.0	42224.0	...	0	0	0	1
4	31	12	2023	1620	211.0	17.0	6.29	306.0	49.0	42224.0	...	0	0	1	0

	hari	bulan	tahun	netto_kg	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk	...	kelurahan_Potrobangsan	kelurahan_Rejowinangun Selatan	kelurahan_Rejowinangun Utara	kelurahan_Tidar Selatan	kelurahan_Tidar Utara	kelurahan_Wates	kelurahan_daerah lainnya	kecamatan_Magelang Selatan	kecamatan_Magelang Tengah	kecamatan_Magelang Utara
0	1.737241	1.619788	1.430385	-1.000922	-0.164377	0.232457	-0.046968	-0.473278	-0.628521	-0.112817	...	-0.333661	-0.203186	-0.089366	-0.200634	-0.202353	-0.187153	-0.256055	-0.640604	-0.453003	0.925261
1	1.737241	1.619788	1.430385	-0.754270	-0.164377	0.232457	-0.046968	-0.473278	-0.628521	-0.112817	...	-0.333661	4.921603	-0.089366	-0.200634	-0.202353	-0.187153	-0.256055	1.561026	-0.453003	-1.080776
2	1.737241	1.619788	1.430385	0.942696	-0.164377	0.232457	-0.046968	-0.473278	-0.628521	-0.112817	...	-0.333661	-0.203186	-0.089366	-0.200634	4.941864	-0.187153	-0.256055	1.561026	-0.453003	-1.080776
3	1.737241	1.619788	1.430385	-0.803601	-0.164377	0.232457	-0.046968	-0.473278	-0.628521	-0.112817	...	-0.333661	-0.203186	-0.089366	-0.200634	-0.202353	-0.187153	-0.256055	-0.640604	-0.453003	0.925261
4	1.737241	1.619788	1.430385	0.301401	-0.164377	0.232457	-0.046968	-0.473278	-0.628521	-0.112817	...	-0.333661	-0.203186	-0.089366	-0.200634	-0.202353	-0.187153	-0.256055	1.561026	-0.453003	-1.080776

	Nama Kolom	Outliers Count
9	(Jml_penduduk,)	21941
6	(Luas,)	17337
89	(kecamatan_Magelang Tengah,)	10380
7	(Jml_RT,)	6438
81	(kelurahan_Potrobangsan,)	6107

Analisis Klaster dalam Pengelolaan Sampah: Identifikasi Penyumbang Sampah Terpilah dan Non-Terpilah Terbanyak di Kota Magelang¶

1. Import Library¶

2. Read Data¶

3. Data Preprocessing¶

Menghapus kolom-kolom yang tidak digunakan¶

4.Exploratory Data Analysis (EDA)¶

Check Distribusi Data¶

Check Outlier Data¶

One-Hot Encoding¶

Standarisasi¶

PCA (Principal Component Analysis)¶

K-Means Clustering¶

Sampah Tidak Terpilah¶

Cluster 1: Wilayah dengan Tingkat Penduduk dan Sampah Tertinggi¶

Cluster 2: Wilayah dengan Curah Hujan Rendah¶

Cluster 3: Wilayah dengan Fokus pada Pengelolaan Sampah di Tingkat Rumah Tangga¶

Cluster 4: Wilayah dengan Faktor Cuaca yang Memengaruhi¶

Cluster 5: Wilayah dengan Tantangan Pengelolaan Sampah¶

Sampah Terpilah¶

	PCA-1	PCA-2	PCA-3	PCA-4	PCA-5	PCA-6	PCA-7	PCA-8	PCA-9	PCA-10	...	PCA-47	PCA-48	PCA-49	PCA-50	PCA-51	PCA-52	PCA-53	PCA-54	PCA-55	PCA-56
0	-2.286949	0.736926	-1.310911	-0.884290	-0.443379	1.169718	0.022408	0.040643	-0.075161	-0.008854	...	0.006965	-0.020001	0.048608	-0.072611	-0.026989	0.002383	0.014766	0.016623	0.056513	-0.181177
1	0.575569	-2.496381	0.084899	-0.711203	0.992983	0.266497	-2.070677	3.894944	4.875441	-0.167587	...	0.033313	-0.014045	0.033633	-0.037469	-0.013603	0.015330	0.018388	0.016054	0.107348	-0.188435
2	0.623831	-2.343033	-0.175585	0.675305	3.924035	1.765501	-0.800081	-0.901694	-1.703283	-0.073674	...	-0.114073	-0.273931	0.099795	-0.084702	-0.014535	0.039679	-0.062378	-0.076110	0.179647	0.010074
3	-2.251747	0.723166	-1.314789	-0.794007	-0.457082	1.188886	0.022294	0.041565	-0.075121	-0.009827	...	0.006887	-0.019975	0.048628	-0.072716	-0.027084	0.002209	0.014742	0.016588	0.055460	-0.180175
4	0.905775	-2.704136	0.106623	0.465027	-0.321516	0.415130	3.979735	-1.768592	1.328323	-0.144586	...	-0.034783	-0.118073	0.090274	0.023513	0.008436	0.027890	0.069029	-0.011557	-0.428312	-0.441646

	hari	bulan	tahun	barang	supplier	netto_kg	kelurahan	kecamatan	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk
cluster
0	169	169	169	169	169	169	169	169	169	169	169	169	169	169
1	41480	41480	41480	41480	41480	41480	41480	41480	41480	41480	41480	41480	41480	41480
2	15808	15808	15808	15808	15808	15808	15808	15808	15808	15808	15808	15808	15808	15808
3	1744	1744	1744	1744	1744	1744	1744	1744	1744	1744	1744	1744	1744	1744
4	1761	1761	1761	1761	1761	1761	1761	1761	1761	1761	1761	1761	1761	1761

	hari	bulan	tahun	netto_kg	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk
cluster
0	16.183432	6.710059	2019.372781	2537.041420	176.700000	10.165680	7.120059	325.763314	69.751479	42866.603550
1	15.853737	6.466683	2020.975434	1198.096625	240.070576	15.329436	6.135397	317.963549	52.120926	42649.235029
2	15.923267	6.562184	2020.957174	1666.867535	234.852790	15.155807	6.801450	318.177379	61.786247	42408.057123
3	15.872706	6.400803	2020.864106	1188.281537	242.307454	15.317661	5.578296	361.073394	63.366972	42596.372133
4	16.182851	6.623509	2020.879046	901.208972	236.505792	15.130608	6.818041	318.572402	62.201022	42432.134583

	hari	bulan	tahun	netto_kg	curah_hujan_kecamatan	hari_hujan_kecamatan	Luas	Jml_RT	Jml_RW	Jml_penduduk
cluster
1	15.951782	6.748428	2020.491964	743.567435	249.762334	14.677848	6.285846	306.321454	49.083857	43598.578616
2	19.647059	9.588235	2020.823529	1154.117647	220.585294	16.205882	7.031176	323.647059	67.529412	42330.470588
3	27.000000	9.333333	2021.000000	1188.333333	180.333333	11.333333	5.893700	336.666667	57.000000	40785.333333