DATA MINING & ANALYTIC FORECASTING INDEKS STANDAR PENCEMAR UDARA JAKARTA MENGGUNAKAN METODE LINEAR REGRESSION (STUDI KASUS: DATASET INDEKS STANDAR PENCEMAR UDARA JAKARTA 2021)

Muhammad Abdul Latief, Yuli Karyanti

Magister Manajemen Sistem Informasi

abdullatief007@gmail.com, yuli@staff.gunadarma.ac.id

		Abstrak (indonesia)
Received: Revised : Accepted:	01-09-2022 10-09-2022 20-09-2022	Pencemaran udara merupakan hal yang harus diperhatikan saat ini. Besarnya partikel dan gas yang beracun di udara sudah melewati batasan yang cukup besar diberbagai negara salah satunya Indonesia. Ibukota Indonesia yaitu Jakarta merupakan pusat perekonomian yang dimana berdasarkan data yang didapatkan polusi tingkat pencemaran udara tergolong melewati batas standar AQG (Air Quality Guide) yang ditetapkan WHO (World Health Organization). Berdasarkan data Jakarta memiliki rata-rata polusi yang dapat dikategorikan sedang, yang dimana rentang indeks berada pada nilai 51-100 (µg/m³) . Hal ini diukur dari berbagai pengukuran gas dan partikel yakni PM₁₀, PM_2.5, NO₂, SO₂, CO, O₃, dan HC. Pada penelitian ini akan dilakukan uji coba untuk memprediksi hasil pengukuran tersebut dimana dataset yang diperoleh merupakan hasil akuisisi dari website Opendata Jakarta. Penelitian ini bertujuan untuk menghitung, menghasilkan, serta memvisualisasikan hasil dari prediksi menggunakan pendekatan metode Linear Regression. Dengan Parameter yaitu faktor (Y₁) Critical, (Y₂) Max, dan (Y₃) Category dan Parameter factor yaitu dari (X₁) PM₁₀, (X₂) PM_2.5, (X₃) SO₂, (X₄) CO, (X₅) O₃, (X₆) NO₂, (X₇) Tanggal, dan (X₈) Stasiun. Kata kunci: Data Mining; Forecasting Analysis Linear Regression; Predictive Modelling; Indeks Standar Pencemar Udara;

		*Abstract* *(English)*
		Air pollution is something that must be considered at this time. The amount of toxic particles and gases in the air has crossed a fairly large limit in various countries, one of which is Indonesia. The capital city of Indonesia, namely Jakarta, is the center of the economy, which based on the data obtained, the level of air pollution is classified as exceeding the AQG (Air Quality Guide) standard set by WHO (World Health Organization). Based on the data, Jakarta has an average pollution that can be categorized as moderate, where the index range is at a value of 51-100 (µg/m3) . This is measured from various gas and particle measurements, namely PM10, PM2.5, NO2, SO2, CO, O3, and HC. . This study aims to calculate, generate, and visualize the results of predictions using the Linear Regression method approach. With parameters, namely (Y1) Critical, (Y2) Max, and (Y3) Category and Parameter factors, namely (X1) PM10, (X2) PM2.5, (X3) SO2, (X4) CO, (X5) O3 , (X6) NO2, (X7) Date, and (X8) Station. *Keywords: data mining; linear regression forecasting analysis; predictive models; air pollutant standard index*

*Correspondent Author : Muhammad Abdul Latief

Email : abdullatief007@gmail.com

PENDAHULUAN

Perkembangan gadget dan teknologi mengakibatkan Data dan informasi berkembang secara luas dan eksponensial. Lebih dari 20 tahun investasi bisnis dalam infrastruktur teknologi, yang berdampak pesatnya kemampuan untuk menerima, menganalisa, mengolah, dan mengimplementasikan Data yang dapat digunakan sebagai informasi. Oleh karena itu sudah berkembang banyak perusahaan yang menggunakan Data Mining dan analisis. Menganalisa studi kasus membantu dalam mendapatkan pengetahuan untuk menjangkau tujuan dari suatu organisasi/perusahaan ataupun secara personal. Pemanfaatan teknik Data Mining dan analisis digunakan mulai dari perusahaan segi manufaktur, Stock (Saham), E-commerce, Industri, Kedokteran, Keuangan, Ekonomi, Cuaca dan lainnya yang hampir seluruh aspek dalam kehidupan dapat dilakukan analisa salah satunya adalah dalam penelitian ini adalah Lingkungan. Polusi udara merupakan salah satu fenomena lingkungan yang cukup besar saat ini. Dimana industri banyak pabrik-pabrik yang berkembang, transportasi yang semakin bertambah volume nya, bencana kebakaran hutan, penggerusan hutan, alat pembakaran rumah tangga, dan sebagainya merupakan sumber umum pencemaran udara yang membuat kontaminasi kualitas udara hampir diseluruh dunia. Kontaminasi lingkungan dalam atau luar ruangan oleh zat kimia, fisik, atau biologis apapun yang mengubah karakteristik alami atmosfer. Polutan yang menjadi perhatian utama kesehatan masyarakat termasuk Partikulat, Karbon Monoksida, Ozon, Nitrogen Dioksida dan Sulfur Dioksida.

Penelitian sebelumnya terkait algoritma Linear Regression adalah penelitian Oleh (Nurjannah, dkk, 2019). Dimana penelitian ini meneliti keterkaitan perilaku yang menimbulkan terjadi hypertensi dan menentukan factor determinasinya. Sample yang diolah untuk dianalisis berjumlah 200 sample. Metode yang digunakan adalah Linear Regression. Perilaku yang diujikan dalam kasus ini adalah efikasi diri/kepercayaan diri, pengetahuan, dukungan keluarga, dukungan tenaga Kesehatan, jenis kelamin, dan umur. Hasil yang didapatkan dari penelitian ini adalah efikasi diri, pengetahuan, dukungan keluarga, dan dukungan tenaga Kesehatan memiliki nilai yang signifikan terhadap pencegahan penyakit hipertensi, di mana confidence Interval yang digunakan 95% dengan hasil menunjukkan variabel bebas memiliki hasil hubungan yang positive, sedangkan untuk variabel umur dan jenis kelamin memiliki korelasi dengan pencegahan namun tidak

(2.1)

terdapat signifikansi yang baik. Oleh karena itu dalam penelitian ini yang akan menjadi bahan pembahasan adalah Data tentang pencemaran udara mengenai Indeks Standar Pencemar Udara (ISPU) yang diukur dari 5 stasiun pemantau kualitas udara (SPKU) yang ada di Provinsi DKI Jakarta Tahun 2021. Pendekatan metode yang akan dilakukan adalah forecasting Data Analysis menggunakan Linear Regression. Dengan Parameter yaitu faktor (Y₁) Critical, (Y₂) Max, dan (Y₃) Category dan Parameter factor yaitu dari (X₁) PM₁₀, (X₂) PM_2.5, (X₃) SO₂, (X₄) CO, (X₅) O₃, (X₆) NO₂, (X₇) Tanggal, dan (X₈) Stasiun.

METODE PENELITIAN

Metode Linear Regression merupakan salah satu dari metode statistik yang berfungsi untuk menguji sejauh mana hubungan sebab akibat antara variabel faktor Independent (bebas) terhadap variabel Dependent (terikat). Faktor Independent pada umumnya dilambangkan dengan X atau disebut juga dengan Predictor sedangkan variabel Dependent dilambangkan dengan Y atau disebut juga dengan Response. SLR (Simple Linear Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun Kuantitas, Berikut persamaanya

Y=a+bx

Y=a+bx

Dari rumusan tersebut dimana :

Y = Variabel Response atau Variabel Akibat (Dependent).

X = Variabel Predictor atau Variabel Faktor Penyebab (Independent).

a = konstanta.

b= koefisien regresi (kemiringan) atau besaran Response yang ditimbulkan oleh Predictor.

Dalam penelitian ini akan membandingkan berbagai metode Linear Regression yang merupakan turunan rumus dari Simple Linear Regression yaitu metode :

1. Multi Linear Regression

(2.2)

Multiple Linear Regression adalah model regresi berganda jika variabel terikatnya berskala Data Interval atau rasio (kuantitatif atau numerik). Sedangkan variabel bebas pada umumnya juga berskala Data Interval atau rasio. Multiple Linear Regression memiliki variabel bebas yang lebih dari satu. Berikut merupakan rumusannya :

2. Ridge Regression

(2.3)

Ridge Regression merupakan salah satu dari beberapa metode yang telah diusulkan untuk mengatasi Multikolinearitas dengan memodifikasi metode kuadrat terkecil untuk memperbolehkan estimator koefisien regresi yang bias. Ridge Linear Regression dapat digunakan untuk mengatasi korelasi yang tinggi antara beberapa variabel bebas. Berikut merupakan rumusannya:

3. Lasso Regression

(2.4)

Lasso (Least Absolute Shrinkage and Selection Operator) atau biasa disebut juga Operator Penyusutan dan Seleksi Terkecil Absolut, secara konseptual hampir mirip dengan regresi Ridge. Dimana menambahkan penalti dengan membatasi jumlah nilai absolut dari perkiraan untuk koefisien bukan nol. Lasso membatasi ukuran dengan nilai Absolute dari koefisien regresi, dengan menetapkan nilai yang tidak relevan menjadi 0. Berikut merupakan rumusannya:

4. Elastic Net Regression

Elastic Net adalah menggabungkan Batasan dari regresi Ridge dan laso untuk mendapatkan yang terbaik dari kedua dunia. Yaitu mengambil nilai jumlah kuadrat eror dan jumlah nilai Absolute. Dimana terdapat Parameter pencampuran antara punggungan (α = 0) dan laso (α = 1). Sekarang, terdapat dua Parameter untuk diberikan. Elastic Net bertujuan untuk meminimalkan

(2.5)

fungsi kerugian, berikut merupakan rumusan sederhana:

5. Polynomial Regression

(2.6)

Regresi linier sederhana dapat diperluas dengan membangun fitur polinomial dari koefisien. Dalam kasus regresi linier standar, Regresi polinomial merupakan regresi di mana fungsinya adalah kuadratik. Perbedaan persamaannya bisa dilihat sebagai berikut:

6. Uji Hipotesis ANOVA

Anova (Analysis of variance) adalah sebuah analisis statistik yang menguji perbedaan rerata antar grup. Anova adalah dapat menguji perbedaan lebih dari dua kelompok. Hipotesis nol dari uji Anova adalah bahwa data adalah simple random dari populasi yang sama sehingga memiliki ekspektasi mean dan varians yang sama. Jika nilai pada f hitung lebih besar dari f tabel, maka dapat disimpulkan bahwa analisis anova adalah H1 atau analisis diterima. Sebaliknya, apabila nilai f tabel lebih kecil daripada f hitung, maka hasil analisis uji anova ditolak atau H0. Prinsip dari anova adalah dengan melakukan analisis data dalam dua sumber variasi, yaitu variasi dalam kelompok dan variasi luar kelompok.

HASIL DAN PEMBAHASAN

A. Hasil Penelitian

Gambar 5.1 Metrics Variabel Max (Y₁)

Tabel 5.1 Hasil prediksi Nilai Max

No.	Tanggal Prediksi	Actual Y	PrediksiY Ridge Max Kedepan	PrediksiY Multi Linear Max Kedepan
1	01/11/2021	53.00	52.73	52.73
2	02/11/2021	47.00	46.06	46.06
3	03/11/2021	58.00	60.40	60.40
4	04/11/2021	48.00	46.15	46.15
5	05/11/2021	53.00	53.18	53.18
6	06/11/2021	58.00	61.58	61.58
…	…	…	…	…
1504	25/08/2022	76.00	80.77	80.77
1505	26/08/2022	77.00	81.47	81.47
1506	27/08/2022	70.00	76.34	76.34
1507	28/08/2022	74.00	78.26	78.26
1508	29/08/2022	74.00	77.32	77.32

Gambar 5.2 Metrics Variabel Category (Y₂)

Tabel 5.2 Hasil prediksi Nilai Category

No.	Tanggal Prediksi	Actual Y	PrediksiY Ridge Category Kedepan	PrediksiY Multi Linear Category Kedepan
1	01/11/2021	2.00	1.58	1.58
2	02/11/2021	1.00	1.47	1.47
3	03/11/2021	2.00	1.72	1.72
4	04/11/2021	1.00	1.47	1.47
5	05/11/2021	2.00	1.60	1.60
6	06/11/2021	2.00	1.76	1.76
…	…	…	…	…
1504	25/08/2022	2.00	2.10	2.10
1505	26/08/2022	2.00	2.11	2.11
1506	27/08/2022	2.00	2.01	2.01
1507	28/08/2022	2.00	2.04	2.04
1508	29/08/2022	2.00	2.04	2.04

Gambar 5.3 Metrics Variabel Critical (Y₃)

Tabel 5.3 Hasil prediksi Nilai Critical

No.	Tanggal Prediksi	Actual Y	PrediksiY Ridge Critical Kedepan	PrediksiY Multi Linear Critical Kedepan
1	01/11/2021	2.00	2.54	2.54
2	02/11/2021	5.00	3.03	3.03
3	03/11/2021	2.00	2.63	2.63
4	04/11/2021	2.00	2.72	2.72
5	05/11/2021	2.00	2.54	2.54
6	06/11/2021	2.00	2.76	2.76
…	…	…	…	…
1504	25/08/2022	2.00	1.93	1.93
1505	26/08/2022	2.00	1.91	1.91
1506	27/08/2022	2.00	1.80	1.80
1507	28/08/2022	2.00	1.97	1.97
1508	29/08/2022	2.00	1.97	1.97

Berdasarkan Metrics Training yang didapatkan berdasarkan gambar 5.1, 5.2, dan 5.3 diperoleh hasil yang paling baik saat Training adalah Polynomial, namun saat Testing Metricsnya berbeda jauh yang sangat tinggi. Kemudian skor untuk R2 nilai yang cukup baik saat Training adalah Multi Linear dan Ridge. Yang kemudian metode tersebut juga mendapatkan hasil MAP, MSE, RMSE, dan RSS yang lebih rendah dibandingkan 2 metode lainnya yaitu Lasso dan Elastic Net. Oleh karena itu Setelah melakukan berbagai proses yang telah dilakukan sebelumnya, telah diperoleh hasil dari menggunakan metode apa yang cukup tepat dan cocok untuk kasus Dataset ini, dimana akan digunakan 2 metode untuk melakukan prediksi pada Data dummy untuk prediksi dalam 10 bulan kedepan. Metode yang akan digunakan adalah Multi Linear Regression dan Elastic Net Regression. Dikarenakan hasilnya yang sedikit mirip maka untuk melihat hasil Data akhirnya akan menggunakan metode tersebut. Dapat dilihat hasil prediksi Multi Linear dan Ridge tersebut pada tabel 5.1, 5.2, dan 5.3 dari hasil diperoleh hasil yang mirip antara kedua metode tersebut. Dimana prediksi untuk 10 bulan kedepan terlihat sedikit beberapa perbedaan dengan Data aktual yang dimana merupakan Data 10 bulan saat ini. Tetapi hasil terlihat untuk (Y1) Max akan didominasi nilai “79.99” yang didapatkan dari hasil averagenya, (Y2) Category akan didominasi nilai “2 = Sedang” yang didapatkan dari hasil averagenya yaitu 2.09. (Y3) Critical akan didominasi nilai “2 = PM2.5” yang didapatkan dari hasil averagenya yaitu 2,14.

Gambar 5.4 ANOVA Max (Y₁)

Gambar 5.5 ANOVA Category (Y₂)

Gambar 5.6 ANOVA Critical (Y₃)

Uji coba hipotesis untuk melihat signifikansi antara variabel dependent terhadap variabel independent akan diperoleh hasil uji coba ANOVA yang didapatkan dari hasil metode ordinary least squares (OLS). Dimana fungsi OLS ini memberikan beragam stats tentang statistic dari variabel yang diuji, yang kemudian diambil nilai F dan P-value. Dari hasil uji cob aini jika nilai tersebut diatas Confidence Interval yaitu 95% dengan toleransi kesalahan yaitu 5% (0.05). Jika 0.05 > H_0, maka H₀ “Tidak berpengaruh terhadap variabel dependent”, sebaliknya maka H₁ yang akan diterima yaitu “Terdapat pengaruh terhadap variabel dependent”. Berdasarkan gambar 5.4, diperoleh hasil yang signifikan terhadap Max hanyalah Tanggal dengan nilai kurang lebih 0,27. Hal ini memberikan hasil H₁ diterima untuk Tanggal yaitu 0.27>0.05. Dimana hal ini berarti terdapat tanggal-tanggal dimana nilai max akan menjadi sangat tinggi melebihi dari nilai rata-rata max. Berdasarkan gambar 5.5, diperoleh hasil yang hamper mirip dengan signifikan terhadap Category hanyalah Tanggal dengan nilai kurang lebih 0,63 lebih besar pengaruhnya terhadap Max. Hal ini memberikan hasil H₀ diterima untuk Tanggal yaitu 0.63>0.05. Dimana hal ini berarti terdapat tanggal-tanggal dimana nilai Category akan menjadi menjadi sangat dominan terhadap suatu kondisi tanggal yang dimana berdasarkan hasil tabel 5.1, 5.2, dan 5.3 adalah category “Sedang”.

Berdasarkan gambar 5.6, diperoleh hasil yang signifikan terhadap Critical adalah PM_2.5, SO₂, CO, NO₂ dan Stasiun. Hal ini memberikan hasil H₀ diterima untuk variabel tersebut dengan nilai yaitu diatas 0,05. Dimana hal ini berarti gas dan partikel PM_2.5, SO₂, CO, dan NO₂ memiliki pengaruh yang terhadap perubahan Critical indeks udara. Kemudian juga didapatkan pengaruh dari berbagai Stasiun, yang menunjukan terdapat lokasi Stasiun yang memiliki dampak critical terhadap partikel gas tersebut.

Berdasarkan dataset Indeks Standar Pencemar Udara yang diperoleh, terdapat beberapa factor sebagai Atribut yang akan digunakan dalam penelitian ini yaitu sebagai berikut:

Tabel 5.4

Factor Atribut

Atribut	Keterangan
Tanggal	Tanggal saat pemeriksaan
PM₁₀	Partikulat Udara 10 Mikrometer
PM_2.5	Partikulat Udara 2.5 Mikrometer
SO₂	Gas Sulfur Dioksida
CO	Gas Karbon Monoksida
O₃	Gas Ozon
NO₂	Gas Nitrogen Dioksida
Max	Nilai Faktor tertinggi saat pemeriksaan
Critical	Gas atau Partikulat yang kritis
Category	Kategori udara berdasarkan pemeriksaan
Stasiun	Tempat pengambilan sample

Pembersihan data dilakukan terlebih dahulu, dengan menghilangkan data yang tidak memiliki nilai, hal tersebut dapat dilihat pada gambar 4.1 dan 4.2.

Gambar 4.1 Data masih terdapat nilai kosong

Gambar 4.2 Setelah dibersihkan

Hal ini bertujuan agar saat penelitian dapat dengan mudah untuk diolah. Kemudian setelah pembersihan data dilakukan perubahan format tipedata, karena saat melakukan implementasi metode Linear Regression data hanya dapat dihitung jika memiliki tipedata berformat integer atau numerik. Hal ini dapat dilihat pada gambar 4.3.

Gambar 4.3 Konversi Tipedata Numerik

Setelah keseluruhan data siap digunakan untuk diolah untuk dilakukan analisa maka, kemudian metode Linear Regrssion akan diimplementasikan menggunakan Bahasa Pemrogramman Python. Dimana parameter yang akan ditetapkan adalah Parameter faktor (Y₁) Critical, (Y₂) Max, dan (Y₃) Category dan Parameter factor yaitu dari (X₁) PM₁₀, (X₂) PM_2.5, (X₃) SO₂, (X₄) CO, (X₅) O₃, (X₆) NO₂, (X₇) Tanggal, dan (X₈) Stasiun. Akan terlihat metrics yang akan dilakukan pengukuran seperti R2, MSE, RMSE, MAPE, RSS, dan Cross Validation dari berbagai metode Regresi yang ditetapkan.

KESIMPULAN

Hasil dari seluruh perbandingan yang dilakukan ternyata didapatkan tidak terlalu jauh dari seperti nilai 10 bulan lalu, karena memang jika untuk memprediksi masa depan yang tepat adalah memiliki juga gambaran untuk variabel X. Pada penelitian ini hanya digunakan untuk uji coba penerapan Dataset terhadap fungsi prediksi dari Linear Regression Model yang berkaitan hubungan variabel Independent dan Dependen cenderung memberikan hasil yang positif. Oleh karena itu maka berarti faktor dari atribut Max, Category, dan Critical cukup dipengaruhi oleh variabel Independent. Dari penelitian ini didapatkan kesimpulan bahwa metode Regression yang cocok untuk melakukan prediksi pada studi kasus ini adalah metode Multi Linear dan Ridge dikarenakan hasil Metrics dari metode tersebut tidak telalu jauh perbedaannya antara nilai validasi dan Test. Untuk metode Polynomial memiliki hasil yang sangat bagus tetapi memiliki perbedaan yang jauh dengan validasi dan Testing, hal ini kemungkinan dikarenakan faktor Multikolinearitas yang tinggi, karena Polynomial melakukan pemangkatan yang mana hal itu saling menambahkan ketergantungan antara prediktor dalam masalah regresi berdimensi ganda. Hal ini membatasi model menjadi tidak pas dengan benar pada kumpulan Data.

Berdasarkan hasil ANOVA, gas dan partikel PM2.5, SO2, CO, dan NO2 memiliki pengaruh yang terhadap perubahan Critical indeks udara. Kemudian juga didapatkan pengaruh dari berbagai Stasiun, yang menunjukkan terdapat lokasi Stasiun yang memiliki dampak Kritis terhadap partikel gas tersebut. Kemudian faktor yang berpengaruh terhadap Max dan Category adalah Tanggal yang berarti nilai Category akan menjadi sangat dominan terhadap suatu kondisi dan nilai max akan menjadi sangat tinggi melebihi dari nilai rata-rata max. Berdasarkan hasil uji coba tersebut didapatkan pengaruh yang kritis terhadap Partikulat yaitu PM2.5. Hasil yang diperoleh nilai partikulat ini berada di dalam kategori sedang. Dalam suatu penelitian (Elsa Try Julita Sembiring, 2020) yang masih dalam lingkup suatu daerah di Jakarta mengatakan konsentrasi polutan PM2.5 di lokasi penelitian masih memenuhi baku mutu (<65 µg/m3). menurut Peraturan Pemerintah Republik Indonesia No. 41 tahun 1999 pada kondisi rata-rata 56,078 µg/m3 dan kondisi minimum 35,1 µg/m3 dan sudah melebihi baku mutu pada kondisi maksimum 116 µg/m3 . Namun bila dibandingkan dengan National Ambient Air Quality Standards (NAAQS) US-EPA, kualitas udara sudah melewati baku mutu pada kondisi rata-ratanya. Berbagai material yang terkandung dalam PM2,5 ini dapat menyebabkan berbagai gangguan saluran pernafasan seperti infeksi saluran pernafasan akut (ISPA), kanker paru-paru, kardiovaskular, kematian dini, dan penyakit paru-paru obstruktif kronis (Novirsa et al., 2012; WHO, 2006). Oleh karena itu pada hasil penelitian ini ternyata mendapatkan hasil yang tidak jauh berbeda dibandingkan penelitian sebelumnya dan kemungkinan dari prediksi diperoleh hasil yang memungkinkan selama 10 bulan ke depan juga diperkirakan partikulat ini masih dalam kondisi dengan potensi polusi sedang. Berdasarkan hal itu pemerintah ataupun pembuat kebijakan agar lebih memperhatikan hal tersebut untuk mengurangi berbagai partikel dan gas berbahaya, terutama partikulat PM 2.5.

BIBLIOGRAFI

Nurjannah, Setyo Sri Rahardjo, dan Rossi Sanusi. (2019). “Linear Regression Analysis on the Determinants of Hypertension Prevention Behavior”. https://doi.org/10.26911/thejhpb.2019.04.01.03, e-ISSN: 2549-1172. Google Scholar

Tri Indarwati, Tri Irawati dan Elistya Rimawati. (2018). “Penggunaan Metode Linear Regression untuk Prediksi Penjualan Smartphone”, Jurnal TIKomSiN, Vol. 6, No. 2. ISSN Cetak : 2338-4018, DOI: https://doi.org/10.30646/tikomsin.v6i2.369 ISSN Online : 2620-7532. Google Scholar

T.L Wasilaine, M.W Talakua, dan Y.A Lenussa. (2014). “Model Regresi Ridge Untuk Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinieritas”. Barekeng Vol. 8 No. 1 Hal. 31 – 37. Google Scholar

Ghebyla Najla Ayuni dan Devi Fitrianah. (2019). “Penerapan Metode Regresi Linear Untuk Prediksi Penjualan Properti pada PT XYZ”. Jurnal Telematika, Vol.14, No.2. Institut Teknologi Harapan Bangsa, Bandung p-ISSN: 1858-2516 e-ISSN: 2579-377. Google Scholar

Stephen Chen, Khairil, Anwar Notodiputro, dan Septian Rahardiantoro. (2020). “Penerapan Analisis Lasso dan Group Lasso dalam Mengidentifikasi Faktor-faktor yang Berhubungan dengan Tuberkulosis di Jawa Barat”. Indonesian Journal of Statistics and Its Applications, (eISSN:2599-0802) Vol.4, No.1 (2020), 39 – 54. Google Scholar

Hizkia Edwar Sinaga dan Dewi Retno Sari Saputro. (2021). “Performa Metode Elastic-Net dalam Kasus Multikolinearitas pada Analisis Linear Berganda”. e-ISSN No. 2721-6802. Google Scholar

Lia Nurlia. (2020). “Pengaruh Lokasi Terhadap Keputusan Pembelian Pengunjung di Minimarket Menggunakan Metode Regresi Linier”. Jursistekni Vol 2, ISSN. P: 2715-1875, E: 2715-1883. Google Scholar

Jammaludin dan La Tommeng. (2018). “Pengaruh Teknologi Informasi terhadap Kualitas Layanan di UPT Perpustakaan Universitas Hasanuddin”. Media Pustakawan, Vol. 25 No. 4. Google Scholar

Nur Nafi’iyah dan Eka Rakhmawati. (2021). “Analisis Regresi Linear Dan Moving Average Dalam Memprediksi Data Penjualan Supermarket”. ISSN: 2087-0868, Vol.12, No. 1. Google Scholar

Andika Eka Putra dan Asep Juarna. (2021). “Prediksi Produksi Daging Sapi Nasional dengan Metode Regresi Linier dan Regresi Polinomial”. Jurnal Ilmiah Komputasi, Vol.20, No.2, p-ISSN 1412-9434/e-ISSN 2549-7227. Google Scholar

Ilyas Aji Prakoso, Kusnadi, dan Billy Nugraha. (2021). “Peramalan Penjualan Produk Dengan Metode Regresi Linear Dan Aplikasi Pom-Qm Di Pt Xyz”. Scientific Journal Widya Teknik ,Vol.20, No.1, ISSN 1412-7350 eISSN 2621. Google Scholar

Agus M Soleh dan Aunuddin. (2013). “Lasso: Solusi Alternatif Seleksi Peubah Dan Penyusutan Koefisien Model Regresi Linier”. Indonesian Journal of Statistics, Vol.18, No.1, April 2013, p: 21-27, ISSN 0853-8115. Google Scholar

Elsa Try Julita Sembiring. (2020). “Risiko Kesehatan Pajanan Pm2,5 Di Udara Ambien Pada Pedagang Kaki Lima Di Bawah Flyover Pasar Pagi Asemka Jakarta”, Jurnal Teknik Lingkungan Vol.26, No.1. 7.-Jurnal-TL-ITB-Elsa_SD_REV1-101-120. Google Scholar

Denny Kurniawan. (2008), “Regresi Linier (Linear Regression), statistical computing. R Foundation for Statistical Computing”, Vienna, Austria. ISBN 3-900051-07-0. Google Scholar

G. Shaddick, M. L. Thomas, P. Mudu, G. Ruggeri, dan S. Gumy. (2020). “Half The World’s Population Are Exposed To Increasing Air Pollution, npj Climate and Atmospheric Science”. 3:23, Half the world’s population are exposed to increasing air pollution | Science (nature.com). Google Scholar

Foster Provost dan Tom Fawcett. (2013). “Data Science for Business”. First Edition, Published by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastpol, CA 95472. Google Scholar

Peter Bruce, Andrew Bruce, dan Peter Gedeck. (2020). “Practical Statistics for Data Scientist”. Second Edition, Published by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastpol, CA 95472. Google Scholar

Jagostat. “Analisis Regresi”. Analisis Regresi (jagostat.com) diakses pada tanggal 20 Januari 2022. Google Scholar

Sklearn. “Linear Models User Guide”. 1.1. Linear Models — scikit-learn 1.0.2 documentation diakses pada tanggal 22 Januari 2022. Google Scholar

Dinas Lingkungan Hidup Provinsi DKI Jakarta. (2021). “Laporan Pemantauan Kualitas Udara DKI Jakarta”. URL: Laporan Pemantauan Kualitas Udara | Dinas Lingkungan Hidup DKI Jakarta. Google Scholar

Dasrul Chaniago, Annisa Zahara, Indah Suci Ramadhani. (2020). “Indeks Standar Pencemar Udara (Ispu) Sebagai Informasi Mutu Udara Ambien Di Indonesia”. URL: Portal Direktorat Pengendalian Pencemaran Udara Ditjen Ppkl Klhk (Menlhk.Go.Id) diakses pada tanggal 6 Maret 2022. Google Scholar

© 2022 by the authors. Submitted for possible open access publication under the terms and conditions of the Creative Commons Attribution (CC BY SA) license (https://creativecommons.org/licenses/by-sa/4.0/).