Perancangan Pipeline ETL dan Peramalan Data NYC Green Taxi Trip Menggunakan Long Short-Term Memory (LSTM)

Authors

  • I Made Panji Adnyana Putra Institut Bisnis dan Teknologi Indonesia Author
  • I Wayan Sudiarsa Institut Bisnis dan Teknologi Indonesia Author
  • I Made Adi Sanjana Putra Institut Bisnis dan Teknologi Indonesia Author
  • I Gede Budhi Ari Saputra Institut Bisnis dan Teknologi Indonesia Author
  • I Made Mandala Putra Institut Bisnis dan Teknologi Indonesia Author

Keywords:

Data Engineering, ETL, LSTM, Time Series, Peramalan Taksi.

Abstract

Data perjalanan taksi merupakan salah satu sumber data deret waktu yang penting dalam sistem transportasi perkotaan karena mencerminkan pola mobilitas masyarakat. Namun, data mentah perjalanan taksi umumnya masih mengandung nilai tidak valid, anomali, serta format yang tidak terstruktur sehingga memerlukan proses pengolahan yang sistematis sebelum digunakan untuk analisis dan peramalan. Penelitian ini bertujuan untuk merancang pipeline Extract, Transform, Load (ETL) dan menerapkan algoritma Long Short-Term Memory (LSTM) dalam melakukan peramalan jumlah perjalanan NYC Green Taxi. Dataset yang digunakan berasal dari Kaggle, yaitu data perjalanan NYC Green Taxi bulan Februari 2016. Proses ETL dilakukan melalui tahap ekstraksi data, pembersihan data anomali, konversi format waktu, rekayasa fitur berbasis waktu, serta agregasi data menjadi jumlah perjalanan per jam. Data hasil transformasi kemudian dinormalisasi menggunakan MinMaxScaler dan dibentuk menjadi sekuens menggunakan metode sliding window dengan panjang 24 jam sebelum digunakan sebagai input model LSTM. Data dibagi menjadi 80% data latih dan 20% data uji secara temporal. Model LSTM dibangun menggunakan dua lapisan LSTM dengan dropout dan satu lapisan Dense sebagai output, kemudian dilatih selama 50 epoch. Evaluasi kinerja model dilakukan menggunakan metrik Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE), dan Mean Absolute Percentage Error (MAPE). Hasil pengujian menunjukkan bahwa model LSTM menghasilkan nilai MAE sebesar 318,12, RMSE sebesar 406,31, dan MAPE sebesar 17,27% pada data uji, yang menunjukkan bahwa model memiliki tingkat akurasi dan kemampuan generalisasi yang baik. Hasil penelitian membuktikan bahwa integrasi pipeline ETL dan model LSTM efektif dalam menghasilkan peramalan jumlah perjalanan taksi yang akurat dan stabil. Pendekatan ini berpotensi digunakan sebagai sistem pendukung pengambilan keputusan dalam perencanaan armada dan manajemen transportasi perkotaan berbasis data.

Downloads

Published

2026-01-21

Similar Articles

31-40 of 219

You may also start an advanced similarity search for this article.