Machine learning for predictive maintenance / Bakım öngörüsü içın makine öğrenimi
Loading...

Files
Date
2023
Authors
SEJMA CICAK
Journal Title
Journal ISSN
Volume Title
Publisher
Yaşar Üniversitesi / YÜKSEK LİSANS
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Dengesiz veriler birçok alanda yaygın bir sorundur ve makine öğrenimi modellerinin performansını ve genelleştirilebilirliğini önemli ölçüde etkiler. Bunun temel nedeni, modellerin azınlık sınıfındaki örneklerin sağlam bir temsilini oluşturmakta zorlanmasıdır. Çalışmamız, veri dengesizliğinin yaygın bir sorun olduğu tahmine dayalı bakım görevlerinde sınıflandırma başarısını artırmaya odaklanıyor. Bu sorunu çözmek için dengeli veri kümeleri oluşturmak üzere tasarlanmış yeniden örnekleme yöntemlerini kullanıyoruz. Çeşitli aşırı örnekleme ve yetersiz örnekleme yöntemlerini tanıtıyoruz ve bunları sentetik ve gerçek dünya veri kümelerine uyguluyoruz. Ek olarak, sınıflandırma sonuçlarını geliştirmek için birden fazla örnekleme yöntemini birleştirerek hibrit yaklaşımların etkinliğini araştırıyoruz. Çeşitli sınıflandırıcılar kullanan hem dengesiz hem de dengeli veri kümelerini kullanarak sınıflandırma deneyleri yapıyoruz. Bu sınıflandırıcıların performanslarını karşılaştırıyoruz ve özellikle önemli olan, sınıf dengesizliğini gidermedeki etkinliklerine ilişkin içgörü kazanmak için yeniden örnekleme tekniklerinin etkinliğini değerlendiriyoruz. Çalışmamız, sınıflandırma görevlerinde sınıf dengesizliğinin azaltılmasına ilişkin genişleyen literatüre katkıda bulunmakta ve veri kümesi özelliklerine göre uygun örnekleme yöntemlerinin seçilmesi için pratik rehberlik sunmaktadır.
Imbalanced data is a common problem in many areas, significantly impacting the performance and generalizability of machine learning models. This is primarily because the models struggle to construct a robust representation of the instances in the minority class. Our study focuses on enhancing classification success in predictive maintenance tasks, where data imbalance is a prevalent challenge. To address this, we employ resampling methods designed to create balanced datasets. We introduce a variety of oversampling and undersampling methods and implement them on synthetic and real-world datasets. Additionally, we explore the effectiveness of hybrid approaches by combining multiple sampling methods to enhance classification results. We conduct classification experiments using both imbalanced and balanced datasets employing diverse classifiers. We compare the performances of these classifiers and, of particular significance, assess the efficacy of resampling techniques to gain insights into their effectiveness in addressing class imbalance. Our study contributes to the expanding literature on mitigating class imbalance in classification tasks and offers practical guidance for selecting suitable sampling methods based on dataset characteristics.
Description
Keywords
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
Collections
Downloads
10
checked on Apr 09, 2026
