Machine learning for predictive maintenance / Bakım öngörüsü içın makine öğrenimi

Loading...
Publication Logo

Date

2023

Authors

SEJMA CICAK

Journal Title

Journal ISSN

Volume Title

Publisher

Yaşar Üniversitesi / YÜKSEK LİSANS

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Dengesiz veriler birçok alanda yaygın bir sorundur ve makine öğrenimi modellerinin performansını ve genelleştirilebilirliğini önemli ölçüde etkiler. Bunun temel nedeni, modellerin azınlık sınıfındaki örneklerin sağlam bir temsilini oluşturmakta zorlanmasıdır. Çalışmamız, veri dengesizliğinin yaygın bir sorun olduğu tahmine dayalı bakım görevlerinde sınıflandırma başarısını artırmaya odaklanıyor. Bu sorunu çözmek için dengeli veri kümeleri oluşturmak üzere tasarlanmış yeniden örnekleme yöntemlerini kullanıyoruz. Çeşitli aşırı örnekleme ve yetersiz örnekleme yöntemlerini tanıtıyoruz ve bunları sentetik ve gerçek dünya veri kümelerine uyguluyoruz. Ek olarak, sınıflandırma sonuçlarını geliştirmek için birden fazla örnekleme yöntemini birleştirerek hibrit yaklaşımların etkinliğini araştırıyoruz. Çeşitli sınıflandırıcılar kullanan hem dengesiz hem de dengeli veri kümelerini kullanarak sınıflandırma deneyleri yapıyoruz. Bu sınıflandırıcıların performanslarını karşılaştırıyoruz ve özellikle önemli olan, sınıf dengesizliğini gidermedeki etkinliklerine ilişkin içgörü kazanmak için yeniden örnekleme tekniklerinin etkinliğini değerlendiriyoruz. Çalışmamız, sınıflandırma görevlerinde sınıf dengesizliğinin azaltılmasına ilişkin genişleyen literatüre katkıda bulunmakta ve veri kümesi özelliklerine göre uygun örnekleme yöntemlerinin seçilmesi için pratik rehberlik sunmaktadır. Imbalanced data is a common problem in many areas, significantly impacting the performance and generalizability of machine learning models. This is primarily because the models struggle to construct a robust representation of the instances in the minority class. Our study focuses on enhancing classification success in predictive maintenance tasks, where data imbalance is a prevalent challenge. To address this, we employ resampling methods designed to create balanced datasets. We introduce a variety of oversampling and undersampling methods and implement them on synthetic and real-world datasets. Additionally, we explore the effectiveness of hybrid approaches by combining multiple sampling methods to enhance classification results. We conduct classification experiments using both imbalanced and balanced datasets employing diverse classifiers. We compare the performances of these classifiers and, of particular significance, assess the efficacy of resampling techniques to gain insights into their effectiveness in addressing class imbalance. Our study contributes to the expanding literature on mitigating class imbalance in classification tasks and offers practical guidance for selecting suitable sampling methods based on dataset characteristics.

Description

Keywords

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

Downloads

10

checked on Apr 09, 2026

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

SDG data is not available