Repository logoGCRIS
  • English
  • Türkçe
  • Русский
Log In
New user? Click here to register. Have you forgotten your password?
Home
Communities
Browse GCRIS
Entities
Overview
GCRIS Guide
  1. Home
  2. Browse by Author

Browsing by Author "Büyükkeçeci, Mustafa"

Filter results by typing the first few letters
Now showing 1 - 4 of 4
  • Results Per Page
  • Sort Options
  • Loading...
    Thumbnail Image
    Article
    Citation - WoS: 1
    Citation - Scopus: 1
    An Empirical Evaluation of Feature Selection Stability and Classification Accuracy
    (GAZI UNIV, 2024) Mustafa Buyukkececi; Mehmet Cudi Okur; Büyükkeçeci, Mustafa; Okur, Mehmet
    The performance of inductive learners can be negatively affected by high -dimensional datasets. To address this issue feature selection methods are used. Selecting relevant features and reducing data dimensions is essential for having accurate machine learning models. Stability is an important criterion in feature selection. Stable feature selection algorithms maintain their feature preferences even when small variations exist in the training set. Studies have emphasized the importance of stable feature selection particularly in cases where the number of samples is small and the dimensionality is high. In this study we evaluated the relationship between stability measures as well as feature selection stability and classification accuracy using the Pearson 's Correlation Coefficient (also known as Pearson 's Product -Moment Correlation Coefficient or simply Pearson's r ). We conducted an extensive series of experiments using five filter and two wrapper feature selection methods three classifiers for subset and classification performance evaluation and eight real -world datasets taken from two different data repositories. We measured the stability of feature selection methods using a total of twelve stability metrics. Based on the results of correlation analyses we have found that there is a lack of substantial evidence supporting a linear relationship between feature selection stability and classification accuracy. However a strong positive correlation has been observed among several stability metrics.
  • Loading...
    Thumbnail Image
    Conference Object
    Citation - WoS: 4
    Citation - Scopus: 9
    Big data challenges in information engineering curriculum
    (IEEE Computer Society help@computer.org, 2014) Mehmet Cudi Okur; Mustafa Büyükkeçeci; Büyükkeçeci, Mustafa; Okur, Mehmet C.
    The amount of accumulated data is growing at unprecedented rates. This data is mainly unstructured or semi structured and comes from different sources in a variety of forms. Recently a range of supporting storage and distributed parallel computing technologies have been developed and put into use by the sector.The products and implementations include, Apache's Hadoop data processing framework Map Reduce distributed big data management system Cassandra and other NoSQL database and data storage systems. Among the major challenges are, data representation reliable shared storage efficient algorithms and scalable distributed HW/SW infrastructures. Surprisingly current curricula lack the necessary components to create awareness and a good understanding of these state of the art concepts and technologies. There is an urgent need for integrating the developments in big data technologies into the educational programs and computing curricula. This need not only is dictated by the industry but also by the employement dynamics in the related professions. This paper discusses fundemental big data issues and technologies that are considered to be necessary for the existing educational programs in computing information systems and information engineering areas. © 2014 IEEE. © 2014 Elsevier B.V. All rights reserved.
  • Loading...
    Thumbnail Image
    Article
    Müşteri Kayıplarının Tahmini Üzerine Bir Veri Madenciliği Uygulaması
    (2022) Mustafa Büyükkeçeci; mehmet okur; Büyükkeçeci, Mustafa; Okur, Mehmet
    Müşteri memnuniyeti ve sadakati uygun fiyat ürün çeşitliliği hızlı tedarik ve sevkiyat ürün kalitesi satış öncesi ve sonrası hizmetler ve müşteri davranışlarının analiz edilmesi ile sağlanır. Müşteri davranışlarını analiz eden işletmeler hem mevcut müşterilerini koruyabilir hem de yenilerini kazanabilir. Bu çalışmanın amacı işletmeleri terk etme ihtimali olan müşterileri tahmin edebilen gözetimli modeller üretmektir. Bu amaçla toplamda 21 sınıflandırma yöntemi ve telekomünikasyon bankacılık ve e–ticaret sektörlerine ait veri kümeleri kullanılarak deney çalışmaları gerçekleştirilmiştir. Ayrıca işletmelerin harcama alışkanlıklarına göre müşterileri sıralamak ve sınıflandırmak için kullandıkları basit ama etkili bir pazarlama analiz aracı olan RFM (Recency Frequency Monetary Value) bölümlemesi Ki-Kare Testi ile birlikte boyut indirgeme metodu olarak kullanılmıştır. Böylelikle optimal eleman sayısına sahip öznitelik altkümelerinin elde edilmesi ve öznitelik seçim öncesi ve sonrası model performanslarının kıyaslanması hedeflenmiştir.
  • Loading...
    Thumbnail Image
    Doctoral Thesis
    Veri madenciliğinde öznitelik seçim tekniklerinin kararlılıkları ve sınıflandırma performansları arasındaki ilişkinin değerlendirilmesi
    (2019) Büyükkeçeci, Mustafa; Okur, Mehmet Cudi
    Her yıl üretilen ve depolanan veri miktarı üstel olarak artmaktadır. Hem veri kümeleri hem de veri kümesi boyutlarındaki yaşanan bu önemli artış, veri analizi tekniklerini ve algoritmalarını olumsuz yönde etkileyerek karmaşık modellerin üretilmesine, performans kayıplarına ve artan hesaplama maliyetlerine neden olmuştur. Bu problemlerin önlenmesi ve üstesinden gelinmesi için, Öznitelik seçimi gibi, çeşitli veri önişleme teknikleri geliştirilmiştir. Boyut küçültme (indirgeme) tekniği olan öznitelik seçimi, sınıflandırıcıların analiz kalitesini, verimliliğini ve genelleme kapasitesini geliştirmek, hesaplama maliyetlerini azaltmak ve yüksek sınıflandırma veya kümeleme doğruluğuna sahip basit ve anlaşılabilir modeller oluşturmak için kullanılır. Öznitelik seçim algoritmaları tarafından elde edilen öznitelik altkümelerinin sınıflandırma veya kümelenme performanslarının yanı sıra, öznitelik seçim algoritmasının kararlılığı veya sağlamlığı da test edilmelidir. Kararlılık, öznitelik seçim algoritmasının eğitim setinde yapılan değişikliklere karşı hassasiyetinin ölçüsüdür. Düşük hassasiyete sahip algoritma, yani kararlı bir algoritma, eğitim kümesinde yapılan her değişiklikten sonra aynı veya çok benzer sonuçlar (öznitelik altkümeleri veya sıraları) verirken, yüksek hassasiyete sahip algoritma, yani kararsız bir algoritma, her değişiklikten sonra farklı sonuçlar verir. Kararsız bir algoritma tarafından üretilen sonuçlar değişken olacağından, sınıflandırma modellerinin oluşturulmasında kullanılacak sonuçların (öznitelik kümesinin) seçilmesini ve girdi ve çıktılar arasındaki ilişkinin kurulmasını zorlaştırır. Öznitelik seçim algoritmasına olan güveni sarsar. Bu nedenle, algoritma kararlılığı öznitelik seçim algoritmaları için önemli bir başarı kriteridir. Bu tezde kararlılık ile sınıflandırma performansı arasındaki ilişkiyi belirlemek ve yorumlamak için toplam yedi filtreleyen (T-Testi, viiBhattacharyya, Wilcoxon, ROC, Entropi, ReliefF ve Karar Ağacı Topluluğu) ve iki ardışık seçim (Ardışık İleri Öznitelik Seçimi (SFS) ve Ardışık Geri Öznitelik Seçimi (SBS)), veya sarmalayan, öznitelik seçimi algoritması, on iki kararlılık ölçüsü, üç sınıflandırıcı ve yedi gerçek dünya veri kümesi kullanılmıştır.
Repository logo
Collections
  • Scopus Collection
  • WoS Collection
  • TrDizin Collection
  • PubMed Collection
Entities
  • Research Outputs
  • Organizations
  • Researchers
  • Projects
  • Awards
  • Equipments
  • Events
About
  • Contact
  • GCRIS
  • Research Ecosystems
  • Feedback
  • OAI-PMH

Log in to GCRIS Dashboard

GCRIS Mobile

Download GCRIS Mobile on the App StoreGet GCRIS Mobile on Google Play

Powered by Research Ecosystems

  • Privacy policy
  • End User Agreement
  • Feedback