Browsing by Author "Özen, Elif"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Master Thesis Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar(2022) Özen, Elif; Özkurt, NalanGünümüzde teknolojik gelişmelerin ışığında iletişim giderek daha fazla önem kazanmaktadır. İletişim çeşitli yöntemlerle gerçekleşse de en sık kullanılan iletişim tabanlarından biri konuşmadır. Günümüzde iletişim sadece insanlar arasında değil, birçok önemli uygulamada insanlarla makineler arasında gerçekleşmektedir. Bu nedenlerden dolayı, iletişimin sorunsuz bir şekilde sağlanabilmesi için konuşma sinyalinin temiz ve anlaşılır olması gerekir. Konuşma iyileştirme uygulamaları, gürültü etkisini mümkün olduğunca ortadan kaldırarak konuşma sinyallerinin kalitesini ve anlaşılırlığını artırmak için kullanılır. Konuşma tabanlı uygulamaların artmasıyla bu alandaki araştırmalar da hız kazanmıştır. Bu amaçla kullanılan yöntemler, tek kanallı ve çok kanallı yöntemler olmak üzere iki ana sınıf altında incelenir. Bu çalışmada, dalgacık dönüşümü yardımıyla şimdiye kadar kullanılan yöntemin başarısını artırmak için her yöntem için yeni bir yaklaşım önerdik. Önerilen ilk yöntem, bir dalgacık dönüşümü alan uyarlamalı filtre sistemidir. Konuşma sinyalleri ve gürültü, statik olarak durağan olmayan sinyaller olduğundan, uyarlanabilir filtreler, gürültüyü gidermek için en çok tercih edilen yöntemlerden biridir. Ancak, zaman alanında uyarlanabilir filtre uygulamasının, büyük veri kümeleri için daha düşük yakınsama hızı ve oranı gibi bazı eksiklikleri vardır. Bu nedenle bazı çalışmalarda Dönüşüm Alanında Uyarlanabilir Filtreler (DAUF) kullanılmıştır. Önerilen yöntemle, dalgacık dönüşümü alanında tam olarak uygulanan çoklu alt bant uyarlamalı filtreler ile mevcut DAUF'in yakınsama hızı, yakınsama oranı ve hesaplama karmaşıklığı açısından eksikliklerini gidermeyi amaçladık. Önerilen sistemin performansı, beyaz gürültü, pembe gürültü, gevezelik gürültüsü, motor rölanti gürültüsü, uçak kokpit gürültüsü gibi çeşitli gürültülerin etkisi altında konuşma sinyalleri üzerinde test edilmiştir. Sonuçları değerlendirmek için yaygın olarak kullanılan objektif ölçümler kullanıldı. Ancak, çalışmadaki öncelikli odak noktamız konuşma sinyallerini iyileştirmek olduğundan, amacımız sadece sinyal üzerindeki gürültüyü azaltmak değil, aynı zamanda konuşma sinyallerinin kalitesini ve anlaşılırlığını artırmaktır. Bu nedenle, işlenmiş konuşma sinyallerini değerlendirmek için Konuşma Kalitesinin Algısal Değerlendirmesi (PESQ) ve Kısa Süreli Amaç Anlaşılabilirlik puanı (STOI) gibi nesnel ölçüler kullanıldı. Son olarak sonuçlar literatürdeki çalışmalarla karşılaştırılmıştır. Tezde önerilen ikinci yöntem, dalgacık dönüşümü ile birleştirilmiş bir Evrişimsel Sinir Ağıdır (ESA). Bu yöntem, bir tek kanallı bir konuşma geliştirme uygulamasıdır ve bu yöntemdeki ana zorluk, konuşma sinyallerini bilinmeyen gürültüden ayırt etmektir. Bunu sağlamak için son yıllarda birçok derin öğrenme tabanlı yöntem kullanılmaktadır. ESA da son yıllarda konuşma iyileştirme için kullanılan yöntemlerden birisidir. ESA, normalde birçok uygulamada görüntü sinyallerini işlemek için kullanılır. Bu yöntemde, biz Sürekli Dalgacık Dönüşümünün (SDD) büyüklüğü ile elde edilen skalogramlarla ESA'yı eğittik. Bu şekilde, scalogramlar da görüntü gibi iki boyutlu veriler olduğu için ESA'nın en iyi özelliklerinden yararlanmayı amaçladık. Ayrıca dalgacık dönüşümü, sinyalleri zaman-frekans düzleminde gözlemlemek için en iyi yöntemlerden biridir. Çalışmanın bu bölünde, ESA'yı dalgacık dönüşümüyle birleştirerek, dalgacık dönüşümünün mevcut yöntemlerin başarısını artırma ve hesaplama karmaşıklığını azaltma açısından katkısını araştırdık. Son olarak, sonuçları standart konuşma değerlendirme ölçütleriyle değerlendirdik ve karşılaştırmalar ile sunduk.

