Özellik Çıkarma
- FİGES AŞ
- MATLAB&Simulink
- Probleminizi Nasıl Çözeceğinizi Keşfedin
- Özellik Çıkarma
Özellik Çıkarma Nedir?
Makine öğrenimi ve derin öğrenme için özellik çıkarma
Özellik çıkarımı, ham veriyi, orijinal veri setindeki bilgileri korurken işlenebilecek sayısal özelliklere dönüştürme sürecini ifade eder. Makine öğrenimini doğrudan ham verilere uygulamaktan daha iyi sonuçlar verir.
Özellik çıkarma, manuel veya otomatik olarak gerçekleştirilebilir:
- Manuel özellik çıkarma, belirli bir problemle ilgili özelliklerin tanımlanmasını ve tanımlanmasını ve bu özelliklerin çıkarılması için bir yol uygulanmasını gerektirir. Çoğu durumda, arka plan veya etki alanı hakkında iyi bir anlayışa sahip olmak, hangi özelliklerin yararlı olabileceği konusunda bilinçli kararlar alınmasına yardımcı olabilir. Onlarca yıllık araştırmalar sonucunda mühendisler ve bilim insanları görüntüler, sinyaller ve metinler için özellik çıkarma yöntemleri geliştirdiler. Basit bir özelliğin bir örneği, bir sinyaldeki bir pencerenin ortalamasıdır.
- Otomatik özellik çıkarımı, insan müdahalesine ihtiyaç duymadan özellikleri sinyallerden veya görüntülerden otomatik olarak çıkarmak için özel algoritmalar veya derin ağlar kullanır. Bu teknik, ham verilerden hızla makine öğrenimi algoritmaları geliştirmeye geçmek istediğinizde çok yararlı olabilir. Dalgacık saçılımı, otomatik özellik çıkarımına bir örnektir.
Derin öğrenmenin yükselişiyle, özellik çıkarmanın yerini büyük ölçüde derin ağların ilk katmanları aldı- ama çoğunlukla görüntü verileri için. Sinyal ve zaman serisi uygulamaları için, özellik çıkarımı, etkili tahmine dayalı modeller oluşturmadan önce önemli uzmanlık gerektiren ilk zorluk olmaya devam ediyor.
Sinyaller ve Zaman Serisi Verileri için Özellik Çıkarımı
Özellik çıkarımı, bir makine öğrenimi veya derin öğrenme algoritmasının daha kolay tüketebileceği sinyallerdeki en ayırt edici özellikleri tanımlar. Makine öğrenimi veya derin öğrenmeyi doğrudan ham sinyallerle eğitmek, yüksek veri hızı ve bilgi fazlalığı nedeniyle genellikle kötü sonuçlar verir.
Bir makine öğrenimi sınıflandırıcısı için sinyallere ve zaman serisi verilerine özellik çıkarımı uygulamak için şematik süreç.
Sinyal özellikleri ve zaman-frekans dönüşümleri
Signal Processing Toolbox ™ veWavelet Toolbox , sinyalleri ve sensör verilerini analiz ederken, bir sinyalin zaman, frekans ve zaman-frekans alanlarındaki ortak ayırt edici özelliklerini ölçmenizi sağlayan işlevler sunar. Darbe ve geçiş ölçümlerini uygulayabilir, sinyal-gürültü oranını (SNR) ölçebilir, spektral entropi ve basıklığı tahmin edebilir ve güç spektrumlarını hesaplayabilirsiniz.
Kısa süreli Fourier dönüşümü (STFT) gibi zaman-frekans dönüşümleri, makine öğrenimi ve derin öğrenme modellerinde eğitim verileri için sinyal temsilleri olarak kullanılabilir. Örneğin, evrişimli sinir ağları (CNN’ler) görüntü verilerinde yaygın olarak kullanılır ve zaman-frekans dönüşümleri tarafından döndürülen 2B sinyal temsillerinden başarılı bir şekilde öğrenebilir.
Kısa süreli Fourier dönüşümü kullanan bir sinyalin spektrogramı. Spektrogram, frekans içeriğinin zaman içindeki değişimini gösterir.
Spesifik uygulamaya veya özelliklere bağlı olarak diğer zaman-frekans dönüşümleri kullanılabilir. Örneğin, sabit Q dönüşümü (CQT), logaritmik aralıklı bir frekans dağılımı sağlar; sürekli dalgacık dönüşümü (CWT) genellikle durağan olmayan sinyallerdeki kısa geçişleri belirlemede etkilidir.
Tıbbi görüntü analizi algoritmaları, giyilebilir cihazlardan toplanan dijital sağlık verileri gibi büyük miktarda veriye uygulanabilir. Algoritmalar, hastalıkları ve sağlık risklerini yönetmenin yanı sıra sağlığı ve refahı teşvik etmek için kullanılabilir.
Ses uygulamaları ve öngörücü bakım için özellikler
Audio Toolbox™, genellikle ses, konuşma ve akustik için kullanılan Mel spektrogramları, oktav ve gamaton filtre bankaları ve ayrık kosinüs dönüşümü (DCT) dahil olmak üzere bir zaman-frekans dönüşümleri koleksiyonu sağlar. Bu tür sinyaller için diğer popüler özellik çıkarma yöntemleri arasında Mel frekansı cepstral katsayıları (MFCC), gamaton cepstral katsayıları (GTCC), ses perdesi, harmoniklik ve farklı türde işitsel spektral tanımlayıcılar bulunur. Audio Feature Extractor aracı, verimlilik için herhangi bir ara hesaplamayı yeniden kullanırken, aynı kaynak sinyalinden farklı ses özelliklerinin seçilmesine ve çıkarılmasına yardımcı olabilir.
Predictive Maintenance Toolbox™ içindeki Diagnostic Feature Designer uygulaması, titreşim gözleme ve öngörücü bakım için uygulamalar geliştiren mühendisler için, makine sağlığını izlemeye yönelik durum göstergeleri tasarlamak adına özellikleri ayıklamanıza, görselleştirmenize ve sıralamanıza olanak tanır.
Teşhis Özelliği Tasarımcısı Uygulaması, nominal ve hatalı sistemler arasında ayrım yapmak için özellikleri tasarlamanıza ve karşılaştırmanıza olanak tanır.
Otomatik özellik çıkarma yöntemleri
Otomatik hale getirilmiş özellik çıkarma, optimize edilmiş modeller sunan eksiksiz AutoML iş akışının bir parçasıdır. İş akışı, özellik seçimini, model seçimini ve hiperparametre ayarını otomatik hale getiren üç basit adımı içerir.
Sinyallerden özellikleri otomatik olarak çıkarmak için yeni üst düzey yöntemler ortaya çıktı. Otomatik kodlayıcılar, Dalgacık saçılımı ve derin sinir ağları, özellikleri ayıklamak ve verilerin boyutluluğunu azaltmak için yaygın olarak kullanılır.
Dalgacık saçılma ağları, gerçek değerli zaman serilerinden ve görüntü verilerinden düşük varyanslı özelliklerin çıkarılmasını otomatik hale getirir. Bu yaklaşım, sınıflar arasında ayırt edilebilirliği korurken bir sınıf içindeki farklılıkları en aza indiren veri temsilleri üretir. Dalgacık saçılımı, başlamak için çok fazla veriniz olmadığında iyi çalışır.
Görüntü Verileri için Özellik Çıkarma
Görüntü verileri için özellik çıkarımı, bir görüntünün ilginç kısımlarını kompakt bir özellik vektörü olarak temsil eder. Geçmişte bu, özel özellik algılama, özellik çıkarma ve özellik eşleştirme algoritmaları ile gerçekleştiriliyordu. Günümüzde derin öğrenme, görüntü ve video analizinde yaygındır. Özellik çıkarma adımını atlayarak ham görüntü verilerini girdi olarak alma becerisiyle bilinir hale gelmiştir. Hangi yaklaşımı benimserseniz benimseyin, görüntü kaydı, nesne algılama ve sınıflandırma ve içerik tabanlı görüntü alma gibi bilgisayar görüşü uygulamalarının tümü, ya derin bir ağın ilk katmanları tarafından dolaylı olarak ya da uzun süredir devam eden görüntü özelliği çıkarma tekniklerinden bazılarının açıkça uygulanmasıyla, görüntü özelliklerinin etkili bir şekilde temsil edilmesini gerektirir.
Karmaşık bir sahnede (sağda) bir nesneyi (solda) özellik algılama, özellik çıkarma ve eşleştirmenin bir kombinasyonunu kullanarak algılama. Ayrıntılar için örneğe bakın.
Computer Vision Toolbox™ ve Image Processing Toolbox™ tarafından sağlanan özellik çıkarma teknikleri şunları içerir:
- Yönlü gradyanların histogramı (HOG)
- Hızlandırılmış sağlam özellikler (SURF)
- Yerel ikili örüntü (LBP) özellikleri
Yönlü gradyanların (HOG) histogramı, görüntünün çıkarılmasını içerir (üstte). Görüntüyü farklı hücre boyutuyla (altta) temsil etmek için farklı boyutlarda özellik vektörleri oluşturulur. Ayrıntılar için örneğe bakın.
Örnekler ve Nasıl Yapılır?
- Dalgacık Kavrama, Bölüm 5: Dalgacık Saçılımı ile Makine Öğrenimi ve Derin Öğrenme (4:03) – Video
- Ses Özellikleri için Sıralı Özellik Seçimi – Örnek
- Derin Öğrenmeyi Kullanarak Özellik Çıkarma – Örnek
- Nokta Özelliği Eşleştirmeyi Kullanarak Dağınık Bir Sahnedeki Nesneleri Algılama – Örnek
- Whale Song’dan İlgi Alanlarını Çıkarın – Örnek
Yazılım Referansı
- Spektral Analiz – Belgeleme
- Ses Spektral Tanımlayıcıları – Ses sinyallerinin spektral şeklini nitelendirin – Belgeleme
- extractFeatures: İlgi Noktası Tanımlayıcılarını Ayıkla – İşlev
- DetectSURFFeatures: SURF Özelliklerini Algıla – İşlev
- MSERRegions: Maksimum Kararlı Ekstrem Bölgeler (MSER) - Belgeleme
- extractHOGFeatures: Yönlü Gradyan Özellik Çıkarımının Histogramı – Belgeleme
- Seyrek Filtreleme ve Yeniden Oluşturma ICA Algoritmaları – Belgeleme