1.1 Derin Öğrenme ve Sinir Ağı Mimarisi

10 min readJan 24, 2023

Derin Öğrenme, sinir ağı modeli oluşturma ve kullanma ile ilgilenen makine öğrenimi içinde bi alandır. Üçten fazla katmana sahip sinir ağları, tipik olarak Derin Öğrenme ağları olarak sınıflandırılır.

Sinir ağları, bir insan beyninin işleyişini taklit eder. Beyin hücrelerine benzer şekilde düzenlenirler ve insanların verileri nasıl işlediğini ve karar aldığını taklit ederler.

Derin öğrenme, son birkaç yılda katlanarak büyüyen bir alandır. Sinir ağları için algoritmalar bir süredir var olsa da GPU’lar gibi çıkarım teknolojilerinin yanı sıra büyük ölçekli veri işlemedeki gelişmeler, gerçek dünya uygulamaları için popülerliklerini artırdı.

Derin öğrenme, doğal dil işlemede son derece popüler olmuştur. Çünkü sinir ağı mimarileri yapılandırılmamış verilerle uğraşmak için idealdir.Aynı nedenler, konuşma tanıma ve sentez uygulamaları içinde popülerdir.

Görüntü tanıma, derin öğrenmenin yol açtığı başka bir alandır. Kendi kendini süren arabalar, derin öğrenme tarafından desteklenen son teknolojidir. Davranışların karmaşık bir şekilde öğrenilmesini gerektiren uygulamalar genellikle Derin Öğrenme için uygundur. Derin öğrenme uygulamaları, müşteri deneyimi, sağlık ve robotik gibi birçok alanda geniş bir popülerlik kazanmaktadır.Derin Öğrenme, sinir ağı modeli oluşturma ve kullanma ile ilgilenen makine öğrenimi içinde bi alandır. Üçten fazla katmana sahip sinir ağları, tipik olarak Derin Öğrenme ağları olarak sınıflandırılır.

Sinir ağları, bir insan beyninin işleyişini taklit eder. Beyin hücrelerine benzer şekilde düzenlenirler ve insanların verileri nasıl işlediğini ve karar aldığını taklit ederler.

Linear Regresyon

Makine öğreniminde kullanılan, Temel istatistiksel kavramlardan biri “doğrusal regresyondur.” Derin öğrenme için önemli bir temel oluşturur. Doğrusal regresyon, iki veya daha fazla değişken arasındaki ilişkiyi açıklayan doğrusal bir modeldir. Bir bağımlı değişkenimiz ve bir bağımsız değişkenimiz x var. Model, x değerine dayalı olarak y değerini hesaplamak için bir denklem sağlar.

Bunu hesaplamak için eğim olan a adı verilen iki sabite ve b olan bir kesme noktasına ihtiyacımız var.

“y” hesaplama formulu y =ax+b dir. Bu y ve x arasındaki doğrusal ilişkiyi sağlar.

Gerçekte ilişki, tamamen doğrusal olmayabilir, bu nedenle tahminlerde hatalar olacaktır.

Sürekli değişkenleri tahmin etmek için regresyon problemlerinde doğrusal(linear) regresyon kullanılır. X1,X2, XN’ye kadar çoklu bağımsız değişkenler için uygulanabilir.

Bu durumda a’ya kadar a1,a2 değerlerinin eşit bir n eğimi olacaktır.

Derin öğrenmede en çok kullanılan ilgili teknik “lojistik regresyon”dur.

Lojistik regresyon iki değişken arasındaki ilişkiyi tanımlayan ikili bir modeldir.

Bu durumda çıktı y, ya sıfırdır ya da birdir. Formül, ax+b’den çıkan sürekli değişkeni sıfır veya bir boole değerine dönüştürmek için f adlı ek bir etkinleştirme işlevi kullanmamız dışında doğrusal regresyona benzer, f fonksiyonunun birden fazla değişkeni ve varyasyonu vardır. Bu denklem, yine x1'den xn’ye kadar birden fazla çok bağımsız değişkene genişletilebilir.

Derin öğrenme, modelin parametlerini daraltmak için bir dizi deneme gerektiren karmaşık ve yinelemeli bir süreçtir. Aslında model parmetrelerinin rasgele başlatılmasıyla başlar ve deneme yoluyla bu paremetrelerin doğru değerlerine göre doğru çalışır.

Doğrusal bir regresyon modeli durumunda, model parametreleri A ve B’dir. A ve B değerleri , X ve Y arasındaki ilişkiyi belirleyen modeli oluşturur.

The Perceptron(Algılayıcı), yapay sinir ağlarında öğrenme birimidir. Bir perceptron, bir yapay sinir ağında denetimli öğrenme için algoritmayı temsil eder. Şnsan beyin hücresine benzer. Perceptron’a birden fazla girdi ile beslenir bu da hesaplamaları yapar ve bir boole değişkeni verir. Bir sinir ağındaki tek bir hücreyi veya düğümü temsil eder.

Lojistik regresyona dayalı olarak inşa edilmiştir.

Perceptron un formülünü elde etmek için üsteki konuda yazdığım lojistik regresyon formülünü kullanıyoruz.

Burada, a eğimini w denen bir ağırlıkla ve b kesişimini b denen sapmayla değiştiriyoruz. Ağırlıklar ve bias, bir sinir ağının parametreleri haline gelir. Ardından, değerlere dayalı bir boole sonucu veren bir etkinleştirme işlevi için f uygularız.

Perceptron için bu formül, derin öğrenmenin temelidir.Aynı perceptronda burada bir şekilde gösterilmiştir.

Perceptron’a beslenen, x1'den xn’ye kadar birden çok bağımsız girdi değişkenimiz var. Her biri karşılıklı ağırlıkla çarpılır. Ağırlıkların sayısı girdilerin sayısına eşittir. Ayrıca bias ile çapılan bir 1'ide besliyoruz. Daha sonra tüm sonuçlar toplanır..y değerini veren bir aktivasyon fonksiyonu uygulanır ya 1 ya da 0'dır. Yani bir dizi perceptronu bağlayarak sinir ağları kurarız.

Artificial Neural Networks(ANN)

Yapay Sinir Ağı(YSA) oluşturmak için perceptronları nasıl kurarız ?

Yapay sinir ağları perceptronlardan oluşur. Bir peceptronun insan beyin hücresini taklit ettğini biliyoruz. Bir insan beyninin bir hücre ağı ile oluşturulmasına benzer şekilde, bir perceptron ağı ile bir yapay sinir ağır oluşturulur.

Perceptron, sinir ağında düğüm olarak adlandırılır. Düğümü, perceptronları temsil etmek amaçlı terim olarak kullanırız. Düğümler, bir sinir ağında çoklu katmanlar halinde düzenlenir. Derin bir sinir ağı genellikle üç veya daha fazla katmana sahiptir. Her düğümün kendi ağırlıkları ve biasları vardır ve aktivasyon işlevi..

Her düğüm, yoğun bir ağ oluşturan sonraki katmandaki tüm düğümlere bağlanır.Bir katmandaki düğümler birbirine bağlı değildir. Bununla birlikte, gelişmiş kullanım durumlarında bunların bazı istisnaları vardır. Girdi katmanında her bağımsız değişken için bir düğüm bulunur.

Bu diyagram örnek bir sinir ağını göstermektedir. Bu örnekte 3 tane var. Bu örnekte gizli katmanın üç katmanı vardır. Birinci katmanda 4 düğüm bulunur. İkinci katmanda 5 düğüm bulunur ce üçüncü katmanın üç düğümü vardır. Her katmandaki çıktı sayısı ve düğüm sayısı, deneyim ve denemelerle belirlenir ve durumdan duruma değişir. Çıktı katmanındaki düğüm sayısı, tahminlerin türüne göre değişecektir. Bu örnekteki çıktı katmanının iki düğümü vardır. Bu düğüm düzenlenmesi, belirli bir sinir ağının mimarisini temsil eder.

Bir ANN tahminler için nasıl çalışır ?

Girişler veya bağımsız değişkenler, ağın giriş katmanından gönderilir.Veriler kullanılmadan önce önceden işlenebilir. Girdiler bir sonraki katmana aktarılır. Her düğüm, weight, bias, activation function içeren bir perceptrondur.

Formül, girdilere ve türetilen çıktılara uygulanır. Bu katmandaki her düğüm için tekrarlanır. Katmandaki tüm düğümlerin sonuçları daha sonra bir sonraki katmana iletilir ve bu işlem tekrarlanır.

Süreç çıktı katmanına ulaştığında, nihai tahminler elde edilecektir.

Training an ANN

Bu ağı nasıl oluşturacağız ?

Bir yapay sinir ağı, bir dizi parametre ve hiperparametre ile temsil edilir. Bu tüm düğümler için weight ve bias değerlerini ve ağdaki düğümlerin katmanlarının sayısını içerir. (weights, biases, nodes, layers, etc.)

Bir yapay sinir ağı modelinin eğitimi, bu parametreler ve hiperparametreler için doğru değerlerin belirlenmesi anlamına gelir.Öyle ki, verilerin kullanım durumu için tahminlerin doğruluğunu maksimize eder.Ayrıca performansın doğruluğunu tehlikeye atabilirler.Kullanım durumuna bağlı olarak girdilerin, weight ve biasların her birinin n boyutlu diziler olabileceğini unutmamalıyız. (ınputs, weights, biases might be n-dimensional arrays)

Örneğin, bir görüntü bir dizi piksel değeriyle temsil edilebilir.

Derin öğrenme eğitimi, weight ve biaslarla benzer şekilde çalışır ve burada A ve B’nin yerini alır. Weight ve bias için rasfele değerlerle başlıyoruz ardından hatayı en aza indirmeye çalısıyoruz. Biz ilerledikçe sonucları doğru bir sekilde tahmin edebilecek weight ve bias değerlerine yaklaştıracağız.

Eğitim süreci daha sonra aşağıdaki gibi ilerleyecektir.

Hem bağımlı hem debağımsız değişkenleri bildiğimiz normal makşne öğrenimi gibi eğitim verilerini kullanırız.

Sezgiye dayalı ağ mimarisi ile başlıyoruz. Ayrıca weight ve biasları rasgele değerlerle başlatırız. Ardından girdilere ağırlık ve bias uygulama ve hatayı hesaplama yinelemelerini tekrarlarız. Bulunan hataya göre, hatayı azaltmak için ağırlıkları ve biasları ayarlayacagiz. Weight ve bias ayarlama sürecini hata kabul edilebilir bir degere gelene kadar tekrarlamaya devam ediyoruz. Ayrıca eğitim hıznı artırmak ve yinelemeleri azaltmak .im ağ hiperparametrelerinde ince ayarlar yapacağız. Son olarak, model parametreleri ve hiperparametreleri ile temsil ettiği şekilde kaydedeceğiz ve sonra onu tahminler için kullanacağız.