Benim rengim “Kodluyoruz”

Ayşe Nur Türkaslan
4 min readDec 7, 2020
Herkesin bir rengi vardır benim rengim “Kodluyoruz” ya senin ki ?

Öncelikle herkese Merhaba :)

Bu yazıda sizlere kodluyoruz ile nasıl çabalarımı kendim için birer katkıya dönüştürdüğümü ve bu sürece ilk adımımı nasıl attığımı daha sonra Bootcamp başvuru süreci ve işleyişi hakkında tecrübelerimi sizlere aktarmak istedim. Umarım keyifli bir okuma olur..

Kodluyoruz’da ki ilk deneyimim Haziran’da İstatistik ve Veri Ön İşleme Çalışma Grubuna kabul edilmem ile başladı. Hala çalışmalarımıza devam ettiğimiz benim için dönüm noktası niteliği taşıyan, paylaşmanın ve birliğin önemini hep hatırlatan çalışma grubuma ve hocalarım Mehmet Yalçın ve Jiyan Aytek’ e teşekkür ederim.

Peki bu süreçte İstatistik ve Veri Ön İşleme kısmında bir çok detaya değindik. Öğrendiklerimizi uygulamak adına her Veri Bilimcinin “hello world!” u olan Titanic Datası üzerinden data preprocessing ve visualization kısmını bireysel bir şekilde tamamladık. Model oluşturma kısmıyla devam etmekteyiz.

Peki siz Kodluyoruz’ a başvurunuzu nasıl yapacaksınız ? Birazda bu süreçle ilgili tecrübelerimi paylaştıktan sonra Eylül ayında hak kazandığım İzmir Uygulamalı Data Science Bootcamp’teki renkli detaylardan bahsedeceğim :))

https://www.kodluyoruz.org ‘a geliyoruuz. Üst kısımda bootcamp başlığı içerisinde dünya çapında genç yeteneklerin içindeki cevheri çıkarmayı amaçlayan ve ücretsiz eğitim, kaynak ve kariyer desteği sağlayan başarılı bir akademi ile karşılaşıyoruz. Aşağı doğru indiğimizde “Başvuru Süreci Devam Eden Bootcamp” leri görmüş olacaksınız. Şimdi geldi kendi ilgi, deneyim ve birikimlerin aynı zamanda kendini geliştirmek istediğin alan doğrultusunda dilediğin bootcamp’a başvurmaya.

Kendi hikayem üzerinden anlatacak olursam bu işleyişi. Ben İzmir Uygulamalı Veri Bilimi Bootcamp’ ine başvuru yaptım. Ve bunu bir başvuru için bir ön form doldurarak gerçekleştirdim. Ön form doldururken kendinizi ve bilgi deneyimizi güzelce aktarmanızı tavsiye ederim. Çünkü bu eğitime uygun olup ya da olmadığımızı anlamaları için senin formu doldururken de kendinle konuştuğun güzel bir an :) Bu şekilde başvurunu yapıyorsun ve bootcamp seçim süreciyle ilgili uzun bir yolculuk başlıyor. Değerlendirme üzerine bootcamp’e en doğru katılımcıları seçmek adına teknik teste giriyorsun. Sadece bu testi geçen adaylarla online mülakat gerçekleştiriliyor. Ben de bu arkadaşlardan biriydim. Sıra geldi mülakat aşamasına ön kayıt formunda verdiğim cevaplar ve testteki performansımla mülakata kabul edilen genç arkadaşlarım arasında yer aldım. Mülakat benim açımdan çok değerliydi. Kendimi ve yaptıklarımı anlattığım yine teknik sorularında eşliğiyle sonucunu merakla beklediğim mülakatı gerçekleştirdik. Mülakat sonucu en az 7 ya da 10 gün içerinde açıklanıyor.

Sanırım o gün aldığım en güzel haberdi. Havalara uçmuştum :) İnsan kendi mutlu olma imkanını görebilmeli değil mi ?? Ve tabii ki mülakatım olumlu sonuçlanmıştı. İzmir Uygulamalı Veri Bilimi Bootcamp öğrencisi olmuştum artık..

Eylül ayında başladığımız eğitimin içeriğinden, bana kattıklarından, sundukları imkanlardan bahsedeceğim…Ben bu yazıyı yazarken Bootcamp’te bitirme projemiz üzerinde çalışmakta ve aynı zamanda verilen ödevleri yapmakta, mezun şartlarımız arasında olan kod yazmadaki pratikliğimi arttırmaktayım. Anlayacağınız tempo dolu bir süreç ve çokta keyifli.. Ama siz bunu okurken ben mezun olmuş olacağımm :))

Bu bootcamp boyunca hocalarımın izlediği CRISP-DM methodlojisi aşağıdaki gibidir. Sizde bu başlıklar çerçevisinde çalışmalarınızı haftalara bölüp bu programı kullanarak çalışmalarınızı düzenli bir şekilde ilerletebilirsiniz.

İlk hafta ve tabii ki eğlenceli tanışma toplantımızla başladı bunu asla atlayamamazdım :)

İlk konumuz “Business Understanding” başlığı altında incelediğimiz

  • “Business Goal Declaration”
  • “Expected Value Framework(EVF)” ve
  • “Business Strategy Declaration”

kısımlar üzerinde yoğunlaşarak başladık. Sizinde insanlığın evrim geçirmesiyle birlikte oluşan bilginin, verininde evrimleşmesi hakkındaki düşüncelerini merak ediyorum ?

ilk haftanın konuları arasında bir de bu işin temel taşı “Data Understanding” kısmını yani ;

  • “Data Preprocessing”
  • “Variable Type and Data Structure Consitency” (Numerical ve Categorical Features)
  • “Data Structure Control”(Float/String) ve
  • Building The Target Variable(Regression or Classification)

başlıklarını detaylıca ele alındı.

Daha sonra “Data Analysis” konu başlığıyla devam eden ödevlerimizinde hızla şekillendiği konulara girdik. “Preparatory Data Analysis(PDA)” kısmında :

  • Data Dropping
  • Data Splitting(Train/Test)
  • Outlier Handling(detection or outlier cleaning)
  • Missing Data Handling
  • Feature Engineering

kısımlarında uygulamalar yapıp konuyu pekiştirmemiz için ödevler verilen şahsen benim yaparken öğrendiğimi uygulama tadını en iyi hissettiğim kısımdı ödevler.

Akış esnasında “Exploratory Data Analysis(EDA)” kullandığımız çeşitli görselleştirme araçları sayesinde de bir yandan veri görselleştirme kısmında da bilgilerimizi harmanladık. (boxplot, scatter-plot/histogrom vs.) Bunlar kendi içinde “univarite plots” ve “multivarite plots” olarak ayrılıyor.

Sıra geldi işin asıl derinliklerine indiğimiz (buradan mükemmel hocama Caglar Subasi ’ya en güzel teşekkürlerimi sunuyorum.) istatistiksel boyutta ele aldığımız ve öğrendiğim konu başlıklarına.. Sizde çalışmalarınızı yaparken bu konular üzerinde derinlere inmenizi ve mantığını kavrayarak neler yapılabilir ve nasıl yorumlamalarda bulunulabilir kavramanız ve uygulamanızı tavsiye ederim.

“Confirmatory Data Analysis(CDA)” başlığı altında:

  • Feature Selection(Importances, Associations and Significances) üzerinden “Chi-square Test for Nominal Features”, “Spearman Rank Correlations for Ordinal Features”, “ Anova Test for Numerical Features”, “Information Values (Iv)”, “Permutation Importances (Pi)” ve “Stepwise Regression (P-values After Woe-transformation) for All Features” konularını detaylıca öğrendik.

Data modelleme kısmında “modelling” başlığı altında :

  • “Transformation (Scaling Numerical Variables)” ve
  • Encoding Categorical Variables (Classic/Contrast/Bayesian) konularını tamamladık. Bunlar (Data Transformation and Encoding) kısmına giriyor.

Daha sonra yine aynı başlık altında “Metric, Baseline and Estimator/Classifier Selection” ele alındı ve “model evulation” kısmında (metric selection,beaseline selection) incelendi.

Estimator/Classifier Selection başlığı altında :

  • K-nearest Neighbors (Knn)
  • Naive Bayes Classifier
  • Logistic Regression Classifier
  • Support Vector Machines Classifier
  • Neural Network Classifiers ( 1. Multi-layer Perceptron (Mlp), 2. Convolutional Neural Networks (Cnn), 3. Recurrent Neural Networks (Rnn)

Ensembled Classifiers başlığı altında (1. Random forest Classifier (Bagging), 2. Gradient Boosting Classifier, 3. Stacked Generalization (Stacking) konuları anlatıldı.

Daha sonra yine modelling başlığı altında Model Selection (Hyperparameter Tuning) kısmı ile sona yaklaştık..

En son Değerlendirme kısmında “Using Expected Value To Frame Model Evaluation”

ve son olarak Dağıtım kısmında ise;

  • Optimization
  • Micro-service Construction

konularını ele aldık.

Sıra geldi öğrendiklerimizi icraat e döktüğümüz mezun projelerimizi sunmaya. Gerçekleştirdiğimiz proje de takım arkadaşımla birlikte ABD’nin 1999–2008 yıllarındaki Diyabet datası üzerinden Sınıflandırma analizi gerçekleştirdik.

Sizlerde projemizin detaylarına bu linkler üzerinden erişebilirsiniz.

github

kaggle

Umarım kendi rengini belirlemek isteyen, hayallerine sıkıca tutunmuş ve gerçekleştirmek isteyen kişilere ışık olur. Konu başlıkları sizinde üzerinde uzunca çalışacağınız yeri geldiğinde makale okuma alışkanlığını fazlasıyla edineceğiniz, çeşitli kitaplarla daha fazla detayda buluşacağınız bir yön atlası oluştursun istedim.

Ve değerli Pelin İrtem ve Emre İrtem Bootcamp eğitmenlerime çok teşekkür ediyorum..

koskoca sevgiler :))

--

--