VERİ BİLİMCİ İÇİN BİR BİLET LÜTFEN!

# Bu paylaşımda veri bilimci olma projesinin tanıtım yazısını okuyacaksınız. #


Projede amaçlanan; bir yol haritasını takip ederek hedefimize ulaşmak.
Küçük adımlarla başlayıp veri bilimci olana kadar devam edecek yolculuğumuza hoş geldiniz.
Uzun soluklu bir yolculuk olacak ve aşağıdaki hedefleri takip ederek ana hedefe ulaşmaya çalışacağız. Seviye olarak herkese uygundur, sadece katılacağınız duraklar değişiklik gösterecektir.
Keyifli, sabırlı yolculuklar..


Haydi şimdi veri bilimci olmak için hazırlanan yol haritasına bakalım.

Becoming a Data Scientist – Curriculum via Metromap
Posted on July 8, 2013 by Swami Chandrasekaran

 

Ana adımlar;
1. TEMEL- BAŞLANGIÇ
1.1. Matrisler & Lineer Cebir Temelleri
1.2. Hash Fonksiyonları, İkili Ağaç, O(n)
1.3. İlişkisel Cebir, Veri Tabanı Temelleri
1.4. İç, Dış, Çapraz, Theta Birleştirme
1.5. CAP Teoremi (Consistency (Tutarlılık) – Availability (Erişebilirlik)- Partition Tolerance (Parçanın Eksilmesine Tolerans))
1.6. Tablo Verileri
1.7. Entropi
1.8. Veri Çerçeveleri & Serileri
1.9. Küçük Parçalara Ayırma
1.10. OLAP
1.11. Çok Boyutlu Veri Modeli
1.12. ETL
1.13. Raporlama, BI (İş zekası), Analitik
1.14. JSON & XML
1.15. NoSQL
1.16. RegeX
1.17. Satıcı Manzarası
1.18. Env Kurulumu

2. İSTATİSTİK
2.1. Veri Kümesi Seç (UCI Repo)
2.2. Tanımlayıcı İstatistikler (Ortalama, Medyan, Aralık, Standart Sapma, Varyans)
2.3. Keşifsel Veri Analizi
2.4. Histogramlar
2.5. Yüzdelikler & Aykırı Değerler
2.6. Olasılık Teorisi
2.7. Bayes Teoremi
2.8. Rasgele Değişkenler
2.9. Kümülatif Dağılım Fonksiyonu
2.10. Sürekli Dağılımlar (Normal, Poisson, Gauss)
2.11. Çarpıklık
2.12. ANOVA
2.13. Olasılık Yoğunluğu Fonksiyonu
2.14. Merkezi Limit Teoremi
2.15. Monte Karlo Metotu
2.16. Hipotez Testi
2.17. P-Değeri
2.18. Ki² Testi
2.19. Tahmin
2.20. Güven Aralığı
2.21. Maksimum Olabilirlik Kestirimi
2.22. Çekirdek Yoğunluğu Tahmini
2.23. Regresyon-Gerileme
2.24. Kovaryans
2.25. Korelasyon- Bağıntı
2.26. Pearson Korelasyon
2.27. Neden- Sonuç İlişkisi
2.28. En Küçük Kareler Yöntemi
2.29. Öklid Uzaklığı

3. PROGRAMLAMA
3.1. Phyton Temel Bilgileri
3.2. Excel’ de Çalışma
3.3. R Kurulumu & R Stüdyosu
3.4. R Temel Bilgileri
3.5. İfadeler
3.6. Değişkenler- IBM SPSS & Rapid Miner
3.7. Vektörler
3.8. Matrisler
3.9. Diziler
3.10. Faktörler
3.11. Listeler
3.12. Veri Çerçeveleri
3.13. CSV Verilerini Okuma
3.14. Ham Verileri Okuma
3.15. Verileri Altkümeleme
3.16. Veri Çerçevelerini Değiştirme
3.17. Fonksiyonlar
3.18. Faktör Analizi
3.19. Paketleri Yükleme

4. MAKİNE ÖĞRENMESİ (ML)
4.1. Makine Öğrenmesi Nedir?
4.2. Sayısal Değişkenler
4.3. Kategorik Değişken
4.4. Denetimli Öğrenme
4.5. Denetimsiz (Gözetimsiz) Öğrenme
4.6. Konseptler, Girdiler & Nitelikler
4.7. Eğitim & Test Verileri
4.8. Sınıflandırıcı
4.9. Tahmin
4.10. Kaldırma (Lift)
4.11. Aşırı Uyum Gösterme
4.12. Yanlılık & Varyans
4.13. Ağaçlar & Sınıflandırma
4.14. Sınıflandırma Oranı
4.15. Karar Ağaçları           
4.16. Hızlandırma –Artırma
4.17. Naive Bayes Sınıflandırıcılar
4.18. K- En Yakın Komşu
4.19. Lojistik Regresyon
4.20. Sıralama
4.21. Lineer Regresyon
4.22. Algılama
4.23. Hiyerarşik Kümeleme
4.24. K-Ortalama Kümeleme
4.25. Sinir Ağları
4.26. Duygu Analizi
4.27. İşbirlikçi Filtreleme
4.28. Etiketleme

5. METİN MADENCİLİĞİ (NLP)
5.1. Korpus
5.2. Adlandırılmış Varlık Tanıma
5.3. Metin Analizi
5.4. UIMA
5.5. Terim Belge Matrisi
5.6. Terim Frekansı ve Ağırlığı
5.7. Destekçi Vektör Makineleri
5.8. İlişkilendirme Kuralları
5.9. Pazar Tabanlı Analiz
5.10. Özellik Çıkarma
5.11. Mahout Kullanma
5.12. Weka Kullanma
5.13. NLTK Kullanma
5.14. Metni Sınıflandır
5.15. Kelime Haritalama

6. GÖRSELLEŞTİRME
6.1. R’ da Veri Keşfi (Histogram, Box- plot grafiği vb.)
6.2. Tek ,İki & Çok Değişkenli Görselleştirme
6.3. ggplot2
6.4. Histogram & Pasta Grafik (Uni)
6.5. Ağaç & Ağaç Haritası
6.6. Dağılım Grafiği (İş Zekası )
6.7. Çizgi Grafikler (İş Zekası)
6.8. Uzamsal (Konum) Grafikler
6.9. Survey Plot
6.10. Zaman Çizelgesi
6.11. D3.js
6.12. Bilgi görselleştirilmesi
6.13. IBM Many Eyes
6.14. Tablo

7. BÜYÜK VERİ
7.1. MapReduce Temelleri
7.2. Hadoop Bileşenleri
7.3. HDFS
7.4. Veri Çoğaltma İlkeleri
7.5. Hadoop Kurulumu (IBM / Cloudera/ HortonWorks)
7.6. Ad & Veri Düğümleri
7.7. İş & Görev Takibi
7.8. M/ R Programlama
7.9. Sqoop : HDFS ‘ de Veri Yükleme
7.10. Flume, Scribe: Yapılandırılmamış Veriler İçin
7.11. Pig ile SQL
7.12. Hive ile DWH
7.13. Weblog için Scribe, Chukwa
7.14. Mahout Kullanma
7.15. Zookeeper Avro
7.16. Storm: Hadoop Anlık
7.17. Rhadoop RHIPE
7.18. rmr
7.19. Cassandra
7.20. MongoDB, Neo4j

8. VERİ ALIMI
8.1. Veri Biçimlerinin Özeti
8.2. Veri Keşfi
8.3. Veri Kaynakları & Veri Toplama
8.4. Veri Entegrasyonu
8.5. Veri Füzyonu (Birleştirme)
8.6. Dönüşüm & Zenginleştirme
8.7. Veri Anketi
8.8. Google OpenRefine
8.9. Ne Kadar Veri?
8.10. ETL Kullanma


9. VERİ AYIKLAMA
9.1. Boyut & Sayısal Küçültme
9.2. Normalizasyon
9.3. Veri Temizleme
9.4. Eksik Değerleri İşleme
9.5. Tarafsız Tahminciler
9.6. Seyrek Değerleri Paketleme (Binning Sparse Values)
9.7. Özellik Çıkarma
9.8. Gürültü Arındırma
9.9. Örnekleme
9.10. Tabakalı Örnekleme
9.11. Temel Bileşenler Analizi
9.12. Dönüşüm & Zenginleştirme

10. ARAÇ KUTUSU
10.1. MS Excel ile Analiz Araç Paketi
10.2. Java, Pyhton
10.3. R, R-Studio, Rattle
10.4. Weka, Knime, RapidMiner
10.5. Hadoop Dist of Choice
10.6. Spark, Storm
10.7. Flume, Scibe, Chukwa
10.8. Nutch, Talend, Scraperwiki
10.9. Webscraper, Flume, Sqoop
10.10. tm, RWeka, NLTK
10.11. RHIPE
10.12. D3.js, ggplot2, Shiny
10.13. IBM Languageware
10.14. Cassandra , MongoDB

Tanıtımı burada noktalarken ilk adım için Son Zamanların Mesleği Olan “VERİ BİLİMCİ” Nedir?  ve Veri Bilimci Ne İş Yapar? Nasıl Olunur?  yazılarını okuyup veri bilimi , veri bilimci olmak ile ilgili genel bilgileri edinip sonraki yazım Veri Biliminde Lineer Cebir ile devam edelim.

# Not: Yol haritamız subjektif olarak oluşturulduğundan çevirilerde farklılıklar olabilir (bazı teknik terimler ve programlar, eklentiler çevrilmemiştir), lütfen ana çerçevede anlatılmak istenene odaklanın. Bu doğrultuda yanlış bir noktaya denk geldiğinizde uyarırsanız birlikte öğrenip ilerleyebiliriz. Teşekkürler. #

Yararlanılan Kaynaklar:
• https://erkanerol.github.io/post/hash-functions/
• https://enginpolat.com/csharp-binary-search-tree-ornegi/#:~:text=Binary%20Tree%20(genellikle%20İkili%20Ağaç,Tree%20(Ağaç)%20veri%20modelidir
• http://bilgisayarkavramlari.sadievrenseker.com/2009/11/24/ic-dis-birlestirme-inner-outer-join/
• https://www.w3computing.com/sqlserver2012/theta-join-self-join-semi-join/
• https://towardsdatascience.com/cap-theorem-and-distributed-database-management-systems-5c2be977950e
• http://www.abdullahkise.com/2017/01/nosql-dunyas-3-cap-teoremi.html
• https://medium.com/@barisvelioglu61/database-sharding-nedir-6605a1986b27#:~:text=Buradan%20yola%20çıkarak%20database%20sharding,chunk%27lara)%20ayrılmasına%20denir
• Demircioğlu, Hatice Zehra. Biyoinformatikte Çok Boyutlu Verilerin Boyut İndirgenerek Sınıflandırılması. Ankara: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, 2015.
• Özemre, Murat. Büyük Veri Analitiği Yöntemiyle Stratejik Pazar Analizi. İzmir: Yaşar Üniversitesi, Sosyal Bilimler Enstitüsü, Doktora Tezi, 2019.
• https://github.com/learn-co-curriculum/dsc-data-science-env-setup-v2-1
• https://www.datasciencearth.com/veri-bilimciler-icin-makine-ogrenimi-modelleri/
• http://sadievrenseker.com/wp/wp-content/uploads/2015/09/iticu_dm_3_youtube.ppt.pdf
• https://datavizcatalogue.com/TR/
• https://mathworld.wolfram.com/LeastSquaresFitting.html
• http://bilgisayarkavramlari.sadievrenseker.com/2008/12/01/svm-support-vector-machine-destekci-vektor-makinesi/
• https://makineogrenimi.wordpress.com/2017/05/30/yanlilikvaryans-ikilemi-biasvariance-tradeoff/
• https://www.wikizero.com/tr/İşbirlikçi_filtreleme

(Visited 101 times, 1 visits today)

2 thoughts on “VERİ BİLİMCİ İÇİN BİR BİLET LÜTFEN!

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir