Yapay Zekâyı Anlamak: Veri SETI (ensemble de données) Nedir? | par Hilal Akdoğan | Août 2025

Bir Önceki Yazımda Yapay Zekâ, Makine Öğrenmesi Ve Derin Öğrenme Arasındaki Farklardan Bahsetmiştim. Bu konuları daha iyi anlayabilmek için, şimdi yapay zekânın nasıl Öğrendiğine, Yani ONUN Öğretmeni Olan Veri Setlerine Bakacağız.
Peki Veri Nedir?
Veri, Yapay Zekâya Gösterdiğimiz son Türlü Bilgidir: Fotoğraflar, Yazılar, ses kayıtları, tablaol… BU Veriler Gruplandığında ve Bir Amaca Göre Düzenlendiğinde, Artık Buna Veri seti Diyoruz.
Bir Veri SETI, SADECE VEILERIN BIR ARAYA GETIRIDIği Bir Dosya Değildir; Aynı Zamanda Verilerin Düzenli ve anlaşılır Bir şekilde Organize Edildiği Bir Yapıdır.
- Özellikler (Değişkenler / Variables): Veri Setindeki son Bir Bilgi Parçası Bir Özelliktir. Örneğin Bir Satış Veri Setinde «ürün Adı», «Fiyat» Veya «Satın alma tarihi» Gibi Bilgiler son Biri Bir Değişkendir.
- Yapı (şema / schéma): Veri setinin Nasıl Düzenlendiğini Gösterir. Hangi Sütunların Olduğu, Verilerin Türü Gibi Bilgiler şema Içinde yer Alır.
- Açıklayıcı bilgiler (méta-veiller / métadonnées): Veri setinin nereden geldiğini, hangi amaçla toplandığını veya nasıl kullanılacağını anlatan bilgiler.
BU Parçalar Bir Araya Geldiğinde, Veri seti analze ve yapay zekâ çalışmaları için anlamlı hâle gelir. Günümüzde şirketler, Müşterilerden Gelen Bilgilerden Finansal Işlemlere, Sensörlerden Sosyal Medyaya Kadar Pek çok Kaynaktan Veri Topluyor. Bu Veriler Doğru Bir şekilde Düzenlendiğinde, Yapay Zekâ Modelleri Daha Doğru Ve Etkili Bir şekilde Öğrenebilir.
Yapay Zekâya Bir şeyi öğretmek Istiyorsak, ona önce Örnekler Sunmamız Gerekir. Ama bu örneklerin sadece sayısı değil, Niteliği De çok Önemlidir.
Eğer yapay zekâya eksik, yanlış ya da tek taraflı Veriler Veirsek, o da doğal olarak eksik ya da yanlış şekilde öğrenir.
Saçını ıslakken nasıl şekillendirirsen, Kuruyunca da o şekli alır…
«MESELA, YAPAY ZEKâdan Bir ‘futbolcu resmi’ oluşturmasını istediğimizde, çoğu zaman Erkek çizer. Çünkü eğitdidid görsseller çoğu erkek futbolculardır. ‘yanlı / tek taraflı’ Olduğunu Gösterir.
MESELA, SADECE Kırmızı Elmalar Gösterdiğimiz Bir Modele Yeşil Elma Gösterdiğizde şaşırabilir. Ya da Sadece Erkek Sesiyle Eğitilen Bir Sesli Asistan, Kadın Seslerini Tanımakta Zorlanabilil.
Veri ne Kadar Çeşitli, Doğru ve Dengeliyse, Yapay Zekâ O Kadar Sağlam Öğrenir. Bu Yüzden Veriyi Sadece «Çok» Değil, Aynı Zamanda «Iyi» Hâle Getirdek Gerekir.
Verinin Kalitesinin Önemli Olduğunu Artık Biliyoruz. Ama işin bir diğer boyutu da Veri Türü.
Yapay Zekâya Konuşmayı öğretmek Istiyorsak Yazı Değil, Ses Kaydı Veririz. Görüntü Tanıması Gerekiyorsa Ona Resimler Göstermeliyiz.
Yani Her Görev Için Farklı Veri Türleri Gerekir.
Ses Verisi: Konuşmayı Anlama
Bir Sesli Asistanın Seni Doğru Anlaması için Çok Sayıda Ses Kaydıyla Eğitilmesi Gerekir. Bu Ses Kayıtlarında Farklı Insanlar, Farklı Aksanlar, Farklı Kelimeler Bulunur. Böylece Yapay Zekâ, Senin NE Söylediğini Daha Iyi Anlayabilir.
Görüntü Verisi: Nesne Tanıma
Telefonundaki Yüz Tanıma Sistemi, Milyonlarca Farklı Yüz Fotoğrafıyla eğititilir. BU Sayede Yüzündeki Küçük Farklılıkları Tanıyabilil ve Doğru Kişiyi Bulur. Aynı şekilde, Otonom Araçlar da Etraflarındaki Nesneleri Görmek için fotoğraflar ve videolar üzerinde çalışır.
Yazılı Mettin: Dil Anlama
Yapay Zekâ Mettinleri Anlamak Için Büyük Kitaplar, Makaleler ve internetteki yazılı içeriklerle eğititilir. Böylece Sana metin önerileri sunabilil, Çeviri Yapabilil Veya Sorularına Yanıt Verebilir.
Veri SETI, Belirli Bir Amaç Için Düzenlenmiş Veri Koleksiyonudur. Veri Tabanı ise Verileri Depolayan, Yöneten ve Erişimi Kontrol Eden Daha Büyük Bir Sistemdir. Yani Bir Veri Tabanı, Birden Fazla Veri setini Içerebilir, Ama Veri SETI tek Başına Bir Veri Tabanı Değildir.
Veri Setleri, Yapay Zekâ Modellerinine Öğrenmesi Için Temel Hammaddedir. Ancak, son Veri seti kaliteli ve kullanıma hazır değildir. Veriler Genellikle Ham Halde Toplanır ve içinde Hatalar, Eksiklikler Ya da Gereksiz Bilgiler Bulunabilil. BU Nedenle Veri Setlerini Oluşturmadan önce Onları Temizlemek ve Düzenlemek Gerekir.
Temiz Veri, Modelin Doğru Ve Güveniler Sonuçlar Vermesini Sağlar.
Veri Temizleme Süreci Nedir?
- Hatalı Verilerin çıkarılması: Örneğin, Bir Fotoğraf Veri Setinde Bulanık Ya da Yanlış Etiketlenmiş Resimler Varsa, Bunlar Çıkarılır.
- Eksik verilerin doldurulması: Bazı Veriler Eksik OLILIL, Örneğin Bir Metin Cümlesi Yarım Kalmış OLILIR. Bu Durumlar ya tamamlanır ya da o veri çıkarılır.
- Gereksiz verilerin atılması: Veri Setinde Modèle Için Önemsiz Bilgiler Varsa, Bunlar Temizlenir.
Bir Yapay Zekâ Modeli ne Kadar çok ve çeşitli Veriye Maruz Kalırsa, O Kadar Iyi Öğrenir. Çünkü Gerçek Dünya Oldukça çeşitli ve karmaşıktır. Modèle d’Eğer Sadece Birkaç Örnek Görürse, Yeni Karşılaştığı Durumlarda Doğru Tahmin Yapamayabilil.
Yani, Büyük ve çeşitli Veri Setleri, Modelin Daha Genel Geçer, Doğru Ve Esnek Sonuçlar Vermesini Sağlar.
Veri Setlerinkiki Ham Veriler, Yapay Zekânın Anlayabilmei Için çoğunlukla Etiketlenir. Etiketleme, Veriye «bu budur» diye açıklama eklemektir. Modèle de Böylece, Hangi Verinin ne anlama Geldiğini Öğrenir.
Diyelim ki elinde bir kutu içinde farklı meyveler va ve bunların adlarını öğrenmek istiyorsun. Sa méyvenin üzerine isim etiketi yapıştırırsan, iléride yeni meyveleri de doğru tanımak kolaylaşır.
Yapay Zekâda da Aynı şey Geçerli: Eğer Bir Resim «Kedi» Olarak Işaretlendiyse, modèle bu resmi gördüğünde «bu bir kedi» olduğunu öğremir. Ne Kadar Çok Doğru Etiketli Veri Varsa, modèle O Kadar Iyi Öğrenir.