AI Sözlüğü Değil: Gerçek Sistemlerde İşe Yarayan Kavramlar
AI ile ürün geliştirirken işine yarayabilecek temel kavramların sade bir özeti.
Bu yazı bir “her şey sözlüğü” değil. Günlük ürün geliştirmede en çok işine yarayacak kavramları kısaca toparladım.
1) LLM (Large Language Model)
Metin üreten, soruları yanıtlayan, özet çıkaran dev sinir ağları. OpenAI’ın GPT’si, Anthropic’in Claude’u veya açık kaynak modeller (Llama, Mistral) birer LLM’dir. Ürününüzün “beyni” olarak düşünebilirsiniz.
2) Prompt + System Prompt
Prompt, modele verdiğin anlık istektir; system prompt ise modelin nasıl davranacağını, hangi tonda konuşacağını ve hangi sınırları koruyacağını belirleyen üst kurallar setidir.
3) Token
Metnin model tarafından işlenirken bölündüğü küçük parçalardır; hız, maliyet ve limit hesapları doğrudan token miktarına göre yapılır. 1000 token yaklaşık 750 kelimeye denk gelir.
4) Context Window
Modelin bir seferde göz önünde bulundurabileceği maksimum token sayısı. 8K, 32K, 128K gibi değerlerdir. Uzun belgeler işliyorsanız pencerenin geniş olması gerekir, aksi halde eski mesajlar “unutulur”.
5) Temperature
Modelin ne kadar “yaratıcı” olacağını belirleyen parametre. 0’a yakın değerler daha deterministik ve tutarlı çıktılar üretir; 1 civarı daha çeşitli ve bazen uçuk sonuçlar verir. Gerçek sistemlerde genelde 0–0.3 arası tercih edilir.
6) Top-p
Temperature’a benzer ama farklı çalışır: olasılık toplamı p değerini geçene kadar en olası token’ları seçer, gerisini eler. Çıktının kalitesini artırmak için temperature ile birlikte oynanır.
7) Structured Output (JSON Schema)
Bir dil modelinin serbest metin yerine, önceden tanımlanmış bir formatta (genellikle JSON) çıktı üretmesini sağlayan tekniktir. Bu format, bir JSON şeması ile tanımlanır ve model çıktısı şemaya uymaya zorlanır; yine de üretimde doğrulama ve hata yönetimi gerekir.
8) Embedding
Metnin anlamını sayısal bir vektör olarak temsil eder; benzer içerikleri bulma, kümelendirme ve semantik arama gibi işlerin temelini oluşturur.
9) Vector Database
Embedding’leri saklayıp benzerliklerine göre hızlıca aramanızı sağlayan veritabanı türü. RAG mimarisinde doğru dokümanı hızlı bulmak için merkezi rol oynar. Pinecone, Weaviate, Qdrant, pgvector bu kategorideki örnekler.
10) Semantic Search
Semantik arama, sadece kelime eşleşmesine değil anlam yakınlığına bakarak sonuç getiren arama yaklaşımıdır; bu sayede kullanıcı niyetine daha yakın dokümanlar bulunur. Kullanıcının “yavru kedi bakımı” aramasına “kedi beslenmesi” içeren dokümanları da bulabilir.
11) RAG (Retrieval-Augmented Generation)
Modelin kendi bilgisiyle yetinmeyip dışarıdan (örneğin bir vektör veritabanından) belge getirip cevabını o belgelere dayandırdığı mimari. Hallüsinasyonu azaltır, güncel bilgi kullanımını sağlar.
12) Chunking
Büyük belgeleri, RAG sistemlerinde arama yapılabilmesi için küçük parçalara bölme işlemidir. Amaç, kullanıcı sorusuyla ilgili en doğru bilgi parçasını bulup modele göndermektir. Parçalar ne çok büyük (gereksiz bilgi) ne çok küçük (bağlam kaybı) olmalı, anlam bütünlüğü korunmalıdır.
13) Re-ranking
Re-ranking, bir RAG sisteminde vektör aramasıyla bulunan sonuçları daha hassas bir modelle yeniden sıralama işlemidir. İlk arama hızlı ve geniş, re-ranking yavaş ama keskin nişancıdır. İkisi birlikte çalışarak hem hız hem kalite sağlar.
14) Tool/Function Calling
Modelin sadece metin üretmekle kalmayıp, belirli fonksiyonları çağırmasına izin veren yapı. Örneğin “hava durumunu sorduğunda” model bir API’yi çağıracak şekilde yanıt verir.
15) Agent
Kendi başına karar alıp araç kullanabilen (hesap yapmak, API çağırmak, dosya okumak) yazılım bileşeni. Kullanıcıya “ne yapmak istersin?” diye sorup plan yapan, adım adım işlem yapan sistemler agent mimarisiyle kurulur.
16) Chain-of-Thought ve Prompt Chaining
Düşünce zinciri, tek bir prompt içinde modele adım adım düşünmesi için verilen talimattır (Önce şunu düşün, sonra bunu yap). Prompt zinciri ise birden fazla prompt’u birbirine bağlayarak oluşturulan iş akışıdır (Önce metni özetle, sonra özetten başlık çıkar). Biri tek prompt içinde adımlar, diğeri prompt’lar arasında zincirleme yapar.
17) Hallucination + Grounding
Hallucination, modelin kulağa doğru gelen ama gerçekte hatalı bilgi üretmesidir; grounding ise cevabı belge, veri tabanı veya güvenilir kaynaklara dayandırarak bu riski pratikte azaltma yöntemidir. RAG ile yapılan aslında grounding’dir. Kullanıcıya “şu belgeye göre” diyebilmek güven artırır.
18) Guardrails + Prompt Injection
Guardrails, modelin güvenlik, uygunluk ve format sınırlarını koruyan filtre ve kurallardır; prompt injection ise bu kuralları aşmak için girdiye kötü niyetli talimat gömülmesi saldırısıdır.
19) Observability
Canlı sistemde hangi prompt’un ne kadar token tükettiğini, hangi kaynakların çağrıldığını, cevap süresini, hata oranını ve maliyeti izleyerek sistemi görünür hale getirme pratiğidir. LangSmith, Arize, Phoenix gibi araçlar işinizi kolaylaştırır.
20) Evaluation (Evals)
Evals, model çıktılarının doğruluk, alaka, güvenlik ve tutarlılık açısından ölçülmesidir; sürüm değişikliklerinin gerçekten iyileşme getirip getirmediğini anlamanın en güvenilir yoludur.
21) Latency + Cost per Token
Latency ne kadar hızlı cevap aldığınız, cost per token ise her cevap için ne kadar ödediğinizdir. İkisi arasında genellikle ters orantı vardır: daha hızlı modeller (küçük) daha ucuz, daha yetenekli modeller (büyük) daha pahalı ve yavaştır.
22) Fine-tuning
Hazır bir modeli, kendi verinizle bir süre daha eğiterek belirli bir alana veya stile uygun hale getirme işlemi. Örneğin bir modeli şirket içi jargonu anlayacak şekilde eğitmek. RAG’e göre daha maliyetli ama bazen alan uzmanlığı için gerekli olur.
23) Reliability Patterns (Timeout, Retry, Rate Limiting, Caching, Fallback)
AI servisleri de dış bağımlılıklardır ve klasik dayanıklılık prensipleri burada da geçerlidir. Timeout (çok bekleyen isteği kes), retry (geçici hatalarda tekrar dene), rate limiting (kotayı aşma), caching (aynı sorguyu tekrar çalıştırma) ve fallback (model çökerse alternatif cevap ver) desenleriyle sisteminizi kontrollü şekilde ayakta tutarsınız. %99 çalışan bir model, 1M istekte 10.000 hata demektir; bunu yönetemezseniz kullanıcıya yansır.
Kısa özet: Bu kavramlar tek başına ezberlenecek başlıklar değil; birlikte çalıştıklarında anlam kazanırlar. Bağlamı doğru yönetmek, çıktıyı kontrol edilebilir kılmak, kaliteyi ölçmek ve sistemi güvenli işletmek, AI özelliklerini gerçekten kullanılabilir hale getirir. Model yalnızca bir bileşendir; asıl iş sistem tasarımındadır.
