Post

AI Sözlüğü Değil: Gerçek Sistemlerde İşe Yarayan Kavramlar

AI ile ürün geliştirirken işine yarayabilecek temel kavramların sade bir özeti.

AI Sözlüğü Değil: Gerçek Sistemlerde İşe Yarayan Kavramlar

Bu yazı bir “her şey sözlüğü” değil. Günlük ürün geliştirmede en çok işine yarayacak kavramları kısaca toparladım.

1) LLM (Large Language Model)

Metin üreten, soruları yanıtlayan, özet çıkaran dev sinir ağları. OpenAI’ın GPT’si, Anthropic’in Claude’u veya açık kaynak modeller (Llama, Mistral) birer LLM’dir. Ürününüzün “beyni” olarak düşünebilirsiniz.

2) Prompt + System Prompt

Prompt, modele verdiğin anlık istektir; system prompt ise modelin nasıl davranacağını, hangi tonda konuşacağını ve hangi sınırları koruyacağını belirleyen üst kurallar setidir.

3) Token

Metnin model tarafından işlenirken bölündüğü küçük parçalardır; hız, maliyet ve limit hesapları doğrudan token miktarına göre yapılır. 1000 token yaklaşık 750 kelimeye denk gelir.

4) Context Window

Modelin bir seferde göz önünde bulundurabileceği maksimum token sayısı. 8K, 32K, 128K gibi değerlerdir. Uzun belgeler işliyorsanız pencerenin geniş olması gerekir, aksi halde eski mesajlar “unutulur”.

5) Temperature

Modelin ne kadar “yaratıcı” olacağını belirleyen parametre. 0’a yakın değerler daha deterministik ve tutarlı çıktılar üretir; 1 civarı daha çeşitli ve bazen uçuk sonuçlar verir. Gerçek sistemlerde genelde 0–0.3 arası tercih edilir.

6) Top-p

Temperature’a benzer ama farklı çalışır: olasılık toplamı p değerini geçene kadar en olası token’ları seçer, gerisini eler. Çıktının kalitesini artırmak için temperature ile birlikte oynanır.

7) Structured Output (JSON Schema)

Bir dil modelinin serbest metin yerine, önceden tanımlanmış bir formatta (genellikle JSON) çıktı üretmesini sağlayan tekniktir. Bu format, bir JSON şeması ile tanımlanır ve model çıktısı şemaya uymaya zorlanır; yine de üretimde doğrulama ve hata yönetimi gerekir.

8) Embedding

Metnin anlamını sayısal bir vektör olarak temsil eder; benzer içerikleri bulma, kümelendirme ve semantik arama gibi işlerin temelini oluşturur.

9) Vector Database

Embedding’leri saklayıp benzerliklerine göre hızlıca aramanızı sağlayan veritabanı türü. RAG mimarisinde doğru dokümanı hızlı bulmak için merkezi rol oynar. Pinecone, Weaviate, Qdrant, pgvector bu kategorideki örnekler.

Semantik arama, sadece kelime eşleşmesine değil anlam yakınlığına bakarak sonuç getiren arama yaklaşımıdır; bu sayede kullanıcı niyetine daha yakın dokümanlar bulunur. Kullanıcının “yavru kedi bakımı” aramasına “kedi beslenmesi” içeren dokümanları da bulabilir.

11) RAG (Retrieval-Augmented Generation)

Modelin kendi bilgisiyle yetinmeyip dışarıdan (örneğin bir vektör veritabanından) belge getirip cevabını o belgelere dayandırdığı mimari. Hallüsinasyonu azaltır, güncel bilgi kullanımını sağlar.

12) Chunking

Büyük belgeleri, RAG sistemlerinde arama yapılabilmesi için küçük parçalara bölme işlemidir. Amaç, kullanıcı sorusuyla ilgili en doğru bilgi parçasını bulup modele göndermektir. Parçalar ne çok büyük (gereksiz bilgi) ne çok küçük (bağlam kaybı) olmalı, anlam bütünlüğü korunmalıdır.

13) Re-ranking

Re-ranking, bir RAG sisteminde vektör aramasıyla bulunan sonuçları daha hassas bir modelle yeniden sıralama işlemidir. İlk arama hızlı ve geniş, re-ranking yavaş ama keskin nişancıdır. İkisi birlikte çalışarak hem hız hem kalite sağlar.

14) Tool/Function Calling

Modelin sadece metin üretmekle kalmayıp, belirli fonksiyonları çağırmasına izin veren yapı. Örneğin “hava durumunu sorduğunda” model bir API’yi çağıracak şekilde yanıt verir.

15) Agent

Kendi başına karar alıp araç kullanabilen (hesap yapmak, API çağırmak, dosya okumak) yazılım bileşeni. Kullanıcıya “ne yapmak istersin?” diye sorup plan yapan, adım adım işlem yapan sistemler agent mimarisiyle kurulur.

16) Chain-of-Thought ve Prompt Chaining

Düşünce zinciri, tek bir prompt içinde modele adım adım düşünmesi için verilen talimattır (Önce şunu düşün, sonra bunu yap). Prompt zinciri ise birden fazla prompt’u birbirine bağlayarak oluşturulan iş akışıdır (Önce metni özetle, sonra özetten başlık çıkar). Biri tek prompt içinde adımlar, diğeri prompt’lar arasında zincirleme yapar.

17) Hallucination + Grounding

Hallucination, modelin kulağa doğru gelen ama gerçekte hatalı bilgi üretmesidir; grounding ise cevabı belge, veri tabanı veya güvenilir kaynaklara dayandırarak bu riski pratikte azaltma yöntemidir. RAG ile yapılan aslında grounding’dir. Kullanıcıya “şu belgeye göre” diyebilmek güven artırır.

18) Guardrails + Prompt Injection

Guardrails, modelin güvenlik, uygunluk ve format sınırlarını koruyan filtre ve kurallardır; prompt injection ise bu kuralları aşmak için girdiye kötü niyetli talimat gömülmesi saldırısıdır.

19) Observability

Canlı sistemde hangi prompt’un ne kadar token tükettiğini, hangi kaynakların çağrıldığını, cevap süresini, hata oranını ve maliyeti izleyerek sistemi görünür hale getirme pratiğidir. LangSmith, Arize, Phoenix gibi araçlar işinizi kolaylaştırır.

20) Evaluation (Evals)

Evals, model çıktılarının doğruluk, alaka, güvenlik ve tutarlılık açısından ölçülmesidir; sürüm değişikliklerinin gerçekten iyileşme getirip getirmediğini anlamanın en güvenilir yoludur.

21) Latency + Cost per Token

Latency ne kadar hızlı cevap aldığınız, cost per token ise her cevap için ne kadar ödediğinizdir. İkisi arasında genellikle ters orantı vardır: daha hızlı modeller (küçük) daha ucuz, daha yetenekli modeller (büyük) daha pahalı ve yavaştır.

22) Fine-tuning

Hazır bir modeli, kendi verinizle bir süre daha eğiterek belirli bir alana veya stile uygun hale getirme işlemi. Örneğin bir modeli şirket içi jargonu anlayacak şekilde eğitmek. RAG’e göre daha maliyetli ama bazen alan uzmanlığı için gerekli olur.

23) Reliability Patterns (Timeout, Retry, Rate Limiting, Caching, Fallback)

AI servisleri de dış bağımlılıklardır ve klasik dayanıklılık prensipleri burada da geçerlidir. Timeout (çok bekleyen isteği kes), retry (geçici hatalarda tekrar dene), rate limiting (kotayı aşma), caching (aynı sorguyu tekrar çalıştırma) ve fallback (model çökerse alternatif cevap ver) desenleriyle sisteminizi kontrollü şekilde ayakta tutarsınız. %99 çalışan bir model, 1M istekte 10.000 hata demektir; bunu yönetemezseniz kullanıcıya yansır.


Kısa özet: Bu kavramlar tek başına ezberlenecek başlıklar değil; birlikte çalıştıklarında anlam kazanırlar. Bağlamı doğru yönetmek, çıktıyı kontrol edilebilir kılmak, kaliteyi ölçmek ve sistemi güvenli işletmek, AI özelliklerini gerçekten kullanılabilir hale getirir. Model yalnızca bir bileşendir; asıl iş sistem tasarımındadır.

This post is licensed under CC BY 4.0 by the author.