İçeriğe geç
Sözlük

LLM (Büyük Dil Modeli) Nedir? Yapay Zeka Temel Kavramı

LLM, milyarlarca metin parçası üzerinde eğitilmiş, doğal dilde soru cevaplama ve metin üretme yeteneği kazanmış büyük yapay sinir ağı modelidir. ChatGPT, Claude ve Gemini birer LLM'dir.

Alternatif isimler: Large Language Model, büyük dil modeli, GPT modeli

Soyut sinir ağı görselleştirmesi, mavi renkli düğümlerle bağlanmış

Kısa Tanım

LLM (Large Language Model — Büyük Dil Modeli), milyarlarca cümle örneği üzerinde eğitilmiş, doğal dilde soru cevaplama ve metin üretme yeteneği kazanmış büyük yapay sinir ağı modelidir.

ChatGPT, Claude, Gemini hep LLM’dir. Sizinle Türkçe sohbet edebilen şey, aslında bir LLM’in çıktısıdır.

Nasıl Çalışır?

LLM bir sonraki en olası kelimeyi tahmin ederek çalışır.

“Hava bugün çok…” cümlesini bir LLM tamamlarsa, en olası tahminleri şu olabilir:

  • “güzel” (%32)
  • “soğuk” (%18)
  • “sıcak” (%15)
  • “yağmurlu” (%11)

Model her cümlede bunu kelime kelime yapar. Sonuç: doğal görünen bir metin.

Mimari: Transformer

LLM’lerin tamamına yakını Transformer mimarisi üzerine kuruludur. Transformer 2017’de Google’da yayınlanan “Attention Is All You Need” makalesiyle hayatımıza girdi.

Transformer’ın kritik özelliği attention (dikkat) mekanizmasıdır: model cümlenin hangi kelimesine odaklanması gerektiğine dinamik olarak karar verir.

Eğitim Süreci

  1. Pre-training: İnternet metinleri (Common Crawl, Wikipedia, kitaplar) üzerinde “bir sonraki kelimeyi tahmin et” görevi
  2. Fine-tuning: Spesifik görevler için ek eğitim
  3. RLHF (Reinforcement Learning from Human Feedback): İnsan geri bildirimleriyle iyileştirme

Tanınmış LLM’ler

ModelGeliştiriciAçık kaynak
GPT-5OpenAIHayır
Claude 4.7AnthropicHayır
Gemini 2.5Google DeepMindHayır
Llama 4MetaEvet
Mistral / MixtralMistral AIKısmen
DeepSeek V3DeepSeekEvet

Boyut (Parametre Sayısı)

LLM’ler “kaç milyar parametreye” sahip olduğuyla ölçülür:

  • GPT-3: 175 milyar
  • GPT-4: ~1.7 trilyon (tahmin)
  • Llama 3.3 70B: 70 milyar
  • DeepSeek V3: 671 milyar

Daha çok parametre genelde daha iyi performans demek ama her zaman değil. Eğitim verisi kalitesi de kritiktir.

Sınırları

  1. Hallucination: Yanlış bilgiyi emin sesle sunabilir
  2. Cut-off date: Eğitim verisi belli bir tarihten sonrasını içermez
  3. Matematik: Karmaşık hesaplarda yanılır
  4. Bias: Eğitim verisindeki ön yargıları yansıtır
  5. Bağlam penceresi: Context window sınırlıdır (genelde 128K-1M token)

İlgili Kavramlar

Sonraki Adımlar

Özet

LLM, modern yapay zekanın temel taşıdır. Milyarlarca metin örneği üzerinde eğitilerek doğal dile yetenek kazanmış sinir ağıdır. “Bir sonraki kelimeyi tahmin et” basit görevini tüm dile yayan bir model — ama bu basit görev devasa veriyle birleşince ChatGPT gibi hayrete düşüren bir asistana dönüşür.

Paylaş: