PDF okumanın maliyet fiziği: 0,55 cent’lik tasarım kararı neden fark yarattı?

6 Şubat 2026
126
Gösterim

– Associa, Bedrock + GenAI IDP Accelerator ile belge sınıflandırmayı yeniden tasarlayıp %95 doğruluk ve belge başı 0,55 cent maliyet yakaladı.
– En büyük sıçrama “Unknown” sınıfında geldi: doğruluk %40’tan %85’e çıktı; üstelik tam PDF yerine sadece ilk sayfaya inerek.
– Model seçimi “en yüksek skor” değil, maliyet/doğruluk dengesiyle yapıldı: Nova Pro, Claude Sonnet 4’e göre daha iyi denge sundu.

Excerpt:
Associa, Bedrock ve GenAI IDP Accelerator ile belge sınıflandırmada ilk sayfa yaklaşımıyla %95 doğruluk ve 0,55 cent maliyet dengesine ulaştı.

Meta Description:
Associa’nın Bedrock tabanlı GenAI IDP kurgusu, tam PDF yerine ilk sayfayla %95 doğruluk, 0,55 cent maliyet ve Unknown’da %85’e çıkış sağladı.

Yazı:

Giriş
Kurumsal doküman yönetiminde “sınıflandırma” çoğu zaman görünmez bir darboğazdır: yanlış etiket, yanlış iş akışı, gecikmiş süreç. Associa’nın deneyi, üretken yapay zekâda başarının modelden çok tasarım kararlarıyla geldiğini net biçimde gösteriyor.

🧩 Ne oldu?
– AWS Machine Learning Blog’da 05 Şubat 2026 tarihli konuk yazıda, Associa’nın AWS Generative AI Innovation Center ile üretken yapay zekâ tabanlı belge sınıflandırma sistemi geliştirdiği anlatıldı.
– Associa’nın ölçeği dikkat çekici: yaklaşık 7,5 milyon ev sahibine hizmet, 15.000 çalışan, 300+ şube; ayrıca yaklaşık 48 milyon belge ve 26 TB veri yönetimi.
– 465 PDF’lik (8 belge türü + “Unknown”) değerlendirmede “ilk sayfa + OCR + görüntü” yaklaşımı %95 doğruluk (443/465) ve 0,55 cent/belge maliyet sağladı; Unknown doğruluğu %40’tan %85’e çıktı.

🎯 Neden önemli?
Belge sınıflandırma projeleri genelde “daha fazla veri verelim, daha iyi anlasın” refleksiyle büyür. Bu örnekte ise tersine bir hamle var: Tam PDF yerine ilk sayfaya inmek hem doğruluğu artırıyor hem maliyeti yarıya indiriyor. Yani performans artışı, daha büyük modelden değil, daha doğru bağlam kurgusundan geliyor.

“Unknown” sınıfının ele alınışı, gerçek dünyaya yakınlık açısından kritik. Kurumsal hayat; taslaklar, e-posta zincirleri, yarım kalmış evraklar ve sınıf dışı içeriklerle dolu. Sistemin “emin değilim” diyebilmesi, hatalı otomasyonun yaratacağı operasyonel hasarı azaltır: yanlış sürece düşen bir belge, sınıflandırılamayan bir belgeden daha pahalıya patlar.

Son olarak burada bir ürünleşme işareti var: GenAI IDP Accelerator + Amazon Bedrock, deneyi bir PoC olmaktan çıkarıp tekrarlanabilir bir “kurgu”ya çeviriyor. Kurumlar için asıl değer, tek bir demo skoru değil; aynı yaklaşımın farklı takımlarda ve farklı doküman türlerinde yeniden kurulabilir olması.

👥 Kim etkilenir?
– Doküman yoğun sektörler: topluluk/tesis yönetimi, sigorta, bankacılık, hukuk, lojistik, sağlık
– IDP (Intelligent Document Processing) satın alan ya da geliştiren operasyon ekipleri
– Maliyet baskısı altında LLM tabanlı otomasyon kurmak isteyen ürün sahipleri
– “Unknown / diğer” sınıfı yüzünden modelin sahada dağıldığını gören veri bilim ekipleri
– Bedrock üzerinde model seçimi (Nova/Claude vb.) yapan platform ve satın alma ekipleri

🫆 AI Sözlük görüşü
Bu hikâyenin kahramanı “daha zeki model” değil, “daha iyi girdi tasarımı”. Tam PDF + OCR + görüntü ile %91 doğruluk (425/465) ve 1,10 cent/belge yerine; ilk sayfaya odaklanınca %95 doğruluk ve 0,55 cent/belge geliyor. Tasarım tercihi dersi net: Her zaman daha çok sayfa daha çok sinyal değildir; çoğu dokümanda ilk sayfa, sınıfı belirleyen en yüksek yoğunluklu etiketi taşır (başlık, format, şablon, kurum dili). Geri kalan sayfalar ise gürültü ve maliyet olabilir.

Ödül tarafı: “Unknown” doğruluğunu %85’e taşımak, otomasyonun güvenliğini artırır. Çünkü en tehlikeli hata türü, yanlış bir sınıfa “kendinden emin” atamadır. Risk tarafı: İlk sayfaya aşırı güvenmek, bazı sınıflarda (özellikle çok benzer şablonlu belgelerde) sınıf ayrımını zorlaştırabilir; ayrıca dengesiz veri dağılımı (ör. 6 örnekli sınıf) sahada sürpriz hatalar üretebilir.

Model karşılaştırması da önemli bir gerçekçilik sunuyor: Claude Sonnet 4, Unknown’da %95’e çıkarken maliyet 1,21 cent/belge. Nova Pro ise %95 genel doğruluk + %85 Unknown ile 0,55 cent/belge. Kurumsal kararın özü şu: “En iyi skor” değil, bütçeyle sürdürülebilir “en iyi denge” kazanır. Bu da GenAI’de ürünleşmenin temel kuralı.

👀 Ne izlenmeli?
– Maliyet/doğruluk eğrisi: cent/belge ile genel doğruluk (%) birlikte izlenmeli; özellikle 0,55 → 1,21 cent gibi artışların toplam aylık faturaya etkisi hesaplanmalı.
– Unknown performansı: Unknown precision/recall ve “Unknown’a düşen oran” (unknown rate) takip edilmeli; oran yükseliyorsa model çekingenleşiyor olabilir.
– Sınıf bazlı skorlar: az örnekli sınıflarda (ör. 6 örnekli sınıf gibi) F1/recall düşüşü var mı; üretimde en çok hangi sınıf karışıyor?
– Hata türü dağılımı: “yanlış sınıflandırma” mı artıyor, yoksa “Unknown’a atma” mı? Operasyon maliyeti bu iki hatada farklılaşır.

 

 

Kaynak bağlantısını ziyaret edin
Kategori(ler):
İş Dünyası · Teknoloji · Yapay Zeka
Cenk Yılgör http://www.cenkyilgor.com

https://www.amazon.com.tr/s?i=stripbooks&rh=p_27%3ACenk+Y%C4%B1lg%C3%B6r&ref=dp_byline_sr_book_1

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir