ContextGem, güçlü yerleşik soyutlamalar ve otomatik özellikler aracılığıyla belgelerden minimum kodla yapılandırılmış veri ve içgörü çıkarma işlemini basitleştiren ücretsiz, açık kaynaklı bir LLM çerçevesidir.
https://github.com/shcherbak-ai/contextgem?ref=aipure&utm_source=aipure
ContextGem

Ürün Bilgisi

Güncellendi:May 9, 2025

ContextGem Nedir

ContextGem, Büyük Dil Modellerini (LLM'ler) kullanarak belgelerden yapılandırılmış verileri çıkarma sürecini kolaylaştırmak için tasarlanmış yenilikçi bir açık kaynaklı çerçevedir. Shcherbak AI AS tarafından oluşturulan bu çerçeve, sezgisel, esnek bir çerçeve sağlayarak geliştirme karmaşıklığını önemli ölçüde azaltarak belge analizinde kapsamlı boilerplate kodu gerektirme gibi yaygın zorluğun üstesinden gelir. Çerçeve, OpenAI, Anthropic, Google ve Azure OpenAI gibi sağlayıcılar dahil olmak üzere LiteLLM entegrasyonu aracılığıyla hem bulut tabanlı hem de yerel LLM'leri desteklerken, çeşitli dosya biçimleri için yerleşik dönüştürücüler sunar ve özellikle DOCX dönüştürmede mükemmeldir.

ContextGem Temel Özellikleri

ContextGem, asgari düzeyde kodla belgelerden yapılandırılmış veri ve içgörü çıkarımını basitleştiren açık kaynaklı bir LLM çerçevesidir. Otomatik dinamik istemler, veri modelleme, referans eşleme ve çok dilli destek dahil olmak üzere güçlü yerleşik soyutlamalar sunar. Çerçeve, LLM'lerin uzun bağlam pencerelerini üstün çıkarım doğruluğu için kullanarak odaklanmış belge analizinde mükemmeldir ve LiteLLM entegrasyonu aracılığıyla hem bulut tabanlı hem de yerel LLM'leri destekler.
Otomatik Dinamik İstekler ve Veri Modelleme: Otomatik istek oluşturma ve veri doğrulama yoluyla standart kodu ortadan kaldırır, geliştirme maliyetini önemli ölçüde azaltır
Hassas Referans Eşleme: Çıkarım muhakemesi için yerleşik gerekçelerle paragraf ve cümle düzeylerinde ayrıntılı referans eşlemesi sağlar
Çoklu-LLM İşlem Hattı Desteği: Role özgü görevlere ve birleşik serileştirilebilir sonuç depolamaya sahip birden çok LLM kullanarak karmaşık çıkarma iş akışlarının oluşturulmasını sağlar
Belge Formatı Dönüşümü: Gelişmiş LLM analizi için belge yapısını ve zengin meta verileri koruyarak DOCX dahil olmak üzere çeşitli belge formatları için yerleşik dönüştürücüler

ContextGem Kullanım Alanları

Yasal Belge Analizi: Sözleşmelerden ve yasal belgelerden temel maddeleri, koşulları ve anormallikleri kesin referans takibi ile çıkarın
Finansal Belgelendirme İşleme: Yapılandırılmış verileri, içgörüleri ve temel metrikleri gerekçeleriyle birlikte çıkarmak için finansal raporları ve belgeleri analiz edin
Araştırma Belgesi Analizi: Hiyerarşik yön analizi ile akademik makalelerden ve araştırma belgelerinden kavramları, temaları ve içgörüleri çıkarın
Çok Dilli Belge İşleme: Belirli bir istem gerektirmeden birden çok dildeki belgeleri işleyin ve küresel belge analizi iş akışlarını etkinleştirin

Artıları

Karmaşık belge analizi görevleri için gereken minimum kod
Geliştirme süresini azaltan kapsamlı yerleşik soyutlamalar
Hem bulut hem de yerel LLM'ler için esnek destek

Eksileri

Belgeler arası sorgulamadan ziyade tek belge analizine odaklanmıştır
Şu anda külliyat çapında alma yeteneklerini desteklemiyor

ContextGem Nasıl Kullanılır

ContextGem'i Yükleyin: Paketi pip kullanarak yükleyin: pip install -U contextgem
Gerekli modülleri içe aktarın: Gerekli sınıfları içe aktarın: from contextgem import Document, DocumentLLM, StringConcept
Bir Belge nesnesi oluşturun: Document(raw_text='metniniz burada') kullanarak metin içeriğinizle bir Belge nesnesi oluşturun
Çıkarılacak kavramları tanımlayın: doc.concepts = [StringConcept(name='kavram_adı', description='kavram_açıklaması', add_references=True, reference_depth='sentences', add_justifications=True, justification_depth='brief')] kullanarak kavramları belgeye ekleyin
LLM'yi yapılandırın: Tercih ettiğiniz model ve API anahtarınızla DocumentLLM'yi ayarlayın: llm = DocumentLLM(model='openai/gpt-4o-mini', api_key='api_anahtarınız')
Bilgileri çıkarın: Belgeden bilgi çıkarmak için LLM'yi kullanın: doc = llm.extract_all(doc) veya await llm.extract_all_async(doc) ile asenkron sürümü kullanın
Sonuçlara erişin: doc.concepts[0].extracted_items veya doc.get_concept_by_name('kavram_adı').extracted_items aracılığıyla çıkarılan bilgilere erişin
İsteğe bağlı: DOCX dosyalarını dönüştürün: DOCX dosyaları için DocxConverter'ı kullanın: converter = DocxConverter(); document = converter.convert('path/to/document.docx')
İsteğe bağlı: Sonuçları kaydedin: İşlenmiş belgeleri kaydetmek ve LLM çağrılarını tekrarlamaktan kaçınmak için yerleşik serileştirme yöntemlerini kullanın

ContextGem SSS

ContextGem, minimum kodla belgelerden yapılandırılmış veri ve içgörü elde etmeyi önemli ölçüde kolaylaştıran ücretsiz, açık kaynaklı bir LLM çerçevesidir. Belge analizini basitleştiren ve kapsamlı temel kod ihtiyacını ortadan kaldıran esnek, sezgisel soyutlamalar sağlar.

ContextGem Benzer En Yeni Yapay Zeka Araçları

Tomat
Tomat
Tomat.AI, kullanıcıların kodlama olmadan büyük CSV ve Excel dosyalarını kolayca keşfetmesini, analiz etmesini ve otomatikleştirmesini sağlayan AI destekli bir masaüstü uygulamasıdır; yerel işleme ve gelişmiş veri manipülasyon yetenekleri ile birlikte gelir.
Data Nuts
Data Nuts
DataNuts, sağlık çözümleri, bulut göçü ve AI destekli veritabanı sorgulama yetenekleri konusunda uzmanlaşmış kapsamlı bir veri yönetimi ve analitik çözümleri sağlayıcısıdır.
CogniKeep AI
CogniKeep AI
CogniKeep AI, organizasyonların kendi altyapıları içinde güvenli, özelleştirilebilir AI yeteneklerini dağıtmasını sağlayan özel, kurumsal düzeyde bir AI çözümüdür ve tam veri gizliliği ve güvenliği sağlar.
EasyRFP
EasyRFP
EasyRFP, RFP (Teklif Talebi) yanıtlarını kolaylaştıran ve derin öğrenme teknolojisi ile gerçek zamanlı alan fenotipleme sağlayan AI destekli bir kenar bilişim araç takımıdır.