UFO², Microsoft'un yeni nesil Masaüstü AgentOS'idir ve doğal dil isteklerini Windows'ta otomatik, güvenilir, çok uygulamalı iş akışlarına dönüştürerek UI otomasyonunu, yerel API entegrasyonunu ve çoklu aracı koordinasyonunu birleştirir.
https://github.com/microsoft/UFO?ref=aipure&utm_source=aipure
UFO²

Ürün Bilgisi

Güncellendi:May 16, 2025

UFO² Nedir

UFO² (Masaüstü AgentOS), Microsoft tarafından geliştirilen ve orijinal UFO çerçevesinden büyük bir evrimi temsil eden açık kaynaklı bir projedir. Doğal dil komutları aracılığıyla Windows işlemlerini otomatikleştirmek için tasarlanmış kapsamlı bir çoklu aracı sistemidir. Nisan 2025'te yayınlanan UFO², Windows OS (sürüm 10 ve üzeri) ile entegre olur ve Python 3.10 veya üstü gerektirir. Çerçeve, resmi bir Windows özelliği değil, büyük dil modellerinin, bilgisayar görüşünün ve sistem entegrasyonunun birleşimi yoluyla gelişmiş otomasyon yeteneklerini gösteren deneysel bir platformdur.

UFO² Temel Özellikleri

UFO² (Masaüstü AgentOS), doğal dil isteklerini otomatik iş akışlarına dönüştüren, Windows OS için gelişmiş, kullanıcı arayüzü odaklı çoklu aracı çerçevesidir. Derin OS entegrasyonu, hibrit GUI ve API eylemleri ve sürekli bir bilgi sistemi bir araya gelerek birden fazla uygulama genelinde karmaşık görevleri yürütür. Sistem, resim içinde resim masaüstü yalıtımı, spekülatif çoklu eylem yürütme ve hem UI otomasyonu hem de görsel tanıma yoluyla gelişmiş kontrol algılama özelliklerine sahiptir.
Derin OS Entegrasyonu: Kapsamlı sistem kontrolü için Windows UIA, Win32 ve WinCOM'u birleştirerek hem GUI otomasyonunu hem de doğrudan API komutlarını etkinleştirir
Resim İçinde Resim Masaüstü: Otomasyon görevlerini yalıtılmış bir sanal masaüstü ortamında çalıştırır ve kullanıcıların ana ekranlarında kesintisiz çalışmaya devam etmelerini sağlar
Çoklu Aracı Koordinasyonu: Görev planlamasını yönetmek için HostAgent'ı ve uygulamaya özgü işlemleri yönetmek için birden fazla AppAgent'ı kullanarak karmaşık uygulama ötesi iş akışlarını etkinleştirir
Bilgi Alt Katman Sistemi: Çevrimdışı dokümantasyon, çevrimiçi arama, kullanıcı gösterileri ve RAG teknolojisi aracılığıyla yürütme izleri dahil olmak üzere birden fazla bilgi kaynağını entegre eder

UFO² Kullanım Alanları

Ofis Otomasyonu: Microsoft Office uygulamalarında veri girişi, belge biçimlendirme ve e-posta yönetimi gibi rutin görevleri otomatikleştirir
Sistem Yönetimi: Doğal dil komutları aracılığıyla karmaşık Windows sistem işlemlerini ve yapılandırmalarını yönetir
Uygulama Ötesi İş Akışları: Bir web sayfasından veri toplama ve bir elektronik tablo raporu oluşturma gibi birden fazla uygulamayı kapsayan görevleri yürütür
Özel Uygulama Kontrolü: Gösteri öğrenimi ve dokümantasyon yoluyla özel veya niş uygulamaları çalıştırmak için eğitilebilir

Artıları

Geleneksel otomasyon araçlarına kıyasla daha yüksek başarı oranı
GUI ve API tabanlı eylemlerin esnek kombinasyonu
Çeşitli bilgi kaynakları aracılığıyla sürekli öğrenme yeteneği
Sanal masaüstü yalıtımı yoluyla müdahalesiz çalışma

Eksileri

Şu anda Windows OS ortamıyla sınırlıdır
API anahtarları ve yapılandırma kurulumu gerektirir
Hassas bilgileri işlerken gizlilik endişeleri olabilir

UFO² Nasıl Kullanılır

Ön Koşulları Yükleyin: Sisteminizde Python >= 3.10 ve Windows OS >= 10 yüklü olduğundan emin olun. İsteğe bağlı olarak 'conda create -n ufo python=3.10' ile bir conda ortamı oluşturun
UFO'yu Klonlayın ve Yükleyin: 'git clone https://github.com/microsoft/UFO.git' ile depoyu klonlayın, UFO dizinine gidin ve 'pip install -r requirements.txt' komutunu çalıştırın
LLM Ayarlarını Yapılandırın: ufo/config/config.yaml.template dosyasını ufo/config/config.yaml dosyasına kopyalayın ve hem HostAgent hem de AppAgent için API anahtarları ve uç noktalar dahil olmak üzere LLM ayarlarınızı (OpenAI veya Azure OpenAI) yapılandırın
RAG'ı Kurun (İsteğe Bağlı): config.yaml içinde isteğe bağlı Retrieval Augmented Generation (RAG) özelliklerini yapılandırın - çevrimdışı yardım belgeleri, Bing araması, kendi deneyimi veya kullanıcı gösterimleri içerebilir
UFO'yu Başlatın: Etkileşimli mod için 'python -m ufo --task <görevinizin_adı>' veya doğrudan yürütme için 'python -m ufo --task <görevinizin_adı> -r \"<isteğiniz>\" komutunu çalıştırarak UFO'yu başlatın
Yürütmeyi İzleyin: Aracının eylemlerini izlemek veya hatalarını ayıklamak için yürütme ekran görüntüleri ve istek/yanıt günlükleri için ./ufo/logs/<görevinizin_adı>/ dizinini kontrol edin
Destek Alın: Yardım için microsoft.github.io/UFO/ adresindeki belgelere bakın, GitHub sorunları oluşturun veya diğer iletişimler için [email protected] ile iletişime geçin

UFO² SSS

UFO², Windows masaüstü işletim sisteminde çalışabilen yeni nesil bir aracı çerçevesi olan bir Masaüstü AgentOS'dir. Doğal dil isteklerini, Windows üzerinde UI odaklı yeteneklerin ötesinde, otomatik, güvenilir, çoklu uygulama iş akışlarına dönüştürmek için tasarlanmıştır.

UFO² Benzer En Yeni Yapay Zeka Araçları

Athena AI
Athena AI
Athena AI, belge analizi, quiz oluşturma, flash kartlar ve etkileşimli sohbet yetenekleri gibi özellikler aracılığıyla kişiselleştirilmiş çalışma yardımı, iş çözümleri ve yaşam koçluğu sunan çok yönlü bir AI destekli platformdur.
Aguru AI
Aguru AI
Aguru AI, davranış izleme, anomali tespiti ve performans optimizasyonu gibi özelliklerle LLM tabanlı uygulamalar için kapsamlı izleme, güvenlik ve optimizasyon araçları sağlayan yerel bir yazılım çözümüdür.
GOAT AI
GOAT AI
GOAT AI, haber makaleleri, araştırma makaleleri ve videolar gibi çeşitli içerik türleri için tek tıklama ile özetleme yetenekleri sunan AI destekli bir platformdur ve ayrıca alanına özgü görevler için gelişmiş AI ajan orkestrasyonu sağlar.
GiGOS
GiGOS
GiGOS, kullanıcıların etkileşimde bulunabileceği ve farklı AI modellerini karşılaştırabileceği sezgisel bir arayüzle Gemini, GPT-4, Claude ve Grok gibi birden fazla gelişmiş dil modeline erişim sağlayan bir AI platformudur.