Kuzco là một gói Swift mạnh mẽ cho phép suy luận Mô hình Ngôn ngữ Lớn (LLM) cục bộ trực tiếp trong các ứng dụng iOS và macOS, được xây dựng trên llama.cpp với sự phụ thuộc vào mạng bằng không để tích hợp AI tập trung vào quyền riêng tư.
https://github.com/jaredcassoutt/Kuzco?ref=producthunt&utm_source=aipure
Kuzco

Thông tin Sản phẩm

Đã cập nhật:Aug 19, 2025

Kuzco là gì

Kuzco là một gói Swift linh hoạt được thiết kế để mang các khả năng của Mô hình Ngôn ngữ Lớn cục bộ vào các ứng dụng iOS, macOS và Mac Catalyst. Được xây dựng như một trình bao bọc xung quanh công cụ llama.cpp đã được thử nghiệm trong thực tế, nó đóng vai trò là cầu nối giữa hệ sinh thái phát triển của Apple và chức năng AI nâng cao. Gói này hỗ trợ nhiều kiến trúc LLM phổ biến bao gồm LLaMA, Mistral, Phi, Gemma, Qwen và các kiến trúc khác, khiến nó trở thành một giải pháp toàn diện cho các nhà phát triển muốn triển khai các tính năng AI trong ứng dụng của họ mà không cần dựa vào các dịch vụ đám mây.

Các Tính năng Chính của Kuzco

Kuzco là một gói Swift cho phép suy luận Mô hình Ngôn ngữ Lớn (LLM) trên thiết bị dành cho các ứng dụng iOS, macOS và Mac Catalyst. Được xây dựng trên llama.cpp, nó cung cấp khả năng thực thi mô hình AI cục bộ mà không cần phụ thuộc vào mạng, đảm bảo tính riêng tư và độ tin cậy. Gói này hỗ trợ nhiều kiến trúc LLM, cung cấp các cấu hình tùy chỉnh và có tính năng đồng thời Swift hiện đại với các phản hồi phát trực tuyến.
Xử Lý LLM Trên Thiết Bị: Chạy các mô hình AI cục bộ mà không cần kết nối internet bằng llama.cpp, hỗ trợ các kiến trúc khác nhau như LLaMA, Mistral, Phi, Gemma và Qwen
Tùy Chọn Cấu Hình Nâng Cao: Cung cấp các khả năng tinh chỉnh cho độ dài ngữ cảnh, kích thước lô, các lớp GPU và luồng CPU để tối ưu hóa hiệu suất cho các thiết bị khác nhau
Tích Hợp Swift Hiện Đại: Có hỗ trợ gốc async/await với các phản hồi phát trực tuyến và xử lý lỗi toàn diện để tích hợp liền mạch vào các ứng dụng Swift
Tự Động Phát Hiện Kiến Trúc: Phát hiện thông minh các kiến trúc mô hình từ tên tệp với hỗ trợ dự phòng để tương thích tốt hơn và dễ sử dụng

Các Trường hợp Sử dụng của Kuzco

Chatbot AI Riêng Tư: Xây dựng các ứng dụng trò chuyện xử lý hoàn toàn các cuộc hội thoại của người dùng trên thiết bị, đảm bảo quyền riêng tư của người dùng và chức năng ngoại tuyến
Phân Tích Dữ Liệu Doanh Nghiệp: Xử lý dữ liệu kinh doanh nhạy cảm cục bộ bằng các mô hình AI mà không tiết lộ thông tin cho các máy chủ bên ngoài
Ứng Dụng AI Di Động: Tạo các ứng dụng iOS có khả năng AI hoạt động đáng tin cậy bất kể kết nối internet
Công Cụ Giáo Dục: Phát triển các ứng dụng học tập có thể cung cấp khả năng dạy kèm và phản hồi dựa trên AI trong khi vẫn duy trì quyền riêng tư của học sinh

Ưu điểm

Quyền riêng tư hoàn toàn với xử lý trên thiết bị
Không yêu cầu phụ thuộc vào mạng
Tối ưu hóa hiệu suất cao cho các thiết bị Apple
API toàn diện thân thiện với nhà phát triển

Nhược điểm

Yêu cầu đủ tài nguyên thiết bị để chạy các mô hình
Chỉ giới hạn ở các nền tảng iOS/macOS
Có thể có hiệu suất chậm hơn so với các giải pháp dựa trên đám mây

Cách Sử dụng Kuzco

Cài đặt Kuzco thông qua Swift Package Manager: Thêm Kuzco vào dự án của bạn bằng cách thêm URL gói \'https://github.com/jaredcassoutt/Kuzco.git\' và chọn \'Up to Next Major\' với phiên bản 1.0.0+
Nhập và Khởi tạo: Thêm \'import Kuzco\' vào tệp Swift của bạn và khởi tạo bằng \'let kuzco = Kuzco.shared\'
Tạo Hồ sơ Mô hình: Tạo ModelProfile với ID và đường dẫn mô hình của bạn: let profile = ModelProfile(id: \'my-model\', sourcePath: \'/path/to/your/model.gguf\')
Tải Mô hình: Tải phiên bản mô hình bằng cách sử dụng: let (instance, loadStream) = await kuzco.instance(for: profile)
Theo dõi Tiến trình Tải: Theo dõi tiến trình tải thông qua loadStream và đợi giai đoạn .ready trước khi tiếp tục
Tạo Lượt Hội thoại: Tạo lượt hội thoại cho cuộc đối thoại của bạn: let turns = [Turn(role: .user, text: userMessage)]
Tạo Phản hồi: Tạo phản hồi bằng cách sử dụng predict() với các cài đặt mong muốn của bạn: let stream = try await instance.predict(turns: turns, systemPrompt: \'You are a helpful assistant.\')
Xử lý Phản hồi: Xử lý phản hồi phát trực tuyến bằng cách lặp qua các mã thông báo: for try await (content, isComplete, _) in predictionStream { print(content) }
Tùy chọn: Định cấu hình Cài đặt Nâng cao: Tùy chỉnh hiệu suất với InstanceSettings (contextLength, batchSize, gpuOffloadLayers, cpuThreads) và PredictionConfig (temperature, topK, topP, repeatPenalty, maxTokens) nếu cần

Câu hỏi Thường gặp về Kuzco

Kuzco là một gói Swift cho phép chạy các Mô hình Ngôn ngữ Lớn (LLM) trực tiếp trên các ứng dụng iOS, macOS và Mac Catalyst. Nó được xây dựng dựa trên llama.cpp và cho phép AI trên thiết bị mà không cần phụ thuộc vào mạng, đảm bảo tính riêng tư và tốc độ.

Công cụ AI Mới nhất Tương tự Kuzco

Gait
Gait
Gait là một công cụ hợp tác tích hợp việc tạo mã hỗ trợ AI với kiểm soát phiên bản, cho phép các nhóm theo dõi, hiểu và chia sẻ bối cảnh mã do AI tạo ra một cách hiệu quả.
invoices.dev
invoices.dev
invoices.dev là một nền tảng lập hóa đơn tự động tạo hóa đơn trực tiếp từ các cam kết Git của các nhà phát triển, với khả năng tích hợp cho các dịch vụ GitHub, Slack, Linear và Google.
EasyRFP
EasyRFP
EasyRFP là một bộ công cụ tính toán biên được hỗ trợ bởi AI giúp đơn giản hóa các phản hồi RFP (Yêu cầu đề xuất) và cho phép phân loại hình thái thực địa theo thời gian thực thông qua công nghệ học sâu.
Cart.ai
Cart.ai
Cart.ai là một nền tảng dịch vụ dựa trên AI cung cấp các giải pháp tự động hóa doanh nghiệp toàn diện bao gồm lập trình, quản lý quan hệ khách hàng, chỉnh sửa video, thiết lập thương mại điện tử và phát triển AI tùy chỉnh với hỗ trợ 24/7.