PaperBanana
PaperBanana 是一個 AI 驅動的代理框架,可自動生成出版就緒的學術插圖,通過多代理協作將複雜的文本描述轉換為高質量的方 法圖和統計圖。
https://paper-banana.org/?utm_source=aipure

產品資訊
更新時間:2026年03月12日
什麼是 PaperBanana
PaperBanana 代表了學術研究中一個長期存在的挑戰的突破性解決方案 - 創建出版品質插圖的耗時任務。該框架由 Google 和北京大學的研究人員開發,旨在解決為學術論文生成專業圖表和繪圖的勞動密集型瓶頸。它集成了先進的 AI 功能,可以理解技術描述並自動生成符合 NeurIPS 和 ICML 等頂級學術場所嚴格標準的視覺內容。該系統專為需要創建複雜科學可視化效果而無需廣泛設計專業知識的研究人員、研究生、教授和技術作家而設計。
PaperBanana 的主要功能
PaperBanana 是一個由 AI 驅動的學術插圖框架,它使用多代理系統來自動生成可直接用於出版的科學圖表、示意圖和繪圖。它結合了專業代理(檢索器、規劃器、設計師、視覺化工具和評論家),將文字描述轉換為高品質的視覺內容,利用圖像生成來製作示意圖,並利用 Matplotlib 代碼生成來製作數據圖,以確保準確性和專業標準,適合學術出版物。
多代理架構: 協調五個專業的 AI 代理,它們協同工作以處理插圖生成的不同方面,從參考檢索到最終的評論和完善
雙重視覺化策略: 使用 Nano-Banana-Pro 進行示意圖生成,並使用可執行的 Python Matplotlib 代碼進行統計圖繪製,以確保視覺質量和數值準確性
美學完善: 提供將粗略草圖和白板繪圖轉換為精美的、可直接用於出版的圖形的能力,同時保持原始結構
參考驅動生成: 利用精選的學術插圖數據庫來指導風格和佈局決策,確保輸出符合學術出版標準
PaperBanana 的使用案例
學術論文準備: 研究人員可以快速為其出版物生成方法示意圖和統計圖,而無需廣泛的設計技能
教育內容創建: 教授和講師可以為課程材料和演示文稿創建清晰、專業的示意圖和信息圖表
技術文檔: 技術作家可以生成高品質的系統架構圖和工作流程圖,以用於文檔編寫
研究演示: 科學家可以創建適合會議使用的視覺材料和海報資源,以展示他們的研究成果
優點
通過基於代碼的生成消除數據圖中的數值幻覺
保持適合頂級學術場所的高視覺質量標準
通過自動化插圖創建,顯著節省研究工作流程中的時間
缺點
依賴於非公開的專有模型(Gemini-3-Pro 和 Nano-Banana-Pro)
訪問受限,因為它目前處於「研究預覽」階段
可能仍然會產生需要人工驗證的內容錯誤
如何使用 PaperBanana
安裝: 通過使用命令 'paperbanana generate' 或通過將 OPENAI_BASE_URL 設置為您的端點來配置 Azure OpenAI/Foundry 端點來設置 PaperBanana
基本生成: 使用命令運行基本生成:paperbanana generate --input method.txt --caption \"我們的框架概述\"
高級生成: 為了獲得更好的結果,請使用優化和自動細化標誌:paperbanana generate --input method.txt --caption \"我們的框架概述\" --optimize --auto
迭代改進: 提供反饋以使用以下命令改進生成的圖像:paperbanana generate --continue --feedback \"使箭頭更粗,顏色更鮮明\"
繼續特定運行: 使用運行 ID 繼續處理特定的先前運行:paperbanana generate --continue-run run_[ID] --iterations [number]
配置設置: 將 configs/model_config.template.yaml 複製到 configs/model_config.yaml 以設置 API 密鑰和其他配置
可選數據集設置: 下載 PaperBananaBench 並將其放置在數據目錄下,以增強少樣本學習能力(可選步驟,因為框架可以在沒有它的情況下工作)
樣式選擇: 從下拉菜單中為您的學術圖形生成選擇一種視覺樣式
輸入描述: 在提示字段中輸入您想要的學術圖形的詳細文本描述
生成和下載: 單擊生成以創建您的圖形並下載出版就緒的插圖,以便直接在您的論文中使用
PaperBanana 常見問題
PaperBanana 是一款由 AI 驅動的工具,可以自動生成可供發布的學術插圖,包括方法圖、統計圖表和信息圖。它使用多代理協作將論文文本轉換為適合學術出版的專業視覺內容。











