相關介紹
GemmaPro 模型的基礎是 Gemma3 4B,採用 Q4 量化技術,權重重新整理後的模型大小僅約 2.5 GB,只需 4 GB RAM 就有可能順利運行,這表示大部分的文書型電腦或者是高階手機,都有機會可以使用。
只要 GPU 擁有 4GB 以上的 VRAM,就能完整載入模型。在無 GPU 的電腦上,模型推理速度可達每秒 7-8 tokens,相當接近一般人類的說話的速度,進行對話時感受不到明顯延遲。如果使用 GPU ,速度更是飛快。
GemmaPro 模型特點
- 體積小、資源需求低
- 具備更強的思維能力與邏輯表現
- 回答深度與邏輯性表現優於原始 Gemma3 4B
- 模型支援一般模式與推理模式
- 可流暢處理中文任務
模型申請下載位置
Hugging Face - SciMaker/GemmaPro