配額與限制
Asgard使用配額(Quota)與限制來幫助維護服務品質並減少服務資源使用和可用的異常激增。配額用於限制您的Asgard Workspace內可使用的Asgard資源的數量,防止服務超出負載。
服務品質配額
-
每個端點 (Endpoint) : 5 RPS (Request Per Second)
-
請求執行時間上限 (Request Execution Time):每個請求 3 分鐘 ( 3 mins / req )
-
請求執行步驟上限 (Request Execution Steps):每個請求: 30 步 ( 30 steps / req )
當您嘗試消耗的資源超出配額允許的範圍時,Asgard會跳出警示例如「Max execution steps 30 reached」並阻止對資源的存取,嘗試執行的工作會中斷失敗。
服務使用限制
-
專案 (Project) 數量:40 個
-
知識庫 (Knowledge Base) 儲存空間:300 GB
-
處理節點 (Processor):500 個
-
擷取知識載入 (Loader):10 個
-
索引處理(Indexer):150 個
配額與限制應用在Asgard Workspace層級,您在Workspace內的專案彼此共用相同的服務資源。
增加配額與限制
若需要增加Asgard Workspace的配額與限制,您可以聯繫銷售或來信至service@asgard-ai.com,我們將竭誠為您服務。