fix(server): batch size in gemini embedding (#13120)

## Summary by CodeRabbit * **Bug Fixes** * Improved reliability of embedding generation for multiple messages, allowing partial results even if some embeddings fail. * Enhanced error handling to ensure only valid embeddings are returned.
2026-02-13 21:05:19 +00:00 · 2025-07-09 23:56:10 +08:00
parent c4c11da976
commit 0f3066f7d0
1 changed files with 9 additions and 5 deletions
--- a/packages/backend/server/src/plugins/copilot/providers/gemini/gemini.ts
+++ b/packages/backend/server/src/plugins/copilot/providers/gemini/gemini.ts
@@ -239,12 +239,16 @@ export abstract class GeminiProvider<T> extends CopilotProvider<T> {
        taskType: 'RETRIEVAL_DOCUMENT',
      });

-      const { embeddings } = await embedMany({
-        model: modelInstance,
-        values: messages,
-      });
+      const embeddings = await Promise.allSettled(
+        messages.map(m =>
+          embedMany({ model: modelInstance, values: [m], maxRetries: 3 })
+        )
+      );

-      return embeddings.filter(v => v && Array.isArray(v));
+      return embeddings
+        .map(e => (e.status === 'fulfilled' ? e.value.embeddings : null))
+        .flat()
+        .filter((v): v is number[] => !!v && Array.isArray(v));
    } catch (e: any) {
      metrics.ai
        .counter('generate_embedding_errors')