First upload version 0.0.1

2026-02-05 15:27:49 +08:00
commit 8e9b7201ed
4182 changed files with 593136 additions and 0 deletions
--- a/node_modules/node-llama-cpp/dist/evaluator/LlamaEmbeddingContext.js
+++ b/node_modules/node-llama-cpp/dist/evaluator/LlamaEmbeddingContext.js
@@ -0,0 +1,86 @@
+import { AsyncDisposeAggregator, EventRelay, withLock } from "lifecycle-utils";
+import { tokenizeInput } from "../utils/tokenizeInput.js";
+import { resolveBeginningTokenToPrepend, resolveEndTokenToAppend } from "../utils/tokenizerUtils.js";
+import { LlamaEmbedding } from "./LlamaEmbedding.js";
+/**
+ * @see [Using Embedding](https://node-llama-cpp.withcat.ai/guide/embedding) tutorial
+ */
+export class LlamaEmbeddingContext {
+    /** @internal */ _llamaContext;
+    /** @internal */ _sequence;
+    /** @internal */ _disposeAggregator = new AsyncDisposeAggregator();
+    onDispose = new EventRelay();
+    constructor({ _llamaContext }) {
+        this._llamaContext = _llamaContext;
+        this._sequence = this._llamaContext.getSequence();
+        this._disposeAggregator.add(this._llamaContext.onDispose.createListener(() => {
+            void this._disposeAggregator.dispose();
+        }));
+        this._disposeAggregator.add(this.onDispose.dispatchEvent);
+        this._disposeAggregator.add(async () => {
+            await this._llamaContext.dispose();
+        });
+    }
+    async getEmbeddingFor(input) {
+        const resolvedInput = tokenizeInput(input, this._llamaContext.model.tokenizer, undefined, true);
+        if (resolvedInput.length > this._llamaContext.contextSize)
+            throw new Error("Input is longer than the context size. " +
+                "Try to increase the context size or use another model that supports longer contexts.");
+        else if (resolvedInput.length === 0)
+            return new LlamaEmbedding({
+                vector: []
+            });
+        const beginningToken = resolveBeginningTokenToPrepend(this.model.vocabularyType, this.model.tokens);
+        if (beginningToken != null && resolvedInput[0] !== beginningToken)
+            resolvedInput.unshift(beginningToken);
+        const endToken = resolveEndTokenToAppend(this.model.vocabularyType, this.model.tokens);
+        if (endToken != null && resolvedInput.at(-1) !== endToken)
+            resolvedInput.push(endToken);
+        return await withLock([this, "evaluate"], async () => {
+            await this._sequence.eraseContextTokenRanges([{
+                    start: 0,
+                    end: this._sequence.nextTokenIndex
+                }]);
+            const iterator = this._sequence.evaluate(resolvedInput, { _noSampling: true });
+            // eslint-disable-next-line @typescript-eslint/no-unused-vars
+            for await (const token of iterator) {
+                break; // only generate one token to get embeddings
+            }
+            const embedding = this._llamaContext._ctx.getEmbedding(resolvedInput.length);
+            const embeddingVector = Array.from(embedding);
+            return new LlamaEmbedding({
+                vector: embeddingVector
+            });
+        });
+    }
+    async dispose() {
+        await this._disposeAggregator.dispose();
+    }
+    /** @hidden */
+    [Symbol.asyncDispose]() {
+        return this.dispose();
+    }
+    get disposed() {
+        return this._llamaContext.disposed;
+    }
+    get model() {
+        return this._llamaContext.model;
+    }
+    /** @internal */
+    static async _create({ _model }, { contextSize, batchSize, threads = 6, createSignal, ignoreMemorySafetyChecks }) {
+        if (_model.fileInsights.hasEncoder && _model.fileInsights.hasDecoder)
+            throw new Error("Computing embeddings is not supported for encoder-decoder models.");
+        const llamaContext = await _model.createContext({
+            contextSize,
+            batchSize,
+            threads,
+            createSignal,
+            ignoreMemorySafetyChecks,
+            _embeddings: true
+        });
+        return new LlamaEmbeddingContext({
+            _llamaContext: llamaContext
+        });
+    }
+}
+//# sourceMappingURL=LlamaEmbeddingContext.js.map