feat: show token usage per assistant response (#2270)

* feat: show token usage per assistant response * fix: align client models response with token usage * fix: address token usage review feedback * docs: clarify token usage config example --------- Co-authored-by: Willem Jiang <willem.jiang@gmail.com>
2026-05-23 16:35:59 +00:00 · 2026-04-16 08:56:49 +08:00
parent 0e16a7fe55
commit 105db00987
17 changed files with 271 additions and 50 deletions
@@ -1,9 +1,12 @@
 import { getBackendBaseURL } from "../config";

-import type { Model } from "./types";
+import type { ModelsResponse } from "./types";

-export async function loadModels() {
+export async function loadModels(): Promise<ModelsResponse> {
  const res = await fetch(`${getBackendBaseURL()}/api/models`);
-  const { models } = (await res.json()) as { models: Model[] };
-  return models;
+  const data = (await res.json()) as Partial<ModelsResponse>;
+  return {
+    models: data.models ?? [],
+    token_usage: data.token_usage ?? { enabled: false },
+  };
 }