Zum Inhalt

KI-Backends

Konfigurieren Sie die KI-Anbieter für DeskAgent.

Unterstützte Backends

Backend Typ Beschreibung Kosten
claude_sdk Claude Agent SDK Empfohlen, mit Anonymisierung $3/$15 pro 1M Tokens
gemini Google Gemini 60% günstiger, 1M Kontext $1.25/$10 pro 1M Tokens
openai OpenAI GPT gpt-4o, gpt-4o-mini $2.50/$10 pro 1M Tokens
mistral Mistral API OpenAI-kompatibel, mistral-large $2/$6 pro 1M Tokens
claude Claude CLI Claude Code CLI $3/$15 pro 1M Tokens
qwen Ollama Lokal, kostenlos Kostenlos

Konfiguration

Bearbeiten Sie config/backends.json:

Claude (Empfohlen)

{
  "claude_sdk": {
    "type": "claude_agent_sdk",
    "api_key": "sk-ant-api03-...",
    "model": "claude-sonnet-4-20250514",
    "permission_mode": "acceptEdits",
    "use_anonymization_proxy": true
  }
}

Optionen:

Option Werte Beschreibung
permission_mode default, acceptEdits, bypassPermissions Genehmigungsmodus für Tools
use_anonymization_proxy true/false PII-Schutz aktivieren

Gemini

{
  "gemini": {
    "type": "gemini_adk",
    "api_key": "AIza...",
    "model": "gemini-2.5-pro",
    "timeout": 300,
    "temperature": 0.7,
    "thinking_budget": 0
  }
}

Optionen:

Option Standard Beschreibung
temperature 0.7 Kreativität (0.0-1.0)
thinking_budget 0 Thinking-Tokens (0 = deaktiviert)
timeout 300 Anfrage-Timeout in Sekunden

OpenAI

{
  "openai": {
    "type": "openai_api",
    "api_key": "sk-...",
    "model": "gpt-4o",
    "timeout": 120,
    "temperature": 0.7,
    "max_tokens": 4096,
    "max_iterations": 30,
    "pricing": { "input": 2.5, "output": 10 }
  }
}

Modelle:

Modell Kontext Kosten
gpt-4o 128K $2.50/$10 pro 1M Tokens
gpt-4o-mini 128K $0.15/$0.60 pro 1M Tokens

Mistral

{
  "mistral": {
    "type": "openai_api",
    "base_url": "https://api.mistral.ai/v1",
    "api_key": "YOUR_MISTRAL_API_KEY",
    "model": "mistral-large-latest",
    "timeout": 120,
    "temperature": 0.7,
    "max_tokens": 4096,
    "pricing": { "input": 2, "output": 6 }
  }
}

Modelle:

Modell Kontext Kosten
mistral-large-latest 128K $2/$6 pro 1M Tokens
mistral-small-latest 128K $0.20/$0.60 pro 1M Tokens
codestral-latest 256K $0.30/$0.90 pro 1M Tokens

Hinweis: Mistral verwendet den openai_api Backend-Typ mit einer benutzerdefinierten base_url.

Lokale Modelle (Ollama)

{
  "qwen": {
    "type": "qwen_agent",
    "model": "qwen2.5:32b",
    "base_url": "http://localhost:11434"
  }
}

Erfordert, dass Ollama lokal ausgeführt wird.

API-Schlüssel erhalten

Claude (Anthropic)

  1. Gehen Sie zu console.anthropic.com
  2. Erstellen Sie ein Konto
  3. Navigieren Sie zu API-Schlüssel
  4. Erstellen Sie einen neuen Schlüssel
  5. Kopieren Sie ihn in backends.json

Gemini (Google)

  1. Gehen Sie zu aistudio.google.com
  2. Melden Sie sich mit Ihrem Google-Konto an
  3. Klicken Sie auf "Get API Key"
  4. Erstellen Sie einen Schlüssel für ein neues Projekt
  5. Kopieren Sie ihn in backends.json

OpenAI

  1. Gehen Sie zu platform.openai.com
  2. Erstellen Sie ein Konto
  3. Navigieren Sie zu API-Schlüssel
  4. Erstellen Sie einen neuen Schlüssel
  5. Kopieren Sie ihn in backends.json

Mistral

  1. Gehen Sie zu console.mistral.ai
  2. Erstellen Sie ein Konto
  3. Navigieren Sie zu API-Schlüssel
  4. Erstellen Sie einen neuen Schlüssel
  5. Kopieren Sie ihn in backends.json

Zuweisung von Backends zu Agenten

In config/agents.json:

"daily_check": {
  "ai": "claude_sdk"
},
"simple_task": {
  "ai": "gemini"
},
"local_analysis": {
  "ai": "qwen"
}

Kostenoptimierung

Gemini für einfache Aufgaben verwenden

Gemini ist 60% günstiger als Claude:

"newsletter_filter": {
  "ai": "gemini",
  "description": "Einfache E-Mail-Filterung"
}

Lokale Modelle für den Datenschutz verwenden

Für sensible Daten verwenden Sie Ollama:

"process_contracts": {
  "ai": "qwen",
  "description": "Vertrauliche Dokumente analysieren"
}

Kontext begrenzen

Verwenden Sie knowledge-Muster, um die Anzahl der Tokens zu reduzieren:

"create_offer": {
  "ai": "claude_sdk",
  "knowledge": "products|pricing"
}

Berechtigungsmodi

default

Fragt vor jedem Tool-Aufruf um Genehmigung.

acceptEdits

Genehmigt automatisch Dateiänderungen, fragt bei anderen Aktionen nach.

bypassPermissions

Genehmigt alle Tool-Aufrufe automatisch. Nur mit vertrauenswürdigen Agenten verwenden.

Anonymisierungs-Proxy

Wenn use_anonymization_proxy: true:

  1. Tool-Antworten durchlaufen die Anonymisierung
  2. Persönliche Daten werden durch Platzhalter ersetzt
  3. Die KI sieht [PERSON_1] anstelle von echten Namen
  4. Wenn die KI Platzhalter verwendet, werden diese de-anonymisiert

Konfigurieren Sie Ausnahmen in system.json:

"anonymization_proxy": {
  "no_anonymize_output": ["delete_email"],
  "no_deanonymize_input": ["open_url"]
}