KI-Backends¶

Konfigurieren Sie die KI-Anbieter für DeskAgent.

Unterstützte Backends¶

Backend	Typ	Beschreibung	Kosten
`claude_sdk`	Claude Agent SDK	Empfohlen, mit Anonymisierung	$3/$15 pro 1M Tokens
`gemini`	Google Gemini	60% günstiger, 1M Kontext	$1.25/$10 pro 1M Tokens
`openai`	OpenAI GPT	gpt-4o, gpt-4o-mini	$2.50/$10 pro 1M Tokens
`mistral`	Mistral API	OpenAI-kompatibel, mistral-large	$2/$6 pro 1M Tokens
`claude`	Claude CLI	Claude Code CLI	$3/$15 pro 1M Tokens
`qwen`	Ollama	Lokal, kostenlos	Kostenlos

Konfiguration¶

Bearbeiten Sie config/backends.json:

Claude (Empfohlen)¶

{
  "claude_sdk": {
    "type": "claude_agent_sdk",
    "api_key": "sk-ant-api03-...",
    "model": "claude-sonnet-4-20250514",
    "permission_mode": "acceptEdits",
    "use_anonymization_proxy": true
  }
}

Optionen:

Option	Werte	Beschreibung
`permission_mode`	`default`, `acceptEdits`, `bypassPermissions`	Genehmigungsmodus für Tools
`use_anonymization_proxy`	`true/false`	PII-Schutz aktivieren

Gemini¶

{
  "gemini": {
    "type": "gemini_adk",
    "api_key": "AIza...",
    "model": "gemini-2.5-pro",
    "timeout": 300,
    "temperature": 0.7,
    "thinking_budget": 0
  }
}

Optionen:

Option	Standard	Beschreibung
`temperature`	0.7	Kreativität (0.0-1.0)
`thinking_budget`	0	Thinking-Tokens (0 = deaktiviert)
`timeout`	300	Anfrage-Timeout in Sekunden

OpenAI¶

{
  "openai": {
    "type": "openai_api",
    "api_key": "sk-...",
    "model": "gpt-4o",
    "timeout": 120,
    "temperature": 0.7,
    "max_tokens": 4096,
    "max_iterations": 30,
    "pricing": { "input": 2.5, "output": 10 }
  }
}

Modelle:

Modell	Kontext	Kosten
`gpt-4o`	128K	$2.50/$10 pro 1M Tokens
`gpt-4o-mini`	128K	$0.15/$0.60 pro 1M Tokens

Mistral¶

{
  "mistral": {
    "type": "openai_api",
    "base_url": "https://api.mistral.ai/v1",
    "api_key": "YOUR_MISTRAL_API_KEY",
    "model": "mistral-large-latest",
    "timeout": 120,
    "temperature": 0.7,
    "max_tokens": 4096,
    "pricing": { "input": 2, "output": 6 }
  }
}

Modelle:

Modell	Kontext	Kosten
`mistral-large-latest`	128K	$2/$6 pro 1M Tokens
`mistral-small-latest`	128K	$0.20/$0.60 pro 1M Tokens
`codestral-latest`	256K	$0.30/$0.90 pro 1M Tokens

Hinweis: Mistral verwendet den openai_api Backend-Typ mit einer benutzerdefinierten base_url.

Lokale Modelle (Ollama)¶

{
  "qwen": {
    "type": "qwen_agent",
    "model": "qwen2.5:32b",
    "base_url": "http://localhost:11434"
  }
}

Erfordert, dass Ollama lokal ausgeführt wird.

API-Schlüssel erhalten¶

Claude (Anthropic)¶

Gehen Sie zu console.anthropic.com
Erstellen Sie ein Konto
Navigieren Sie zu API-Schlüssel
Erstellen Sie einen neuen Schlüssel
Kopieren Sie ihn in backends.json

Gemini (Google)¶

Gehen Sie zu aistudio.google.com
Melden Sie sich mit Ihrem Google-Konto an
Klicken Sie auf "Get API Key"
Erstellen Sie einen Schlüssel für ein neues Projekt
Kopieren Sie ihn in backends.json

OpenAI¶

Gehen Sie zu platform.openai.com
Erstellen Sie ein Konto
Navigieren Sie zu API-Schlüssel
Erstellen Sie einen neuen Schlüssel
Kopieren Sie ihn in backends.json

Mistral¶

Gehen Sie zu console.mistral.ai
Erstellen Sie ein Konto
Navigieren Sie zu API-Schlüssel
Erstellen Sie einen neuen Schlüssel
Kopieren Sie ihn in backends.json

Zuweisung von Backends zu Agenten¶

In config/agents.json:

"daily_check": {
  "ai": "claude_sdk"
},
"simple_task": {
  "ai": "gemini"
},
"local_analysis": {
  "ai": "qwen"
}

Kostenoptimierung¶

Gemini für einfache Aufgaben verwenden¶

Gemini ist 60% günstiger als Claude:

"newsletter_filter": {
  "ai": "gemini",
  "description": "Einfache E-Mail-Filterung"
}

Lokale Modelle für den Datenschutz verwenden¶

Für sensible Daten verwenden Sie Ollama:

"process_contracts": {
  "ai": "qwen",
  "description": "Vertrauliche Dokumente analysieren"
}

Kontext begrenzen¶

Verwenden Sie knowledge-Muster, um die Anzahl der Tokens zu reduzieren:

"create_offer": {
  "ai": "claude_sdk",
  "knowledge": "products|pricing"
}

Berechtigungsmodi¶

`default`¶

Fragt vor jedem Tool-Aufruf um Genehmigung.

`acceptEdits`¶

Genehmigt automatisch Dateiänderungen, fragt bei anderen Aktionen nach.

`bypassPermissions`¶

Genehmigt alle Tool-Aufrufe automatisch. Nur mit vertrauenswürdigen Agenten verwenden.

Anonymisierungs-Proxy¶

Wenn use_anonymization_proxy: true:

Tool-Antworten durchlaufen die Anonymisierung
Persönliche Daten werden durch Platzhalter ersetzt
Die KI sieht [PERSON_1] anstelle von echten Namen
Wenn die KI Platzhalter verwendet, werden diese de-anonymisiert

Konfigurieren Sie Ausnahmen in system.json:

"anonymization_proxy": {
  "no_anonymize_output": ["delete_email"],
  "no_deanonymize_input": ["open_url"]
}

KI-Backends¶

Unterstützte Backends¶

Konfiguration¶

Claude (Empfohlen)¶

Gemini¶

OpenAI¶

Mistral¶

Lokale Modelle (Ollama)¶

API-Schlüssel erhalten¶

Claude (Anthropic)¶

Gemini (Google)¶

OpenAI¶

Mistral¶

Zuweisung von Backends zu Agenten¶

Kostenoptimierung¶

Gemini für einfache Aufgaben verwenden¶

Lokale Modelle für den Datenschutz verwenden¶

Kontext begrenzen¶

Berechtigungsmodi¶

default¶

acceptEdits¶

bypassPermissions¶

Anonymisierungs-Proxy¶

`default`¶

`acceptEdits`¶

`bypassPermissions`¶