Aurora
AR
Adam Riese
SD
Sebastian
URL-Quellen · …
URL Status Chunks Frequenz Letzter Crawl
Lade URL-Quellen…
Datei-Upload & Connectors geplant
PDF, DOCX, CSV-Upload sowie Notion-/Google-Drive-Connector folgen in Phase 4. Aktuell verfügbar: URL-Crawler oben.
Wie der URL-Crawler arbeitet
Aurora ruft die URL ab, extrahiert den Hauptinhalt mit Mozilla Readability, konvertiert zu Markdown, zerteilt in semantische Chunks (≈800 Zeichen), erzeugt Vektor-Embeddings und speichert sie verschlüsselt im EU-Postgres. Bei jeder Bot-Antwort durchsucht knowledge_retrieve() per pgvector die ähnlichsten Chunks. Tier-abhängige Crawl-Frequenz wird automatisch eingehalten.