Dokument-Engine
Dokument hochladen. KI liest den Rest.
PDFs, Word-Dateien, CSVs, gescannte Bilder — hochgeladen, geparst, in Abschnitte zerlegt und automatisch indexiert. Ihr Team durchsucht Inhalte, nicht Dateisysteme.
Funktionsumfang
Von Rohdateien zu durchsuchbarem Wissen — in Minuten.
Jedes Format, das zählt
PDF, DOCX, CSV, XLSX und gescannte Bilder per OCR. Ein Upload-Endpunkt verarbeitet alle.
Strukturbewusstes Chunking
Dokumente werden an Absatz- und Abschnittsgrenzen geteilt — nie mitten im Satz, nie über Seitenumbrüche hinweg.
Hintergrundverarbeitung
Hochladen und weitermachen. Dokumente werden asynchron verarbeitet, mit Echtzeit-Statusupdates im Dashboard.
Vektor-Indexierung
1024-dimensionale Embeddings in pgvector mit HNSW-Indexierung — präzise Ähnlichkeitssuche ohne Vorheizen.
Vollständige Metadaten
Dateiname, Seitenzahlen, Chunk-Positionen, Upload-Zeitstempel — alles erhalten und durchsuchbar.
Mandantentrennung
Jeder Mandant erhält ein eigenes Datenbankschema. Strukturelle Isolation — nicht nur Zugangskontrolle.
Die Verarbeitungs-Pipeline
Vier Schritte von der Rohdatei zu durchsuchbarem Wissen.
Hochladen
Dateien per Dashboard ablegen oder per E-Mail einsenden. Die API akzeptiert Einzeldateien und Stapel.
Parsen
Unstructured.io extrahiert Text, Tabellen und Dokumentstruktur aus jedem unterstützten Format — inklusive OCR für gescannte Seiten.
Zerteilen
Unser RecursiveChunker teilt Inhalte an natürlichen Grenzen und behält Überschriften, Listen und Seitenkontext vollständig bei.
Indexieren
Ein konfigurierbares Embedding-Modell (standardmäßig Mistral Embed, pro Mandant austauschbar) erzeugt Vektoren. pgvector speichert sie mit HNSW-Indexierung — Abruf in Sekundenbruchteilen.
Specs auf einen Blick
Für die Kolleginnen und Kollegen, die es genau wissen wollen.
PDF, DOCX, CSV, XLSX, Bilder (OCR)
1024 Dimensionen, konfigurierbares Modell (Standard: Mistral Embed)
HNSW via pgvector — funktioniert auf leeren Tabellen
Asynchron mit Echtzeit-Status per API
Rekursiv, strukturbewusst, seitenumbruchsicher
PostgreSQL mit Mandanten-Schema-Isolation
Dokumentenverarbeitung live erleben.
Laden Sie ein Beispieldokument in Ihrer Demo hoch — sehen Sie, wie es in Echtzeit indexiert und durchsuchbar wird.
Oder schreiben Sie uns contact@ailoopwise.com