Dokument-Engine
Dokument hochladen. KI liest den Rest.
PDFs, Word-Dateien, CSVs, gescannte Bilder — hochgeladen, geparst, in Abschnitte zerlegt und automatisch indexiert. Ihr Team durchsucht Inhalte, nicht Dateisysteme.
Funktionsumfang
Von Rohdateien zu durchsuchbarem Wissen — in Minuten.
Jedes Format, das zählt
PDF, DOCX, CSV, XLSX und gescannte Bilder per OCR. Ein Upload-Endpunkt verarbeitet alle.
Strukturbewusstes Chunking
Dokumente werden an Absatz- und Abschnittsgrenzen geteilt — nie mitten im Satz, nie über Seitenumbrüche hinweg.
Hintergrundverarbeitung
Hochladen und weitermachen. Dokumente werden asynchron verarbeitet, mit Echtzeit-Statusupdates im Dashboard.
Vektor-Indexierung
1024-dimensionale Embeddings in pgvector mit HNSW-Indexierung — präzise Ähnlichkeitssuche ohne Vorheizen.
Vollständige Metadaten
Dateiname, Seitenzahlen, Chunk-Positionen, Upload-Zeitstempel — alles erhalten und durchsuchbar.
Mandantentrennung
Jeder Mandant erhält ein eigenes Datenbankschema. Strukturelle Isolation — nicht nur Zugangskontrolle.
Die Verarbeitungs-Pipeline
Vier Schritte von der Rohdatei zu durchsuchbarem Wissen.
Hochladen
Dateien per Dashboard ablegen oder per E-Mail einsenden. Die API akzeptiert Einzeldateien und Stapel.
Parsen
Unstructured.io extrahiert Text, Tabellen und Dokumentstruktur aus jedem unterstützten Format — inklusive OCR für gescannte Seiten.
Zerteilen
Unser RecursiveChunker teilt Inhalte an natürlichen Grenzen und behält Überschriften, Listen und Seitenkontext vollständig bei.
Indexieren
Mistral Embed erzeugt Vektoren. pgvector speichert sie mit HNSW-Indexierung — Abruf in Sekundenbruchteilen.
Specs auf einen Blick
Für die Kolleginnen und Kollegen, die es genau wissen wollen.
PDF, DOCX, CSV, XLSX, Bilder (OCR)
1024 Dimensionen, Mistral Embed
HNSW via pgvector — funktioniert auf leeren Tabellen
Asynchron mit Echtzeit-Status per API
Rekursiv, strukturbewusst, seitenumbruchsicher
PostgreSQL mit Mandanten-Schema-Isolation
Dokumentenverarbeitung live erleben.
Laden Sie ein Beispieldokument in Ihrer Demo hoch — sehen Sie, wie es in Echtzeit indexiert und durchsuchbar wird.
Oder schreiben Sie uns contact@ailoopwise.com