Zum Inhalt springen

Dokument-Engine

Dokument hochladen. KI liest den Rest.

PDFs, Word-Dateien, CSVs, gescannte Bilder — hochgeladen, geparst, in Abschnitte zerlegt und automatisch indexiert. Ihr Team durchsucht Inhalte, nicht Dateisysteme.

Funktionsumfang

Von Rohdateien zu durchsuchbarem Wissen — in Minuten.

Jedes Format, das zählt

PDF, DOCX, CSV, XLSX und gescannte Bilder per OCR. Ein Upload-Endpunkt verarbeitet alle.

Strukturbewusstes Chunking

Dokumente werden an Absatz- und Abschnittsgrenzen geteilt — nie mitten im Satz, nie über Seitenumbrüche hinweg.

Hintergrundverarbeitung

Hochladen und weitermachen. Dokumente werden asynchron verarbeitet, mit Echtzeit-Statusupdates im Dashboard.

Vektor-Indexierung

1024-dimensionale Embeddings in pgvector mit HNSW-Indexierung — präzise Ähnlichkeitssuche ohne Vorheizen.

Vollständige Metadaten

Dateiname, Seitenzahlen, Chunk-Positionen, Upload-Zeitstempel — alles erhalten und durchsuchbar.

Mandantentrennung

Jeder Mandant erhält ein eigenes Datenbankschema. Strukturelle Isolation — nicht nur Zugangskontrolle.

Die Verarbeitungs-Pipeline

Vier Schritte von der Rohdatei zu durchsuchbarem Wissen.

1

Hochladen

Dateien per Dashboard ablegen oder per E-Mail einsenden. Die API akzeptiert Einzeldateien und Stapel.

2

Parsen

Unstructured.io extrahiert Text, Tabellen und Dokumentstruktur aus jedem unterstützten Format — inklusive OCR für gescannte Seiten.

3

Zerteilen

Unser RecursiveChunker teilt Inhalte an natürlichen Grenzen und behält Überschriften, Listen und Seitenkontext vollständig bei.

4

Indexieren

Mistral Embed erzeugt Vektoren. pgvector speichert sie mit HNSW-Indexierung — Abruf in Sekundenbruchteilen.

Specs auf einen Blick

Für die Kolleginnen und Kollegen, die es genau wissen wollen.

Unterstützte Formate

PDF, DOCX, CSV, XLSX, Bilder (OCR)

Embeddings

1024 Dimensionen, Mistral Embed

Vektor-Index

HNSW via pgvector — funktioniert auf leeren Tabellen

Verarbeitung

Asynchron mit Echtzeit-Status per API

Chunking

Rekursiv, strukturbewusst, seitenumbruchsicher

Speicher

PostgreSQL mit Mandanten-Schema-Isolation

Dokumentenverarbeitung live erleben.

Laden Sie ein Beispieldokument in Ihrer Demo hoch — sehen Sie, wie es in Echtzeit indexiert und durchsuchbar wird.

Demo buchen

Oder schreiben Sie uns contact@ailoopwise.com

Dokument-Engine | AI Loopwise