Documentation Index
Fetch the complete documentation index at: https://developer.comstruct.com/llms.txt
Use this file to discover all available pages before exploring further.
Übersicht
comstruct kann E-Mails mit Rechnungen empfangen und deren Anhänge automatisch extrahieren, klassifizieren und verarbeiten. Dies ermöglicht einen vollständig automatisierten Workflow: Leiten Sie Lieferantenrechnungen an eine dedizierte Adresse weiter und comstruct erledigt den Rest. Der E-Mail-Verarbeitungsendpunkt unterstützt zwei Hauptszenarien:Standard-E-Mail-Weiterleitung
Leiten Sie Rechnungen an comstruct weiter. Anhänge werden extrahiert, per KI klassifiziert und als Rechnungen angelegt.
Stapelscan-Verarbeitung
Senden Sie gescannte Mehrfach-Rechnungs-PDFs. comstruct segmentiert diese mithilfe KI-basierter Seitenerkennung in einzelne Rechnungen.
Funktionsweise
Wenn eine E-Mail am Verarbeitungsendpunkt eingeht, durchläuft comstruct folgende Pipeline:Schritt für Schritt
- E-Mail-Parsing — Die Roh-E-Mail (MIME/RFC 822) wird geparst. Inline-Bilder (Signaturen, Logos) werden herausgefiltert. Anhänge werden in unterstützte und nicht unterstützte Kategorien aufgeteilt.
- Formatkonvertierung — TIFF-Anhänge werden automatisch in PDF konvertiert. Fehlgeschlagene Konvertierungen werden als zusätzliche Dokumente beibehalten.
- Routing — Basierend auf Anzahl und Typ der unterstützten Anhänge wählt comstruct den effizientesten Verarbeitungspfad (siehe Verarbeitungsmodi).
- Rechnungserstellung — Jede identifizierte Rechnung durchläuft die Standard-comstruct-Pipeline: KI-gestützte Datenextraktion, Lieferantenzuordnung und Freigabe-Workflows.
Unterstützte Dokumentformate
Rechnungsdokumente (werden als Rechnungen verarbeitet)
| Format | MIME-Typen | Hinweise |
|---|---|---|
application/pdf | Primärformat; beste KI-Extraktionsergebnisse | |
| XML | application/xml, text/xml | Wird als XRechnung verarbeitet, wenn gültiges elektronisches Rechnungs-XML erkannt wird |
| TIFF | image/tiff, image/tif | Wird vor der Verarbeitung automatisch in PDF konvertiert |
Zusätzliche Dokumente (werden der Rechnung beigelegt)
Nicht-Rechnungsanhänge werden hochgeladen und als Referenzdokumente mit der resultierenden Rechnung verknüpft:| Format | Beispiele |
|---|---|
| Office-Dokumente | .doc, .docx, .xls, .xlsx |
| Bilder | .jpg, .png, .bmp, .webp, .gif |
| Archive | .zip |
| Weitergeleitete E-Mails | .eml, message/rfc822 |
Verarbeitungsmodi
Standard-E-Mail-Verarbeitung
Die Standardverarbeitung bestimmt den besten Pfad anhand der Anzahl und des Typs der unterstützten Anhänge:Einzelner PDF-Anhang
Einzelner PDF-Anhang
Der häufigste Fall. Das PDF wird direkt an die Rechnungsverarbeitungs-Pipeline gesendet — keine Klassifizierung erforderlich.Ergebnis: Eine Rechnung wird sofort erstellt.
Mehrere oder gemischte Anhänge
Mehrere oder gemischte Anhänge
Wenn eine E-Mail mehr als ein unterstütztes Dokument enthält oder eine Mischung aus PDFs und anderen Typen, werden alle Anhänge an die KI-Klassifizierungswarteschlange gesendet.Der Klassifizierer gruppiert Dokumente in:
- Rechnungsdokumente — jede Gruppe wird zu einer separaten Rechnung
- Begleitdokumente — werden den relevanten Rechnungen zugeordnet
Nur XML-Anhänge (XRechnung)
Nur XML-Anhänge (XRechnung)
Wenn die E-Mail ausschließlich XML-Anhänge mit gültigem elektronischen Rechnungsinhalt (XRechnung / EN 16931) enthält, führt comstruct folgende Schritte aus:
- Validierung der XML als anerkanntes elektronisches Rechnungsformat
- Generierung eines lesbaren PDFs aus den strukturierten Daten
- Erstellung einer Rechnung mit sowohl dem PDF als auch dem Original-XML als Anhang
Keine unterstützten Anhänge
Keine unterstützten Anhänge
Wenn eine E-Mail keine verarbeitbaren Anhänge enthält (z. B. nur Bilder oder Office-Dateien), erstellt comstruct dennoch eine Platzhalter-Rechnung, damit die E-Mail nicht verloren geht:
- Ein Platzhalter-PDF wird generiert
- Alle hochladbaren Anhänge werden als zusätzliche Dokumente verknüpft
- Der E-Mail-Inhalt (Absender, Betreff, Datum, Text) wird als separates PDF gerendert und angehängt
Stapelscan-Verarbeitung
Der Stapelscan-Modus ist für Scan-Workflows konzipiert, bei denen mehrere Papierrechnungen in einem Durchgang gescannt werden und ein einzelnes mehrseitiges PDF erzeugen. Wenn der Stapelscan-Modus aktiv ist:- Nur PDF-Anhänge werden verarbeitet (andere unterstützte Dokumenttypen werden ignoriert)
- Jedes PDF wird per KI analysiert, um Seitengrenzen zwischen einzelnen Rechnungen zu erkennen
- Das PDF wird in Segmente aufgeteilt — eines pro erkannter Rechnung
- Jedes Segment wird direkt an die Rechnungsverarbeitung gesendet (Klassifizierung wird übersprungen, da alle Seiten als Rechnungen bekannt sind)
x-staple-scan: true in der Anfrage.
Fallback: Wenn die Segmentierung fehlschlägt oder das PDF nur eine Seite hat, wird das gesamte PDF als einzelne Rechnung behandelt.
Erhaltung von E-Mail-Metadaten
comstruct extrahiert Metadaten aus der Original-E-Mail und nutzt diese während der gesamten Verarbeitung:| Metadatenfeld | Verwendung |
|---|---|
| Absender (From) | Absenderidentifikation; unterstützt die Lieferantenzuordnung |
| Betreff (Subject) | Wird zur Referenz und Durchsuchbarkeit gespeichert |
| Datum (Date) | Originaler E-Mail-Zeitstempel |
| E-Mail-Text (Body) | Wenn keine Rechnungsanhänge gefunden werden, wird der E-Mail-Text als PDF gerendert und der Platzhalter-Rechnung angehängt |
KI-gestützte Klassifizierung
Wenn eine E-Mail mehrere Anhänge enthält, nutzt comstruct KI (Gemini), um diese intelligent zu gruppieren und zu klassifizieren:- Rechnung vs. Begleitdokument — Der Klassifizierer bestimmt, welche Dokumente tatsächliche Rechnungen sind und welche ergänzend sind (z. B. Lieferscheine, Anschreiben, Spezifikationen)
- Gruppierung — Mehrere Seiten oder Dateien, die zur selben Rechnung gehören, werden zusammengefasst
- XML–PDF-Zuordnung — Wenn sowohl XML- (XRechnung) als auch PDF-Versionen einer Rechnung vorliegen, werden sie anhand normalisierter Rechnungsnummern abgeglichen und als einzelne Rechnung verknüpft
- Duplikaterkennung — Wenn ein Dokument bereits verarbeitet wurde (anhand der Dokument-ID erkannt), wird es übersprungen, um doppelte Rechnungen zu vermeiden
Fallback-Verhalten
Falls die KI-Klassifizierung aus irgendeinem Grund fehlschlägt, greift comstruct auf eine sichere Standardverarbeitung zurück: Jeder PDF-Anhang wird als separate Rechnung verarbeitet, wobei XML- und nicht unterstützte Dokumente an alle resultierenden Rechnungen angehängt werden. So geht keine Rechnung verloren.Warteschlange und Wiederholungsverhalten
Die E-Mail-Verarbeitung nutzt eine Job-Warteschlange, um die Klassifizierung bei Bedarf asynchron zu verarbeiten:| Einstellung | Wert |
|---|---|
| Max. Versuche | 5 |
| Backoff-Strategie | Exponentiell, beginnend bei 10 Sekunden |
| Parallelität | Konfigurierbar (Standard: 1 Worker) |
Integration mit SendGrid
Der E-Mail-Verarbeitungsendpunkt ist für den Empfang von SendGrid Inbound Parse-Webhook-Payloads konzipiert. SendGrid leitet eingehende E-Mails als Multipart-Formulardaten weiter, und comstruct extrahiert den rohen E-Mail-Inhalt aus dememail-Feld.
Einrichtung
- Konfigurieren Sie einen SendGrid Inbound Parse Webhook, der auf Ihre comstruct-Instanz zeigt
- Setzen Sie die MX-Einträge Ihrer Weiterleitungsdomain auf SendGrid
- Fügen Sie Authentifizierungs-Header (
x-api-key) in der Webhook-Konfiguration hinzu - Setzen Sie optional
x-staple-scan: truefür scan-dedizierte Adressen
Anfrageformat
Der Endpunkt akzeptiert einen rohen Body (bis zu 32 MB) mit Multipart-Formulardaten. Dasemail-Feld muss die vollständige Roh-E-Mail im RFC-822-/MIME-Format enthalten.
Best Practices
E-Mail-Weiterleitungs-Setup
E-Mail-Weiterleitungs-Setup
- Verwenden Sie eine dedizierte E-Mail-Adresse pro Weiterleitungszweck (z. B. eine für reguläre Rechnungen, eine für Stapelscans)
- Konfigurieren Sie E-Mail-Regeln zur automatischen Weiterleitung — vermeiden Sie manuelle Weiterleitung, wo möglich
- Stellen Sie sicher, dass die Weiterleitung originale Anhänge beibehält (vermeiden Sie Inline-Weiterleitung)
Dokumentqualität
Dokumentqualität
- PDF liefert die besten KI-Extraktionsergebnisse — bevorzugen Sie es gegenüber gescannten Bildern
- Verwenden Sie mindestens 300 DPI für gescannte Dokumente
- Stellen Sie sicher, dass Dokumente nicht passwortgeschützt sind
- Vermeiden Sie extrem große Anhänge — der Endpunkt akzeptiert bis zu 32 MB insgesamt
Stapelscans
Stapelscans
- Führen Sie Rechnungen in der richtigen Reihenfolge ein — comstruct erkennt Grenzen, behält aber die Seitenreihenfolge bei
- Verwenden Sie klare Seitentrennungen zwischen Rechnungen
- Einseitige Rechnungen funktionieren am besten; mehrseitige Rechnungen innerhalb eines Stapelscans werden ebenfalls unterstützt
XRechnung / elektronische Rechnungen
XRechnung / elektronische Rechnungen
- Senden Sie XML-Dateien als Standard-Anhänge (nicht inline)
- Wenn Sie sowohl PDF- als auch XML-Versionen senden, verwenden Sie übereinstimmende Rechnungsnummern, damit comstruct sie automatisch verknüpfen kann
- Unterstützte Formate: XRechnung (EN 16931-konform)
Verwandte Endpunkte
Einzelrechnung hochladen
Ein einzelnes Rechnungs-PDF direkt per API hochladen.
E-Mail-Rechnung
Ein einzelnes PDF mit E-Mail-artigen Headern (Projekt, Mandant) hochladen.
Rechnungsliste
Verarbeitete Rechnungen abfragen und filtern.
Rechnungs-Callback
Status-Aktualisierungen von ERP-Systemen empfangen.