PDF Split (Server-Side)
Split a PDF into multiple files by page ranges on our EU servers. Returns a zip containing one PDF per range. Auto-deleted after 15 minutes. Handles documents the in-browser splitter cannot.
Geprüft von Aygul Dovletova · Zuletzt geprüft
So teilt man eine PDF in mehrere Dateien auf
- Eine PDF ablegen auf der Upload-Zone oder zum Durchsuchen anklicken. Bis zu 200 MB pro Datei. Die akzeptierte PDF wird mit ihrem Namen, ihrer Größe und einer "Datei wechseln"-Schaltfläche angezeigt, falls ein Austausch benötigt wird.
- Die Bereiche eingeben im Textfeld, kommagetrennt. Eine einzelne Ganzzahl wie
7für eine einzelne Seite oder einen inklusiven Bereich wie1-3für eine Spanne verwenden. So viele Segmente kombinieren wie benötigt:1-3, 5, 7-9fordert drei Ausgabe-PDFs an - eine mit den Seiten 1, 2 und 3; eine mit Seite 5; eine mit den Seiten 7, 8 und 9. - "PDF teilen" anklicken. Die Datei wird über HTTPS auf unseren EU-Server hochgeladen, pdfcpu extrahiert jeden angeforderten Bereich mit nativer Leistung, und die resultierenden PDFs werden für einen einzigen Download-Archiv gezippt.
- "Herunterladen" anklicken, um das ZIP zu speichern. Es lokal mit einem beliebigen Entpack-Werkzeug entpacken (Finder, Explorer,
unzipauf der Kommandozeile), um die einzelnen PDFs zu erhalten. Der Link ist HMAC-signiert und hört nach 15 Minuten auf zu funktionieren.
Warum ein Teilen auf dem Server durchgeführt wird
Der Browser-PDF-Splitter verwendet pdf-lib, das zu JavaScript kompiliert wurde, und funktioniert ohne Upload. Das ist die richtige Wahl, wenn das Dokument klein ist und Datenschutz Priorität hat. Der Browser-Pfad wird jedoch bei großen oder verschlüsselten PDFs schmerzhaft. Pdf-lib muss das gesamte Dokument in den Heap des Tabs laden, nur um Seiten zu zählen, und das Browser-Werkzeug lädt es dann ein zweites Mal, wenn "Extrahieren" geklickt wird; das verdoppelt den Speicherbedarf und treibt Safari über sein Heap-Limit irgendwo über 200 MB. Verschlüsselte Eingaben funktionieren im Browser überhaupt nicht - pdf-lib weigert sich, sie zu parsen. Der serverseitige Splitter hier ist die Antwort für beide Fälle. Dateien streamen auf unseren EU-Server, pdfcpu führt die Seitenextraktion nativ durch (kein JavaScript-Engine in der Schleife), und die Ausgabe wird als ZIP zurückgeschickt, das einmal heruntergeladen wird.
Der andere Vorteil des Server-Pfads ist die ZIP-Ausgabe selbst. Wenn eine einzelne PDF in acht Bereiche aufgeteilt wird, lost ein Browser-Werkzeug entweder acht separate Downloads aus (einige Browser drosseln Multi-Download-Aufforderungen) oder reicht die Seiten einzeln mit einem Klick dazwischen aus. Der Server packt alles in ein Archiv, sodass einmal auf Download geklickt wird und eine saubere Ordnerstruktur auf der Festplatte vorliegt.
Was mit jedem Bereich im Backend passiert
Für jedes kommagetrennte Segment erstellt der Splitter ein neues PDF-Dokument und kopiert den angeforderten Seitenunterbaum aus der Quelle. Textströme, Bild-XObjects, Anmerkungen, auf eine Seite beschränkte Formularfelder und interne Seite-zu-Seite-Links innerhalb des Bereichs werden unverändert kopiert. Metadaten auf Dokumentenebene - Titel, Autor, Hersteller, benutzerdefinierte Schlüssel - werden in jede Ausgabedatei übertragen, sodass immer erkennbar ist, woher jedes Stück stammt. Lesezeichen sind ein Sonderfall: pdfcpu durchläuft den Gliederungsbaum, behalte jedes Lesezeichen, dessen Zielseite im angeforderten Bereich liegt, entfernt den Rest und schreibt die verbleibenden Zielreferenzen gegen die neuen Seitenindizes um. Dokumentübergreifende Hyperlinks, die auf Seiten außerhalb des Bereichs zeigen, werden tot, weil ihr Ziel nicht mehr in der Ausgabe existiert. Dokumentübergreifende Hyperlinks, die innerhalb des Bereichs zeigen, funktionieren weiterhin, wobei die Seitenzahlen relativ zur eigenen Nummerierung der Ausgabe neu basiert werden.
Das Ausgabe-ZIP wird deterministisch erstellt. Jeder Eintrag ist mit dem ursprünglichen Bereich benannt, dem Stamm der Quelldatei und dem Wort "seiten" vorangestellt, was bedeutet, dass eine Quelldatei namens vertrag.pdf, aufgeteilt mit 1-3, 5, 7-9, vertrag-seiten-1-3.pdf, vertrag-seiten-5.pdf und vertrag-seiten-7-9.pdf innerhalb des Archivs erzeugt. Die Namen sind über Läufe hinweg stabil - das erneute Einreichen derselben Aufteilung erzeugt byte-identische Dateinamen, sodass nachgelagerte Automatisierung sich darauf verlassen kann.
Konkrete Workflows, auf die diese Seite abzielt
- Aufteilen eines 200-seitigen kombinierten Vertrags in seine Bestandteile (Rahmenvertrag auf den Seiten 1-40, Leistungsbeschreibung auf 41-80, NDA auf 81-100, Anlagen auf 101-200), damit jedes Stück bei einem anderen Beteiligten abgelegt werden kann.
- Extrahieren des Abschnitts mit Jahresabschlüssen (oft Seiten 30-60) aus einem Geschäftsbericht und Weiterleitung nur dieses Auszugs an einen Analysten.
- Herausziehen einzelner Steuerformulare (W-2, 1099, K-1) aus einem Jahresend-Auszugspaket, sodass jedes Formular an den richtigen Steuerberater geht.
- Erstellen eines kapitelweisen PDF-Satzes aus einem langen Manuskript - der Splitter akzeptiert die Kapitelumbruch-Seitenzahlen auf einmal.
- Aufteilen eines Mehrmieter-Mietvertrags in eine PDF pro Mieter, sodass der Hausverwalter jedem Mieter sein eigenes Dokument per E-Mail zusenden kann.
- Extrahieren einiger spezifischer gescannter Belege aus einem monatlichen Spesennachweis in eigene Dateien für einen separaten Erstattungsworkflow.
- Aufteilen eines Vorstandspakets in einzelne Abschnitte, sodass jedem Direktor nur der für seinen Ausschuss relevante Teil zugesandt werden kann.
Fallstricke und Sonderfalle
Außerbereiche-Nummern (Seite 500 eines 300-seitigen Dokuments anfordern) veranlassen den Server, den gesamten Job mit einer klaren Fehlermeldung abzulehnen, statt still zu kappen - Seitenanzahl vor dem Einreichen schwerer Aufteilungen prüfen. Umgekehrte Bereiche wie 9-5 werden aus demselben Grund abgelehnt - sie vertauschen. Überlappende Bereiche sind erlaubt: 1-5, 3-8 erzeugt zwei PDFs, die die Seiten 3 bis 5 teilen, was manchmal das Gewollte ist, um verschiedene Abschnitte desselben Textes hervorzuheben. Einzelne Ganzzählen verhalten sich als einseitige Bereiche, was der natürliche Weg ist, isolierte Seiten zu extrahieren, ohne die Syntax aufzublähen. Formularfelder, die auf Dokumentebene (anstatt seitenweise) beschränkt sind, werden nur in den ersten Ausgabebereich übertragen; auf eine einzelne Seite beschränkte Felder reisen mit dieser Seite. AcroForm-Skripte, die auf Felder auf Seiten verweisen, die sich jetzt in verschiedenen Ausgabedateien befinden, verlieren ihre seiteninternen Referenzen auf diese Ziele - vor dem Verlassen auf ein geteiltes AcroForm testen.
Lokale Alternativen
Wenn dutzende Aufteilungen täglich durchgeführt werden oder der Workflow geskriptet werden soll, pdfcpu lokal ausführen: pdfcpu split input.pdf out/ 1 erstellt eine Datei pro Seite; pdfcpu trim -pages 1-10 input.pdf out.pdf extrahiert einen einzelnen Bereich. qpdf input.pdf --pages . 1-3 -- output.pdf macht dasselbe über qpdf. Adobe Acrobat Pro erlaubt das Teilen nach Dateigröße, Seitenanzahl oder Lesezeichen der obersten Ebene zusätzlich zu expliziten Bereichen, was manchmal für sehr große Dokumente bequemer ist. macOS-Vorschau kann einzelne Seiten per Drag-and-Drop aus einem Dokument ziehen, verarbeitet aber keine Bereiche als Stapel. Jede CLI gewinnt beim Durchsatz; diese Seite gewinnt bei null Installation und einem einzigen ZIP, das an einen nicht-technischen Empfänger übergeben werden kann.
Häufig gestellte Fragen
Wie wird die Bereichszeichenkette formatiert?
Kommagetrennte Ganzzählen und inklusive Bereiche, genau die Syntax, die Acrobat, ILovePDF und Smallpdf akzeptieren. Beispiele: "1-3" extrahiert die Seiten eins bis drei als eine PDF. "1-3, 5, 7-9" erzeugt drei separate PDFs im Ausgabe-ZIP: die erste enthält die Seiten 1, 2 und 3; die zweite enthält nur Seite 5; die dritte enthält die Seiten 7, 8 und 9. Die Reihenfolge spielt für den Splitter keine Rolle; die Ausgabedateinamen enthalten den ursprünglichen Bereich, sodass jedes Stück immer zu seinen Quellseiten zurückverfolgt werden kann.
Was ist die Ausgabe - eine zusammengeführte PDF oder mehrere Dateien?
Mehrere Dateien. Jedes kommagetrennte Segment in der Bereichszeichenkette wird zu einer eigenen PDF, und der Splitter zippt sie zusammen, sodass der Download ein einzelnes Archiv ist. Lokal entpacken, um die einzelnen PDFs zu erhalten. Wenn wirklich eine PDF mit einer Teilmenge von Seiten statt eines ZIPs von Stücken gewünscht wird, einen einzelnen zusammenhängenden Bereich wie "1-50" eingeben und das ZIP enthält genau eine PDF.
Wie unterscheidet sich das vom Browser-PDF-Splitter?
Der Browser-<a href="/tools/pdf-splitter/">PDF-Splitter</a> verwendet pdf-lib in JavaScript. Er funktioniert bei kleinen Dokumenten, ohne etwas hochzuladen, aber er lädt die gesamte PDF in den Heap des Tabs, um Seiten zu zählen, was bei Dokumenten über etwa 200 MB in Safari und bei einigen hundert MB in Firefox schlägt. Er weigert sich auch bei verschlüsselten Eingaben, weil pdf-lib keine Inhaltsstrome entschlüsseln kann. Der serverseitige Splitter hier streamt die Datei auf unseren EU-Server, ruft pdfcpu auf, um jeden Bereich mit nativer Leistung zu extrahieren, und zippt das Ergebnis. Diese Seite verwenden, wenn der Browser-Splitter an der Größe scheitert, wenn das Einlesen einer großen Datei zweimal im Browser schmerzhaft ist oder wenn die Ausgabe als sauberes ZIP statt als Reihe einzelner Downloads benötigt wird.
Kann ich eine passwortgeschützte PDF teilen?
Nicht direkt. pdfcpu weigert sich, verschlüsselte Eingaben ohne die Zugangsdaten zu verarbeiten, und diese Benutzeroberfläche sammelt das Passwort nicht, um das Formular einfach zu halten. Die Datei zuerst durch das <a href="/tools/pdf-unlock/">PDF-Entsperr</a>-Werkzeug führen, um eine Klartextkopie zu erzeugen, und dann diese Kopie hier teilen.
Werden meine Seitenbereiche vor dem Upload validiert?
Die Benutzeroberfläche prüft, ob die Bereichszeichenkette als kommagetrennte Ganzzählen und Bereiche parsebar ist, bevor die Einreichung erlaubt wird; eine offensichtlich fehlerhafte Zeichenkette wie "1--3, abc" wird inline abgelehnt. Der Server führt einen zweiten Validierungsdurchlauf durch und weist Bereiche ab, die Seiten über die Seitenanzahl des Dokuments hinaus referenzieren oder Bereiche, bei denen der Start den End überschreitet. Beide Fehler werden mit einer klaren Meldung gemeldet; bei einem fehlgeschlagenen Lauf wird nichts teilweise extrahiert.
Was ist die größte Datei, die ich teilen kann?
Das feste Upload-Limit beträgt 200 MB pro Datei. Die meisten Dokumente liegen weit darunter - ein 500-seitiger Vertrag ist normalerweise unter 5 MB, ein 1.000-seitiger Scan mit Bildern selten über 100 MB. Wenn eine PDF größer als 200 MB vorhanden ist, den <a href="/tools/pdf-compressor/">PDF-Kompressor</a> zuerst anwenden, um Bilder zu verkleinern, und dann die komprimierte Kopie aufteilen.
Bleiben Metadaten, Links und Lesezeichen beim Teilen erhalten?
Seiteninhalt (Text, Bilder, Formulare, Anmerkungen, interne Seiten-zu-Seiten-Links) wird unverändert kopiert. Dokument-Metadaten (Titel, Autor, Hersteller) werden in jede Ausgabedatei übertragen. Lesezeichen sind ein Sonderfall: pdfcpu kopiert den Teilbaum der Gliederung, der auf den extrahierten Bereich zeigt, und entfernt Gliederungseinträge, die auf Seiten außerhalb des Bereichs verweisen. Dokumentübergreifende Hyperlinks in der ursprünglichen PDF, die auf Seiten außerhalb des extrahierten Bereichs zeigten, werden zu toten Links in der Ausgabe - das ist eine strukturelle Konsequenz des Entfernens des Ziels, keine Werkzeugbeschränkung.
Wo werden die Dateien verarbeitet und wie lange werden sie aufbewahrt?
Auf unseren EU-Servern in Helsinki, über HTTPS. Der Upload wird in ein Arbeitsverzeichnis geschrieben, pdfcpu läuft einmal, um jeden angeforderten Bereich zu extrahieren, die Ausgaben werden gezipt und das Archiv wird über eine HMAC-signierte Download-URL bereitgestellt, die nach 15 Minuten aufhört zu funktionieren. Die ursprüngliche PDF, die einzelnen Bereichsausgaben und das ZIP werden durch ein Bereinigungscron entfernt, das alle 5 Minuten läuft. Dateiinhalte werden nicht protokolliert und keine Ausgaben werden aufbewahrt.
Kann ich nach einer festen Seitenanzahl statt nach expliziten Bereichen teilen?
Nicht im aktuellen Formular. Bereiche explizit eingeben - für einen Workflow "teile alle 10 Seiten" bei einem 100-seitigen Dokument bedeutet das "1-10, 11-20, 21-30, ..., 91-100". Eine künftige Version könnte eine "teile alle N Seiten"-Abkürzung bieten, sobald genug Nachfrage besteht; derzeit ist das explizite Formular die einzige Schnittstelle.
Was ist, wenn ich eine einzelne Seite extrahieren möchte?
Eine einzelne Zahl in der Bereichszeichenkette verwenden. "7" extrahiert Seite 7 als eine einseitige PDF; "7, 12, 19" extrahiert drei einseitige PDFs. Das Ausgabe-ZIP benennt jede Datei mit dem ursprünglichen Bereich, aus dem sie stammt, sodass immer erkennbar ist, welche Seite welche ist.
Mehr PDF Tools
Image to PDF
Combine multiple JPG and PNG images into a single PDF document.
Open toolPDF Compressor
Compress PDFs with Ghostscript image downsampling. Pick a quality preset. Files auto-deleted after 15 minutes.
Open toolPDF Merge (Server-Side)
Merge up to 20 PDFs into a single document on our EU servers using qpdf. Files auto-deleted after 15 minutes. Handles large or password-cleared inputs the in-browser merger cannot.
Open toolPDF Merger
Merge multiple PDF files into a single document with drag-and-drop reordering.
Open toolPDF Page Reorder
Rearrange pages in a PDF document with a visual drag-and-drop interface.
Open toolPDF Password Protect
Add AES-256 password protection to PDF files via qpdf. Files auto-deleted after 15 minutes.
Open tool