Daten aus pdf in excel einlesen

Excel Funktionen

Daten aus pdf in excel einlesen

Ein PDF können Sie auf mehrere Weisen in Excel einfügen.

Mit PDF-Dateien können Sie Ihren Excel-Tabellen weiteren Mehrwert hinzufügen. Dazu sind nur wenige Klicks nötig, denn Office-Programme sind mit dem PDF-Format kompatibel.

Nachdem wir Ihnen bereits gezeigt haben, wie Sie ein PDF in Word einfügen können, folgt nun der PDF-Import in Excel.

PDF in Excel einfügen: So gehen Sie vor

Excel besitzt (genau wie Word) eine Funktion, um externe Objekte einzufügen. Dies geht folgendermaßen:

  1. Öffnen Sie im Excel-Menü die Registerkarte "Einfügen".
  2. Klicken Sie im Bereich "Text" auf "Objekt".
  3. Klicken Sie im neuen Dialogfenster auf den Reiter "Neu erstellen".
  4. Wählen Sie dann das PDF-Dokument aus, das Sie in Excel einfügen möchten. Hinweis: Wenn Sie das Häkchen bei "Als Symbol" setzen, wird nicht das PDF als Ganzes eingefügt, sondern nur das Symbol der Datei.
  5. Klicken Sie auf "Ok".

Das PDF erscheint daraufhin im Excel-Dokument und Sie können es nach Belieben bearbeiten, etwa die Position verschieben oder die Größe ändern.

PDF-Dateien als Bild in Excel einfügen

Eine der schnellsten Möglichkeiten eine PDF-Datei in Excel einzufügen ist der Bilder-Import.

  1. Öffnen Sie zunächst die Excel-Datei, in die Sie ein PDF einfügen möchten.
  2. Wählen Sie nun "Einfügen" > "Bilder" > "Bild aus Datei" aus.
  3. Klicken Sie nun auf das PDF, das eingefügt werden soll.

Mit dem kostenlosen Adobe Acrobat Reader DC können Acrobat PDF-Formulare ausgefüllt und gespeichert werden. Möchten Sie die Daten von bereits ausgefüllten PDF-Formularen automatisiert auslesen, bietet sich die Software Adobe Acrobat Pro an. Unter der Bezeichnung „Datendateien in Tabelle zusammenführen“ versteckt sich die gewünschte Funktionalität. Zuerst werden die auszuwertenden PDF-Dateien ausgewählt und anschließend die Daten aus den Formularen in einer CSV-Datei zusammengeführt. Diese Datei kann von einer Tabellenkalkulation wie Microsoft Excel oder dem kostenlosen Pendant LibreOffice Calc gelesen und angezeigt werden.

Die Namen der importierten PDF-Formulare werden in der ersten Spalte angezeigt, jede Zeile steht für eine Datei. In den folgenden Spalten werden die Daten angezeigt. Jede Spalte zeigt den Inhalt zu einem Formularfeld. Der Name des jeweiligen Formularfeldes steht als Überschrift über der Spalte.

Tipp: In der Praxis kann es vorkommen, dass nur der Dateiname in der ersten Spalte vorhanden ist, der Datenbereich aber ohne Inhalt angezeigt wird. In diesem Fall sind vermutlich die Rechte für das betroffene Acrobat PDF-Formular zu restriktiv gesetzt. Entfernen Sie mittels Adobe Acrobat DC den Passwort-Schutz und führen Sie die Funktion „Datendateien in Tabelle zusammenführen“ erneut aus.

In der Vergangenheit war es äusserst mühsam Daten von einem PDF in Excel einzufügen. Entweder konnte mit Copy/Paste die Daten kopiert werden oder es gab Addins von Drittanbietern. Neu kann Power Query für den Import von PDFs verwendet werden. PowerQuery ist ab MS Office 2016 in Excel integriert. Nachfolgend erkläre ich Ihnen wie dies funktioniert.

  • PDF auswählen
  • Daten abrufen mit Power Query
  • Daten in Power Query transformieren
  • Fazit
  • Benötigen Sie Excel-Hilfe?

PDF auswählen

Als erstes benötigen wir ein PDF, welches bspw. so aussieht:

Daten aus pdf in excel einlesen

Sinnvollerweise enthält das PDF eine Tabelle, welche importiert werden kann. Excel versucht die Daten zu erkennen und bereitet sie nach Möglichkeiten auf. Für unser Beispiel habe ich ein PDF vom Bundesamt für Statistik verwendet.

Daten abrufen mit Power Query

Um das PDF zu importieren öffnen Sie bitte Excel und gehen Sie dann zum Tab „Daten“ -> „Daten abrufen“ -> „Aus Datei“ -> „Aus PDF“.

Daten aus pdf in excel einlesen
Wählen Sie danach das zu importierende PDF aus. Excel bereitet danach eine Vorschau pro Seite auf. Da unsere Tabelle auf der Seite 49 ist, finde ich die Tabelle unter „…(Page 49)“. Wenn die Tabelle in der Vorschau bereits korrekt aussieht, dann drücken Sie auf „Laden“. In der Regel müssen die Daten aber vorerst via PowerQuery optimiert werden, daher wähle ich stattdessen „Transformieren“.
Daten aus pdf in excel einlesen

Daten in Power Query transformieren

Wenn Sie auf Transformieren gedrückt haben, erscheinen die Daten in PowerQuery. In meinem Beispiel steht nun die Titelzeile in der ersten Zeile und nicht im Titel, daher drücke ich links oben in der Ecke auf die Tabelle und wähle „Erste Zeile als Überschriften verwenden“. Danach sind in meinem Beispiel die Monate als Titel definiert.

Daten aus pdf in excel einlesen

Weiter lösche ich die ersten beiden Zeilen, welche mich stören. Ich könnte noch weitere Optimierungen vornehmen. Dies ist aber von PDF zu PDF resp. von Tabelle zu Tabelle unterschiedlich. Wenn ich mit den Optimierungen zufrieden bin, dann klicke ich auf Schliessen und Laden. So sieht dann die Tabelle in Excel aus:

Daten aus pdf in excel einlesen

Fazit

So einfach haben Sie eine PDF-Tabelle ins Excel eingelesen.

Benötigen Sie Excel-Hilfe?

Erfahren Sie mehr über Power Query, indem Sie andere Artikel zu Power Query auf dieser Website durchsuchen. Insbesondere wie Sie Fehler in Power Query behandeln können oder lesen Sie eine Einführung in die M-Sprache von Power Query.

Wenn Ihnen die Zeit fehlt, um sich selber mit Power Query zu befassen, dann rufen Sie uns an, wir erledigen dies sehr gerne für Sie. Unsere Kontaktdaten finden Sie auf unserer Webseite.

Kann man PDF in Excel importieren?

Eine der schnellsten Möglichkeiten eine PDF-Datei in Excel einzufügen ist der Bilder-Import. Öffnen Sie zunächst die Excel-Datei, in die Sie ein PDF einfügen möchten. Wählen Sie nun "Einfügen" > "Bilder" > "Bild aus Datei" aus. Klicken Sie nun auf das PDF, das eingefügt werden soll.

Wie kann ich eine Tabelle aus PDF kopieren?

Öffnen Sie die PDF-Datei in Reader. Klicken Sie mit der rechten Maustaste auf das Dokument und wählen Sie das Auswahl-Werkzeug im Popupmenü aus. Ziehen Sie, um Text auszuwählen, oder klicken Sie, um ein Bild auszuwählen. Klicken Sie mit der rechten Maustaste auf das ausgewählte Element und wählen Sie Kopieren aus.

Warum kann ich Excel nicht als PDF speichern?

Ursache. Das Problem besteht darin, dass die Anwendung beim Auswählen eines PostScript-Druckers als Standarddrucker für Excel die Größe des Arbeits Bogens nicht skaliert. Dieses Verhalten liegt daran, dass das Ausgabegerät bei PostScript die Skalierung anstatt von Excel durchführt.