Hogyan lehet táblázatokat kivonni PDF dokumentumokból

Ez a cikk bemutatja, hogyan bonthat ki táblázatokat PDF-dokumentumokból(extract tables from PDF documents) . Előfordulhat, hogy sok PDF -fájlja van, amelyek több táblázatot tartalmaznak, amelyeket külön szeretne használni. A táblázatok másolása(Copying) és beillesztése nem jó megoldás, mivel előfordulhat, hogy nem adja meg a várt eredményt, ezért szüksége van néhány más egyszerű lehetőségre, amelyek kivonhatják a táblázatokat egy PDF - fájlból, és külön fájlként menthetik azokat.

A legtöbb ilyen PDF-táblázat-kivonó eszköz(PDF table extractor tools) nem tud segíteni, ha a PDF -tábla beolvasásra kerül. Ilyen esetben először kereshetővé kell tennie a PDF-fájlt(make the PDF searchable)  , majd próbálja ki ezeket a lehetőségeket.

Táblázatok kibontása PDF dokumentumokból

Ebben a bejegyzésben 2 ingyenes online szolgáltatást és 3 ingyenes szoftvert adtunk hozzá a táblázatok PDF - fájlból való kinyeréséhez:

  1. PDF-ből XLS-be
  2. PDFtoExcel.com
  3. Tabula
  4. ByteScout PDF Multitool
  5. Sejda PDF asztali.

1] PDF-ből XLS-be

PDF to XLS szolgáltatás

A PDF(PDF) to XLS az egyik legjobb lehetőség a táblázatok PDF -ből való kinyerésére . Két olyan funkciója van, amelyek praktikussá teszik. Összesen 20 PDF(20 PDF) dokumentumból tölthet le táblázatokat . Ezenkívül a PDF - tábla kibontása automatikus. A kimenetet XLSX fájlként állítja elő. Ha egy PDF -fájl több táblázatot tartalmaz, akkor minden tábla külön-külön, a kimeneti (PDF)XLSX fájl különböző lapjain kerül tárolásra .

Nyissa meg a szolgáltatás kezdőlapját(Open the homepage) . Ezután húzza át a PDF fájlokat, vagy használja a FÁJLOK FELTÖLTÉSE(UPLOAD FILES) gombot. Minden feltöltött PDF automatikusan XLSX formátumú fájllá alakul. Amikor a kimeneti fájlok készen állnak, letöltheti őket egyenként, vagy letölthet egy ZIP fájlt, amely az összes kimeneti fájlt tartalmazza.

2] PDFtoExcel.com

Táblázatok kibontása PDF dokumentumokból

A PDFtoExcel.com(PDFtoExcel.com) szolgáltatás egyszerre képes táblákat kivonni egy PDF -ből , de több platformon is támogatja a PDF feltöltését . Támogatja a OneDrive , az asztali(desktop) , a Google Drive és a Dropbox platformokat a PDF feltöltéséhez . Ezenkívül az átalakítási folyamat automatikus.

Ez a szolgáltatás honlapja itt található(here) . Ott válasszon egy feltöltési lehetőséget a PDF hozzáadásához . Ezt követően automatikusan feltölti és konvertálja a PDF -et Excel ( XLSX ) fájlba. Amikor a kimenet készen van, megkapja a letöltési hivatkozást a PDF - táblázat(oka)t tartalmazó kimeneti fájl mentéséhez.

Megjegyzés:(Note: ) Bár ez a szolgáltatás megemlíti, hogy képes táblázatokat kivonni a beolvasott PDF -fájlokból is, nekem nem működött. Továbbra is kipróbálhatja beolvasott PDF -hez .

3] Tabula

Tabula PDF kivonó szoftver

A Tabula(Tabula) egy hatékony szoftver, amely képes automatikusan felismerni a PDF -ben található táblázatokat , majd lehetővé teszi a táblázatok TSV- , JSON- vagy CSV - fájlként történő mentését. Kiválaszthatja, hogy minden PDF -táblázathoz külön (PDF)CSV -fájlokat kíván -e menteni, vagy az összes táblázatot egyetlen CSV - fájlba menti.

A nyílt forráskódú(open-source) PDF táblázatkivonat letöltéséhez kattintson ide(click here) . A sikeres futtatásához és használatához Java is szükséges .(requires Java)

Bontsa ki a letöltött ZIP -fájlt, és futtassa a tabula.exe fájlt. Megnyílik egy oldal az alapértelmezett böngészőben. Ha az oldal nem nyílik meg, adja hozzá a http://localhost:8080 címet a böngészőhöz, és nyomja meg az Enter billentyűt .

Most látni fogja a felületét, ahol a Tallózás(Browse) opcióval PDF -t adhat hozzá . Ezután nyomja meg az Import gombot. A PDF hozzáadása után a (PDF)PDF oldalak láthatók a felületén.

Használja a Táblázatok automatikus felismerése(Autodetect Tables) gombot, és automatikusan kiemeli a PDF -ben található összes táblázatot . Egy táblázatot manuálisan is kiemelhet egy adott táblázat kiválasztásával. Ha szeretné, a kiválasztott táblázatokat is eltávolíthatja(remove selected tables) .

Ezzel csak a kívánt táblázatokat mentheti el. Amikor a PDF táblázatok ki vannak jelölve, kattintson a Kivont adatok előnézete és exportálása(Preview & Export Extracted Data) gombra.

Végül használja a felső részen található legördülő menüt a kimeneti formátum kiválasztásához, majd nyomja meg az Exportálás(Export) gombot. Ezzel a PDF -táblázatokat az Ön által kiválasztott kimeneti formátumú fájlba menti.

4] ByteScout PDF Multitool

ByteScout PDF Multitool – PDF hozzáadása és táblázatok észlelése

Ahogy a neve is sugallja, ez a szoftver több eszközzel is rendelkezik. Olyan eszközökkel rendelkezik, mint például a PDF konvertálása többoldalas TIFF formátumba(convert PDF to multipage TIFF) , a PDF-dokumentum elforgatása(rotate PDF document) , a PDF kereshetetlenné tétele , a PDF (make PDF unsearchable)optimalizálása(optimize PDF) , a kép hozzáadása a PDF(add an image to PDF) -hez és még sok más. A PDF(PDF) táblázat detektor funkciója is ott van, ami nagyon félelmetes. Ennek az eszköznek az az előnye, hogy táblázatokat is kivonhat a beolvasott PDF-ből(extract tables from scanned PDF) . Több oldalon is észlelheti a táblázatokat, majd kibonthatja azokat CSV , XLS , XML , TXT vagy JSON formátumú fájlként. A kibontás előtt egy oldaltartomány(page range) beállítását is lehetővé teszitáblázatok csak meghatározott oldalakról történő kinyerésére.

Itt megragadhatja ezt a szoftvert(here) . Csak nem kereskedelmi használatra ingyenes(free for non-commercial use) . A telepítés után futtassa ezt a szoftvert, és használja a Dokumentum megnyitása opciót (Open Document)PDF hozzáadásához . Ezután kattintson a Táblázatok észlelése(Detect tables) eszközre a fenti képen látható módon. Ez az eszköz az Adatkinyerés(Data Extraction) kategóriában található.

Megnyílik egy doboz, ahol beállíthatja a táblák észlelésének feltételeit. Például beállíthatja az oszlopok, sorok minimális számát, minimális sortörést a táblázatok között, beállíthatja a táblázatészlelési módot szegélyezett vagy szegély nélküli táblázatra stb. Használhat opciókat, vagy tartsa meg az alapértelmezett beállításokat.

Ezután nyomja meg a következő táblázat észlelése(Detect next table) gombot abban a mezőben. Ez azonosítani és kiválasztani egy táblázatot az aktuális oldalon. Ily módon egy másik oldalra léphet, és több táblázatot észlelhet.

táblázatok észlelése és pdf-táblázatok mentése a kiválasztott kimenettel

Ha végzett, használja a Tovább a kibontáshoz(Proceed to extraction) gombot, és válassza ki a kimeneti formátumot. Végül lehetőségekkel mentheti a táblázatokat az aktuális oldalról, vagy meghatározhat egy oldaltartományt, és mentheti a kimenetet.

Az eszköz kielégítő eredményt ad. De néha előfordulhat, hogy más tartalmat észlel a PDF -ben, és nem tud több oldalról táblázatokat kivonni. Ebben az esetben a táblázatok egyenkénti lekéréséhez és mentéséhez használja.

5] Sejda PDF Desktop

Sejda PDF Desktop pdf-excel konverterrel

A Sejda PDF Desktop(Sejda PDF Desktop) egy többcélú szoftver is. Képes optimalizálni vagy tömöríteni a PDF(compress PDF) -et, vízjelet adni a PDF-hez, eltávolítani a korlátozásokat a PDF(remove restrictions from PDF) -ből , szerkeszteni PDF -dokumentumot stb. Az ingyenes tervnek azonban vannak korlátai. Az ingyenes tervben naponta csak 3 feladatot lehet elvégezni. Ezenkívül a PDF méretkorlátja 50 MB vagy 10 oldal(10 pages) .

A PDF-ből Excel(PDF to Excel) konvertáló eszközzel PDF - táblázatokat bonthat ki. Automatikusan felismeri a PDF - oldalakon lévő táblázatokat, és lehetővé teszi a táblázatok XLSX vagy CSV formátumban történő mentését .

A letöltési linkje itt található(here) . A telepítés után használja a PDF to Excel eszközt a fő felületről. Az eszköz kiválasztása után használja a PDF fájlok(Choose PDF files) kiválasztása gombot. Az ingyenes csomaghoz csak egy PDF adható hozzá.

A PDF hozzáadása után a PDF konvertálása CSV(Convert PDF to CSV) formátumba és a PDF konvertálása Excel formátumba(Convert PDF to Excel) gombokat kínálja. Használjon egy gombot, majd elmentheti a kimenetet a kívánt helyre a számítógépen.

pdf táblázat konvertálása excel vagy csv formátumba

A PDF -tábla felismerő eszköze jó. Nem kell manuálisan észlelnie a táblákat. Ennek ellenére néha más szöveges tartalmat is tartalmazhat PDF -táblázatként, és tárolhatja a kimenetben. De összességében jók az eredmények.

Ez minden.

Ezek néhány jó eszköz a táblázatok PDF -ből való kivonásához . A Tabula(Tabula) szoftver hatékonyabb, mint más eszközök. Ennek ellenére kipróbálhatja az összes eszközt, és ellenőrizheti, melyik segít.

Hasonlóan olvasható:(Similar reads:)



About the author

Informatikus vagyok, aki az adatvédelemre, a felhasználói fiókokra és a család biztonságára összpontosít. Az elmúlt néhány évben az okostelefonok biztonságának javításán dolgozom, és van tapasztalatom a szerencsejáték-cégekkel való együttműködésben. Többször írtam a felhasználói fiókokkal és a játékkal kapcsolatos problémákról is.



Related posts