Hogyan lehet táblázatokat kivonni PDF dokumentumokból
Ez a cikk bemutatja, hogyan bonthat ki táblázatokat PDF-dokumentumokból(extract tables from PDF documents) . Előfordulhat, hogy sok PDF -fájlja van, amelyek több táblázatot tartalmaznak, amelyeket külön szeretne használni. A táblázatok másolása(Copying) és beillesztése nem jó megoldás, mivel előfordulhat, hogy nem adja meg a várt eredményt, ezért szüksége van néhány más egyszerű lehetőségre, amelyek kivonhatják a táblázatokat egy PDF - fájlból, és külön fájlként menthetik azokat.
A legtöbb ilyen PDF-táblázat-kivonó eszköz(PDF table extractor tools) nem tud segíteni, ha a PDF -tábla beolvasásra kerül. Ilyen esetben először kereshetővé kell tennie a PDF-fájlt(make the PDF searchable) , majd próbálja ki ezeket a lehetőségeket.
Táblázatok kibontása PDF dokumentumokból
Ebben a bejegyzésben 2 ingyenes online szolgáltatást és 3 ingyenes szoftvert adtunk hozzá a táblázatok PDF - fájlból való kinyeréséhez:
- PDF-ből XLS-be
- PDFtoExcel.com
- Tabula
- ByteScout PDF Multitool
- Sejda PDF asztali.
1] PDF-ből XLS-be
A PDF(PDF) to XLS az egyik legjobb lehetőség a táblázatok PDF -ből való kinyerésére . Két olyan funkciója van, amelyek praktikussá teszik. Összesen 20 PDF(20 PDF) dokumentumból tölthet le táblázatokat . Ezenkívül a PDF - tábla kibontása automatikus. A kimenetet XLSX fájlként állítja elő. Ha egy PDF -fájl több táblázatot tartalmaz, akkor minden tábla külön-külön, a kimeneti (PDF)XLSX fájl különböző lapjain kerül tárolásra .
Nyissa meg a szolgáltatás kezdőlapját(Open the homepage) . Ezután húzza át a PDF fájlokat, vagy használja a FÁJLOK FELTÖLTÉSE(UPLOAD FILES) gombot. Minden feltöltött PDF automatikusan XLSX formátumú fájllá alakul. Amikor a kimeneti fájlok készen állnak, letöltheti őket egyenként, vagy letölthet egy ZIP fájlt, amely az összes kimeneti fájlt tartalmazza.
2] PDFtoExcel.com
A PDFtoExcel.com(PDFtoExcel.com) szolgáltatás egyszerre képes táblákat kivonni egy PDF -ből , de több platformon is támogatja a PDF feltöltését . Támogatja a OneDrive , az asztali(desktop) , a Google Drive és a Dropbox platformokat a PDF feltöltéséhez . Ezenkívül az átalakítási folyamat automatikus.
Ez a szolgáltatás honlapja itt található(here) . Ott válasszon egy feltöltési lehetőséget a PDF hozzáadásához . Ezt követően automatikusan feltölti és konvertálja a PDF -et Excel ( XLSX ) fájlba. Amikor a kimenet készen van, megkapja a letöltési hivatkozást a PDF - táblázat(oka)t tartalmazó kimeneti fájl mentéséhez.
Megjegyzés:(Note: ) Bár ez a szolgáltatás megemlíti, hogy képes táblázatokat kivonni a beolvasott PDF -fájlokból is, nekem nem működött. Továbbra is kipróbálhatja beolvasott PDF -hez .
3] Tabula
A Tabula(Tabula) egy hatékony szoftver, amely képes automatikusan felismerni a PDF -ben található táblázatokat , majd lehetővé teszi a táblázatok TSV- , JSON- vagy CSV - fájlként történő mentését. Kiválaszthatja, hogy minden PDF -táblázathoz külön (PDF)CSV -fájlokat kíván -e menteni, vagy az összes táblázatot egyetlen CSV - fájlba menti.
A nyílt forráskódú(open-source) PDF táblázatkivonat letöltéséhez kattintson ide(click here) . A sikeres futtatásához és használatához Java is szükséges .(requires Java)
Bontsa ki a letöltött ZIP -fájlt, és futtassa a tabula.exe fájlt. Megnyílik egy oldal az alapértelmezett böngészőben. Ha az oldal nem nyílik meg, adja hozzá a http://localhost:8080 címet a böngészőhöz, és nyomja meg az Enter billentyűt .
Most látni fogja a felületét, ahol a Tallózás(Browse) opcióval PDF -t adhat hozzá . Ezután nyomja meg az Import gombot. A PDF hozzáadása után a (PDF)PDF oldalak láthatók a felületén.
Használja a Táblázatok automatikus felismerése(Autodetect Tables) gombot, és automatikusan kiemeli a PDF -ben található összes táblázatot . Egy táblázatot manuálisan is kiemelhet egy adott táblázat kiválasztásával. Ha szeretné, a kiválasztott táblázatokat is eltávolíthatja(remove selected tables) .
Ezzel csak a kívánt táblázatokat mentheti el. Amikor a PDF táblázatok ki vannak jelölve, kattintson a Kivont adatok előnézete és exportálása(Preview & Export Extracted Data) gombra.
Végül használja a felső részen található legördülő menüt a kimeneti formátum kiválasztásához, majd nyomja meg az Exportálás(Export) gombot. Ezzel a PDF -táblázatokat az Ön által kiválasztott kimeneti formátumú fájlba menti.
4] ByteScout PDF Multitool
Ahogy a neve is sugallja, ez a szoftver több eszközzel is rendelkezik. Olyan eszközökkel rendelkezik, mint például a PDF konvertálása többoldalas TIFF formátumba(convert PDF to multipage TIFF) , a PDF-dokumentum elforgatása(rotate PDF document) , a PDF kereshetetlenné tétele , a PDF (make PDF unsearchable)optimalizálása(optimize PDF) , a kép hozzáadása a PDF(add an image to PDF) -hez és még sok más. A PDF(PDF) táblázat detektor funkciója is ott van, ami nagyon félelmetes. Ennek az eszköznek az az előnye, hogy táblázatokat is kivonhat a beolvasott PDF-ből(extract tables from scanned PDF) . Több oldalon is észlelheti a táblázatokat, majd kibonthatja azokat CSV , XLS , XML , TXT vagy JSON formátumú fájlként. A kibontás előtt egy oldaltartomány(page range) beállítását is lehetővé teszitáblázatok csak meghatározott oldalakról történő kinyerésére.
Itt megragadhatja ezt a szoftvert(here) . Csak nem kereskedelmi használatra ingyenes(free for non-commercial use) . A telepítés után futtassa ezt a szoftvert, és használja a Dokumentum megnyitása opciót (Open Document)PDF hozzáadásához . Ezután kattintson a Táblázatok észlelése(Detect tables) eszközre a fenti képen látható módon. Ez az eszköz az Adatkinyerés(Data Extraction) kategóriában található.
Megnyílik egy doboz, ahol beállíthatja a táblák észlelésének feltételeit. Például beállíthatja az oszlopok, sorok minimális számát, minimális sortörést a táblázatok között, beállíthatja a táblázatészlelési módot szegélyezett vagy szegély nélküli táblázatra stb. Használhat opciókat, vagy tartsa meg az alapértelmezett beállításokat.
Ezután nyomja meg a következő táblázat észlelése(Detect next table) gombot abban a mezőben. Ez azonosítani és kiválasztani egy táblázatot az aktuális oldalon. Ily módon egy másik oldalra léphet, és több táblázatot észlelhet.
Ha végzett, használja a Tovább a kibontáshoz(Proceed to extraction) gombot, és válassza ki a kimeneti formátumot. Végül lehetőségekkel mentheti a táblázatokat az aktuális oldalról, vagy meghatározhat egy oldaltartományt, és mentheti a kimenetet.
Az eszköz kielégítő eredményt ad. De néha előfordulhat, hogy más tartalmat észlel a PDF -ben, és nem tud több oldalról táblázatokat kivonni. Ebben az esetben a táblázatok egyenkénti lekéréséhez és mentéséhez használja.
5] Sejda PDF Desktop
A Sejda PDF Desktop(Sejda PDF Desktop) egy többcélú szoftver is. Képes optimalizálni vagy tömöríteni a PDF(compress PDF) -et, vízjelet adni a PDF-hez, eltávolítani a korlátozásokat a PDF(remove restrictions from PDF) -ből , szerkeszteni PDF -dokumentumot stb. Az ingyenes tervnek azonban vannak korlátai. Az ingyenes tervben naponta csak 3 feladatot lehet elvégezni. Ezenkívül a PDF méretkorlátja 50 MB vagy 10 oldal(10 pages) .
A PDF-ből Excel(PDF to Excel) konvertáló eszközzel PDF - táblázatokat bonthat ki. Automatikusan felismeri a PDF - oldalakon lévő táblázatokat, és lehetővé teszi a táblázatok XLSX vagy CSV formátumban történő mentését .
A letöltési linkje itt található(here) . A telepítés után használja a PDF to Excel eszközt a fő felületről. Az eszköz kiválasztása után használja a PDF fájlok(Choose PDF files) kiválasztása gombot. Az ingyenes csomaghoz csak egy PDF adható hozzá.
A PDF hozzáadása után a PDF konvertálása CSV(Convert PDF to CSV) formátumba és a PDF konvertálása Excel formátumba(Convert PDF to Excel) gombokat kínálja. Használjon egy gombot, majd elmentheti a kimenetet a kívánt helyre a számítógépen.
A PDF -tábla felismerő eszköze jó. Nem kell manuálisan észlelnie a táblákat. Ennek ellenére néha más szöveges tartalmat is tartalmazhat PDF -táblázatként, és tárolhatja a kimenetben. De összességében jók az eredmények.
Ez minden.
Ezek néhány jó eszköz a táblázatok PDF -ből való kivonásához . A Tabula(Tabula) szoftver hatékonyabb, mint más eszközök. Ennek ellenére kipróbálhatja az összes eszközt, és ellenőrizheti, melyik segít.
Hasonlóan olvasható:(Similar reads:)
- Csatolmányok kibontása PDF-ből(Extract attachments from PDF)
- Kiemelt szöveg kibontása PDF-ből(Extract highlighted text from PDF) .
Related posts
Dokumentumkonverter: DOC, PDF, DOCX, RTF, TXT, HTML fájlok konvertálása
Mi az a PPS fájl? Hogyan lehet PPS-t PDF-be konvertálni a Windows 11/10 rendszerben?
A PDF szöveg eltűnik a fájl szerkesztése vagy mentése során a Windows 11/10 rendszerben
A legjobb ingyenes PDF-szerkesztő online eszközök, amelyek felhő alapúak
Ingyenes PDF szerkesztő online eszköz PDF fájlok szerkesztéséhez - PDF Igen
Hogyan lehet jelszóval védeni és biztonságossá tenni pdf-dokumentumokat a LibreOffice segítségével
Engedélyezze a kétoldalas nézet módot PDF-hez a Google Chrome PDF Viewerben
A legjobb ingyenes PDF Stamp Creator szoftver Windows 10 rendszerhez
Több PDF-fájl egyesítése egyetlen PDF-fájlban
Gyorsan megtekintheti a képeket és a PDF-dokumentumokat a PRIMA Rapid Image Viewer segítségével
PDF-metaadatok kibontása és mentése a Windows 11/10 rendszerben
Hogyan lehet a beolvasott PDF-et kereshető PDF-vé alakítani?
A legjobb ingyenes PDF-szerkesztő szoftver Windows 10 rendszerhez
Weboldalak PDF formátumban történő mentése Chrome-ban vagy Firefoxban
PDF-oldalak kivágása Windows 11 rendszerben online eszköz vagy ingyenes szoftver segítségével
A legjobb PDF-szószámláló szoftver és online eszközök
Az Adobe Reader nem működik Windows 11/10 alatt
Hiperhivatkozások hozzáadása, eltávolítása vagy szerkesztése a PDF-fájlokban a PDF-hivatkozásszerkesztővel
A PDFTK Builder egy ingyenes szoftver PDF fájlok és dokumentumok módosítására és felosztására
A LightPDF egy átfogó online PDF-szerkesztő eszköz az összes PDF-szükséglethez