5 ingyenes online OCR-szolgáltatás tesztelve és felülvizsgálva

Van egy PDF dokumentuma vagy egy kép, amelyet szöveggé szeretne konvertálni? Nemrég valaki postán küldött nekem egy dokumentumot, amelyet szerkesztenem kellett, és javításokkal vissza kell küldenem. A személy nem talált egy digitális másolatot, ezért azt a feladatot kaptam, hogy ezt a szöveget digitális formátumba helyezzem.

Nem volt módom órákat tölteni azzal, hogy mindent visszagépeljek, így végül szép, jó minőségű képet készítettem a dokumentumról, majd végigpörgettem egy csomó online OCR szolgáltatást, hogy megtudjam, melyik nyújtja a legjobbat. eredmények.

Ebben a cikkben áttekintek néhány ingyenes OCR -webhelyemet . Érdemes megjegyezni, hogy ezeknek a webhelyeknek a többsége ingyenes alapszolgáltatást biztosít, majd fizetős opciókat is kínál, ha extra funkciókat szeretne, például nagyobb képeket, többoldalas PDF dokumentumokat, különböző beviteli nyelveket stb.

Azt is jó előre tudni, hogy ezeknek a szolgáltatásoknak a többsége nem fog tudni megegyezni az eredeti dokumentum formázásával. Ezek főként szövegek kivonására szolgálnak, és ennyi. Ha mindennek egy adott elrendezésben vagy formátumban kell lennie, ezt manuálisan kell megtennie, miután megkapta az összes szöveget az OCR -ből .

Ezenkívül a legjobb eredményt a 200–400 DPI felbontású dokumentumok adják a szövegek lekéréséhez. Ha alacsony a DPI -képe, az eredmény nem lesz olyan jó.

Végül sok olyan webhelyet teszteltem, amelyek egyszerűen nem működtek. Ha ingyenes online OCR -t használ a Google-on, egy csomó webhelyet fog látni, de a legjobb 10 találat között több webhely sem fejezte be az átalakítást. Egyesek időtúllépést okoztak, mások hibákat adtak, és néhányan csak megragadtak a „konvertáló” oldalon, így nem is vettem a fáradságot, hogy megemlítsem ezeket az oldalakat.

Minden webhely esetében két dokumentumot teszteltem, hogy megnézzem, milyen jó lesz a kimenet. Tesztjeimhez egyszerűen az iPhone 5S-emet használtam, hogy mindkét dokumentumról képet készítettem, majd közvetlenül feltöltöttem őket a webhelyekre konvertálás céljából.

Ha szeretné látni, hogy néztek ki a tesztemhez használt képek, csatoltam őket ide: Teszt1(Test1 ) és Teszt2(Test2) . Vegye figyelembe, hogy ezek nem a telefonról készített képek teljes felbontású verziói. Az oldalakra való feltöltéskor a teljes felbontású képet használtam.

OnlineOCR

Az OnlineOCR.net(OnlineOCR.net) egy tiszta és egyszerű webhely, amely nagyon jó eredményeket hozott a tesztem során. A legfontosabb dolog, amit szeretek benne, hogy nincs rajta rengeteg hirdetés mindenhol, ami általában így van az ilyen niche szolgáltató oldalakon.

ingyenes online ocr

A kezdéshez válassza ki a fájlt, és várja meg, amíg a feltöltés befejeződik. A webhely maximális feltöltési mérete 100 MB. Ha ingyenes fiókot regisztrál, néhány extra szolgáltatást kap, például nagyobb feltöltési méretet, többoldalas PDF(PDFs) -eket , különböző beviteli nyelveket, több óránkénti konverziót stb.

Ezután válassza ki a beviteli nyelvet, majd válassza ki a kimeneti formátumot. Választhat a Word , az Excel vagy a Sima szöveg(Plain Text) közül . Kattintson(Click) a Konvertálás(Convert) gombra, és a szöveg alján megjelenik egy mezőben, a letöltési hivatkozással együtt.

ocr kimenet

Ha csak a szövegre van szüksége, másolja ki és illessze be a dobozból. Azt javaslom azonban, hogy töltse le a Word dokumentumot, mert meglepően nagyszerű munkát végez az eredeti dokumentum elrendezésének megőrzésében.

Például amikor megnyitottam a Word -dokumentumot a második tesztemhez, meglepődve tapasztaltam, hogy a dokumentum három oszlopos táblázatot tartalmaz, akárcsak a képen.

online ocr kimenet

Az összes oldal közül messze ez volt a legjobb. Teljesen megéri regisztrálni, ha sok konverziót kell végrehajtania.

A teljesség kedvéért linkelni fogok az egyes szolgáltatások által létrehozott kimeneti fájlokhoz is, így Ön is láthatja az eredményeket. Itt vannak az OnlineOCR eredményei: Test1 Doc (OnlineOCR)és Test2 Doc .

Vegye figyelembe, hogy amikor megnyitja ezeket a Word -dokumentumokat a számítógépén, egy üzenet jelenik meg a Wordben(Word) arról, hogy az internetről(Internet) származik , és a szerkesztés le van tiltva. Ez teljesen rendben van, mert a Word nem bízik meg az internetről(Internet) származó dokumentumokban, és valóban nem kell engedélyeznie a szerkesztést, ha csak meg szeretné tekinteni a dokumentumot.

i2OCR

Egy másik oldal, amely nagyon jó eredményeket hozott, az i2OCR volt . A folyamat nagyon hasonló: válassza ki a nyelvet, a fájlt, majd nyomja meg a Szöveg kibontása(Extract Text) gombot .

i2ocr

Itt várnia kell egy-két percet, mert ez az oldal kicsit tovább tart. Ezenkívül a 2. lépésben(Step 2) győződjön meg arról, hogy a kép jobb oldala felfelé jelenik meg az előnézetben, különben egy csomó halandzsa lesz a kimenete. Valamilyen oknál fogva az iPhone-omról származó képek álló módban jelentek meg a számítógépemen, de fekvő módban, amikor feltöltöttem erre az oldalra.

i2ocr kimenet

Kézzel kellett megnyitnom a képet egy fotószerkesztő alkalmazásban, el kell forgatnom 90 fokkal, majd visszaforgatni álló helyzetbe, majd újra elmenteni. Ha(Once) elkészült, görgessen lefelé, és megjelenik a szöveg előnézete, valamint a letöltés gomb.

Ez a webhely elég jól teljesített az első teszt kimenetével, de nem sikerült olyan jól a második teszttel, amely oszlopelrendezést tartalmazott. Itt vannak az i2OCR eredményei: Test1 Doc és Test2 Doc .

FreeOCR

A Free-OCR.com elkészíti(Free-OCR.com) a képeket, és egyszerű szöveggé konvertálja azokat. Nincs lehetősége Word formátumba exportálni. Válassza ki a fájlt, válasszon nyelvet, majd kattintson a Start gombra(Start) .

Az oldal gyors, és elég gyorsan megkapja a kimenetet. Csak(Just) kattintson a hivatkozásra, hogy letöltse a szöveges fájlt a számítógépére.

freeocr

Az alább említett NewOCR -hez hasonlóan ez az oldal is nagybetűvel ír a dokumentumban szereplő összes T betűvel. Fogalmam sincs, miért tenné ezt, de valami furcsa okból ez az oldal és a NewOCR is ezt tette. Nem nagy dolog megváltoztatni, de ez egy fárasztó folyamat, amit tényleg nem kellene megtenned.

Itt vannak a FreeOCR eredményei: Test1 Doc és Test2 Doc .

ABBYY FineReader Online

A FineReader Online használatához regisztrálnia kell egy fiókot, amely 15 napos ingyenes próbaidőszakot biztosít az OCR - hez, legfeljebb 10 oldalig. Ha csak néhány oldalra van szüksége egyszeri OCR - re, akkor ezt a szolgáltatást használhatja. Győződjön(Make) meg arról, hogy a regisztrációt követően kattintson a visszaigazoló e-mailben található megerősítő linkre.

finereader online

Kattintson a Felismerés(Recognize) lehetőségre felül, majd kattintson a Feltöltés(Upload) gombra a fájl kiválasztásához. Válassza ki a nyelvet, a kimeneti formátumot, majd kattintson a Felismerés(Recognize) gombra alul. Ez az oldal tiszta felülettel rendelkezik, és nincsenek hirdetések.

A tesztjeim során ez az oldal képes volt megragadni az első tesztdokumentum szövegét, de ez teljesen hatalmas volt, amikor megnyitottam a Word -dokumentumot, így végül megcsináltam, és a Sima szöveget(Plain Text) választottam kimeneti formátumként.

Az oszlopokkal végzett második tesztnél a Word dokumentum üres volt, és nem is találtam a szöveget. Nem tudom, mi történt ott, de úgy tűnik, az egyszerű bekezdéseken kívül mást nem tud kezelni. Íme a FineReader eredményei: Test1 Doc és Test2 Doc .

ÚjOCR

A következő webhely, a NewOCR.com rendben volt, de közel sem olyan jó, mint az első webhely. Először is vannak benne hirdetések, de szerencsére nem egy csomó. Először válassza ki a fájlt, majd kattintson az Előnézet(Preview) gombra.

kép feltöltése

Ezután elforgathatja a képet, és beállíthatja azt a területet, ahol szöveget szeretne beolvasni. Ez nagyjából olyan, mint a szkennelési folyamat egy csatlakoztatott szkennerrel rendelkező számítógépen.

ocr kép

Ha a dokumentum több oszlopból áll, akkor ellenőrizze az Oldalelrendezés elemzése( Page layout analysis) gombot, és megpróbálja oszlopokra bontani a szöveget. Kattintson(Click) az OCR gombra, várjon néhány másodpercet, amíg befejeződik, majd görgessen le az oldal aljára, amikor az oldal frissül.

Az első tesztben minden szöveget helyesen kapott, de valamiért minden T-t nagybetűvel írt a dokumentumban! Fogalmam sincs, miért tenné ezt, de megtette. A második tesztben az oldalelemzés bekapcsolásával megkapta a szöveg nagy részét, de az elrendezés teljesen ki volt kapcsolva.

Itt vannak a NewOCR eredményei: Test1 Doc  és Test2 Doc .

Következtetés

Amint látja, az ingyenes sajnos legtöbbször nem ad túl jó eredményeket. Az elsőként említett webhely messze a legjobb, mert nem csak az összes szöveg felismerésében végzett nagyszerű munkát, hanem az eredeti dokumentum formátumát is meg tudta őrizni.

Ha azonban csak szövegre van szüksége, a fenti webhelyek többsége megteheti ezt helyette. Ha kérdése van, nyugodtan írjon megjegyzést. Élvezd!



About the author

Számítógépes technikus vagyok, és több mint 10 éves tapasztalattal rendelkezem ezen a területen. Szakterületem a Windows 7 és a Windows Apps fejlesztése, valamint a Cool Websites tervezése. Rendkívül járatos és tapasztalt vagyok ezen a területen, és értékes eszköz lennék minden olyan szervezet számára, amely vállalkozását bővíteni szeretné.



Related posts