Az igazán nagy szöveg- és CSV-fájlok megnyitása

Az MS Excel(MS Excel) 1 048 576 sort képes megjeleníteni. Noha ez normál használat mellett nagyon nagy számnak tűnhet, számos forgatókönyv létezik, amikor ez nem elég.

Akár naplófájlokat, akár nagy adathalmazokat néz, könnyen találkozhat milliónyi sort tartalmazó CSV -fájlokkal vagy hatalmas szövegfájlokkal. Mivel az Excel nem tudja támogatni az ekkora fájlokat, pontosan hogyan kell megnyitni őket? Találjuk ki.

Miért nem nyitnak meg a normál szövegszerkesztők (Normal Text Editors)igazán nagy fájlokat(Open Really Large Files) ?

Egy számítógép gigabájt tárhellyel rendelkezik, tehát miért nem tudnak a szövegszerkesztők megnyitni a nagy fájlokat?

Itt két tényező játszik szerepet. Egyes alkalmazások szigorúan kódolt korláttal rendelkeznek arra vonatkozóan, hogy mennyi adatot jeleníthetnek meg. Nem számít, mennyi memóriája van a számítógépének, egyszerűen nem fogják használni.

A második probléma a RAM . Sok szövegszerkesztőnek nincs szigorú korlátja a sorok számára, de a memória korlátai miatt nem tud nagy fájlokat megjeleníteni. A teljes fájlt betöltik a rendszer RAM -jába , így ha ez a memória nem elég nagy, a folyamat meghiúsul.

1. módszer: Ingyenes szerkesztők használata

A rendkívül nagy szövegfájlok megtekintésének legjobb módja egy szövegszerkesztő használata. Nem akármilyen szövegszerkesztő, hanem a kódírásra szolgáló eszközök. Az ilyen alkalmazások általában gond nélkül kezelik a nagy fájlokat, és ingyenesek.

A Large Text File Viewer(Large Text File Viewer) valószínűleg a legegyszerűbb ezek közül az alkalmazások közül. Használata nagyon egyszerű, gyorsan működik és nagyon alacsony erőforrásigényű. Az egyetlen hátránya? Nem tudja szerkeszteni a fájlokat. De ha csak nagy CSV -fájlokat szeretne megtekinteni, ez a legjobb eszköz a munkához.

Nagyméretű szöveges fájlok szerkesztéséhez is érdemes az Emacs programot kipróbálni . Eredetileg Unix rendszerekre készült, (Unix)Windowson(Windows) is tökéletesen működik , és nagy fájlokat is tud kezelni. Hasonlóképpen, a Neovim és a Sublime Text két könnyű IDE(IDEs) , amelyek segítségével gigabájt méretű CSV szövegfájlokat lehet megnyitni.

Ha csak nagy naplófájlokon keresztül keres adatokat, akkor a klogg az Ön számára megfelelő eszköz. A népszerű glogg frissítő ága , ez az alkalmazás lehetővé teszi, hogy könnyedén végezzen összetett keresési műveleteket hatalmas szöveges fájlokon keresztül. Mivel a számítógéppel generált naplófájlok gyakran több millió sort is tartalmazhatnak, a klogg úgy lett kialakítva, hogy probléma nélkül működjön ilyen méretű fájlokkal.

2. módszer(Method) : Felosztás több részre(Into Multiple Parts)

Az egész probléma a nagy CSV(CSV) -fájlok megnyitásával az, hogy túl nagyok. De mi lenne, ha ezeket több kisebb fájlra osztaná fel?

Ez egy népszerű megoldás, mivel általában nem kell megtanulni egy új szövegszerkesztő felületét. Ehelyett használhatja az online elérhető számos CSV-elosztó egyikét,(one of the many CSV splitters available online) hogy a nagy fájlokat számos könnyen megnyitható fájlra bontsa. Ezek a fájlok ezután normál módon elérhetők.

Ez azonban nem a legjobb módja ennek. Egy nagy fájl felosztása gyakran furcsa elírási hibákhoz vagy helytelenül konfigurált fájlokhoz vezethet. Ezenkívül az egyes darabok külön-külön történő megnyitása megakadályozza, hogy egyszerre szűrje át a teljes adatot.

3. módszer: Importálás adatbázisba

A több gigabájtig terjedő szöveges és .csv fájlok általában nagy adathalmazok. Miért nem importálhatja őket egy adatbázisba?

Az SQL(SQL) a manapság leggyakrabban használt adatbázis-leíró nyelv. Az SQL-nek számos verziója(many versions of SQL) van használatban, de a legegyszerűbb valószínűleg a MySQL . Szerencsére pedig lehetőség van egy CSV-fájlt MySQL-táblává alakítani(convert a CSV file into a MySQL table) .

Ez egyáltalán nem a legegyszerűbb módja a nagy CSV -fájlok kezelésének, ezért ezt csak akkor ajánljuk, ha rendszeresen szeretne nagy adatkészletekkel foglalkozni. Ha a MySQL túl keménynek hangzik, mindig importálhatja .csv fájljait az MS Accessbe(MS Access) .

4. módszer(Method) : Elemzés Python könyvtárakkal

Ha több millió adatsort tartalmazó .csv fájllal dolgozik, nyilvánvalóan nem lesz képes kézzelfoghatóan értelmezni. Valószínűleg szűrni szeretné az adatokat, és konkrét lekérdezéseket szeretne futtatni a trendek megértése érdekében.

Tehát miért nem ír Python kódot(write Python code) , hogy ezt megtegye?

Még egyszer mondom, nem ez a legfelhasználóbarátabb módszer. Bár a Python nem a legnehezebben elsajátítható programozási nyelv,(Python isn’t the hardest programming language to learn) kódolás, ezért lehet, hogy nem ez a legjobb megközelítés az Ön számára. Ennek ellenére, ha úgy találja, hogy naponta nagyon nagy CSV -fájlokat kell elemeznie, érdemes lehet (CSV)automatizálnia a feladatot valamilyen Python-kóddal(automate the task with some Python code) .

5. módszer: Prémium eszközökkel

Az első módszernél látott szövegszerkesztők nem CSV(CSV) -feldolgozásra szánt eszközök voltak . Általános célú eszközök voltak, amelyekkel nagy .csv fájlokkal is lehetett dolgozni.

De mi a helyzet a speciális alkalmazásokkal? Nincsenek olyan alkalmazások, amelyek ezt a problémát megoldják?

Valójában vannak. A CSV Explorer(CSV Explorer) például arra a folyamatra épít, amelyet az előző két módszerben ( SQL - adatbázis és Python -kód) leírtunk, és létrehoz egy alkalmazást, amely képes bármilyen méretű CSV -fájlok megtekintésére és szerkesztésére. (CSV)Mindent megtehet, amit egy táblázatkezelő eszköztől elvár, például grafikonokat hozhat létre vagy szűrheti az adatokat a CSV Explorerben(CSV Explorer) .

Egy másik lehetőség az UltraEdit . Az előző eszközzel ellentétben ez nem csak .csv fájlok, hanem bármilyen típusú szövegfájl számára készült. Könnyedén képes kezelni néhány gigabájtig terjedő  szöveges és CSV -fájlokat, a korábban tárgyalt számos ingyenes szerkesztőhöz hasonló felülettel.(CSV)

Ezeknek az eszközöknek az egyetlen hátránya, hogy prémium alkalmazások, amelyek használatához fizetős licenc beszerzése szükséges. Bármikor kipróbálhatja ingyenes próbaverziójukat, hogy megtekinthesse funkcióikat, vagy ha csak egyszeri használatra van lehetőség.

Mi a legjobb módja nagy szöveg-(Large Text) és CSV-fájlok(CSV Files) megnyitásának ?

A Big Data korszakában nem ritka, hogy belefutnak gigabájtos szövegfájlokba, amelyeket még a beépített eszközök, például a Jegyzettömb(Notepad) vagy az MS Excel megtekintése is nehéz lehet . Az ilyen nagy CSV -fájlok megnyitásához le kell töltenie és használnia kell egy harmadik féltől származó alkalmazást.

Ha csak ilyen fájlokat szeretne megtekinteni, akkor a Large Text File Viewer a legjobb választás az Ön számára. A tényleges szerkesztéshez kipróbálhat egy funkciókban gazdag szövegszerkesztőt, például az Emacs -t, vagy használhat egy prémium eszközt, például a CSV Explorert(CSV Explorer) .

Az olyan technikák, mint a CSV -fájl felosztása vagy adatbázisba importálása, túl sok lépést igényelnek. Jobb, ha fizetős licencet szerez egy dedikált prémium eszközhöz, ha sokat dolgozik hatalmas szöveges fájlokkal.



About the author

Számítástechnikai szakértő vagyok, több mint 10 éves tapasztalattal, és arra specializálódtam, hogy segítsek az embereknek az irodájukban lévő számítógépeik kezelésében. Cikkeket írtam olyan témákban, mint az internetkapcsolat optimalizálása, a számítógép beállítása a legjobb játékélmény érdekében stb. Ha bármiben szeretnél segítséget kérni munkáddal vagy magánéleteddel kapcsolatban, én vagyok a megfelelő személy!



Related posts