Operativsystemene er basert på kommandolinjer som gir oss flere alternativer for å øke distribusjonsmulighetene ved å kunne utføre søk, administrasjonshandlinger, støtte og mye mer.
Nettopp et av disse alternativene er knyttet til muligheten for å søke etter bestemte filtyper i Linux og dermed lett få tilgang til innholdet, og det er derfor vi i dag vil snakke om pdfgrep som er fokusert på å søke etter PDF -filer.
Hva er pdfgrepPdfgrep er et kommandolinjeverktøy for å søke etter tekst i PDF -filer på en enkel og funksjonell måte, noe som sparer oss tid for å få tilgang til hver fil og søke etter teksten med PDF -verktøy.
Noen av egenskapene er:
- Kompatibel med Grep, vi kan utføre mange grep -parametere som -r, -i, -n eller -c.
- Evne til å søke etter tekst i flere PDF -filer
- Utvalgte farger, dette GNU Grep -fargevalget støttes og aktiveres som standard.
- Støtter bruk av vanlige uttrykk.
- Gratis programvare
1. Installer Pdfgrep på Linux
Trinn 1
I dette tilfellet vil vi bruke Ubuntu som det er nok til å utføre følgende linje. Der skriver vi inn bokstaven S for å godta nedlasting og installasjon av pakkene.
sudo apt installer pdfgrep
Steg 2
Andre installasjonsalternativer er:
- Last ned .TAR.GZ -filen på følgende lenke.
Trinn 3
- Eller kjør følgende kommando:
git -klon https://gitlab.com/pdfgrep/pdfgrep.gitTrinn 4
Skriv deretter inn hver av følgende linjer i rekkefølgen:
./configure gjør sudo make install
2. Bruk Pdfgrep på Linux
Trinn 1
Når pdfgrep er installert, vil dette være syntaksen som skal brukes:
pdfgrep [OPTION…] MØNSTER [FIL]Steg 2
Hvert av elementene er:
- Alternativ: Angir attributtene vi kan legge til i søket, for eksempel -Jeg eller --ignore-case, som ignorerer skillet mellom store og små bokstaver mellom mønsteret vi har angitt og det som må matche filen.
- Mønster: Angir et utvidet regulært uttrykk.
- Fil: Det er PDF -filen der søket må utføres.
Trinn 3
Vi starter med et enkelt søk, for eksempel vil vi lete etter ordet Solvetic i Solvetic.pdf -filen, for dette utfører vi følgende:
pdfgrep Solvetic Solvetic.pdf
FORSTØRRE
Trinn 4
I dette tilfellet eksisterer dette begrepet bare en gang i filen, men nå vil vi se etter begrepet Windows i en offisiell Microsoft PDF -fil, og dette vil være resultatet som vi vil se:
FORSTØRRE
Trinn 5
Vi kan se at det søkte ordet er uthevet, noe som letter plasseringen. Nå, hvis vi legger til parameteren -i, Det vil være mulig å se resultatene med sidetallet der dette begrepet er oppdaget:
FORSTØRRE
Trinn 6
Et annet alternativ som vi kan bruke med pdfgrep er å liste opp PDF -filen (e) som inneholder et bestemt begrep, for dette utfører vi følgende:
pdfgrep Solvetic * pdfTrinn 7
På denne måten vil PDF -filen som inneholder begrepet Solvetic bli oppført:
FORSTØRRE
Trinn 8
Hvis vi vil åpne PDF -filen, kan vi utføre følgende kommando:
xdg-open (File.PDF)
FORSTØRRE
Trinn 9
De generelle alternativene som pdfgrep tilbyr oss er:
-i, --ignore-caseIgnorer skilletegn mellom store og små bokstaver i både kilde- og inndatafiler.
-F, --fixed-stringsTolker MØNSTER som en liste over faste strenger atskilt med nye linjer.
--bufferBruk en hurtigbuffer for gjengitt tekst for å fremskynde driften på store filer.
-P, --perl-regexpTolker PATTERN som et Perl-kompatibelt regulært uttrykk (PCRE).
-H, --med filnavnSkriv ut filnavnet for hver kamp.
-h, --no-filnavnUndertrykker filnavnprefikset i utgangen.
-n, --sidnummerPrefiks hver kamp med nummeret på siden der søkeordet ble funnet.
-c, --tellingUndertrykker normal utskrift og skriver ut antall treff for hver inndatafil i stedet.
-p, --sideantallSkriv ut antall treff per side. Det innebærer -n.
--FargeDet gjør det mulig å markere filnavn, sidetall og matchende tekst med forskjellige sekvenser for å vise dem i farger i terminalen. Noen av alternativene er Alltid, nakke eller automatisk.
-o,-bare matchendeSkriv ut bare den matchende delen av en linje uten kontekst rundt.
-r, --rekursivDen lar oss rekursivt søke etter alle filer (begrenset av --include og --exclude) under hver katalog, bare ved å følge de symbolske koblingene hvis de er på kommandolinjen.
-R,-rekursiv-referanseSamme som -r, men følger alle symbolske lenker.
-stille eller -qDet lar oss avslutte programmet.
Med denne pdfgrep blir en ideell løsning når du arbeider med PDF -filer i Linux -miljøer.