Pdfgrep -kommandoer for å søke i PDF -filer Linux Terminal

Operativsystemene er basert på kommandolinjer som gir oss flere alternativer for å øke distribusjonsmulighetene ved å kunne utføre søk, administrasjonshandlinger, støtte og mye mer.

Nettopp et av disse alternativene er knyttet til muligheten for å søke etter bestemte filtyper i Linux og dermed lett få tilgang til innholdet, og det er derfor vi i dag vil snakke om pdfgrep som er fokusert på å søke etter PDF -filer.

Hva er pdfgrepPdfgrep er et kommandolinjeverktøy for å søke etter tekst i PDF -filer på en enkel og funksjonell måte, noe som sparer oss tid for å få tilgang til hver fil og søke etter teksten med PDF -verktøy.
Noen av egenskapene er:

  • Kompatibel med Grep, vi kan utføre mange grep -parametere som -r, -i, -n eller -c.
  • Evne til å søke etter tekst i flere PDF -filer
  • Utvalgte farger, dette GNU Grep -fargevalget støttes og aktiveres som standard.
  • Støtter bruk av vanlige uttrykk.
  • Gratis programvare

1. Installer Pdfgrep på Linux

Trinn 1
I dette tilfellet vil vi bruke Ubuntu som det er nok til å utføre følgende linje. Der skriver vi inn bokstaven S for å godta nedlasting og installasjon av pakkene.

 sudo apt installer pdfgrep

Steg 2
Andre installasjonsalternativer er:

  • Last ned .TAR.GZ -filen på følgende lenke.

Trinn 3

  • Eller kjør følgende kommando:
 git -klon https://gitlab.com/pdfgrep/pdfgrep.git
Trinn 4
Skriv deretter inn hver av følgende linjer i rekkefølgen:
 ./configure gjør sudo make install

2. Bruk Pdfgrep på Linux

Trinn 1
Når pdfgrep er installert, vil dette være syntaksen som skal brukes:

 pdfgrep [OPTION…] MØNSTER [FIL]
Steg 2
Hvert av elementene er:
  • Alternativ: Angir attributtene vi kan legge til i søket, for eksempel -Jeg eller --ignore-case, som ignorerer skillet mellom store og små bokstaver mellom mønsteret vi har angitt og det som må matche filen.
  • Mønster: Angir et utvidet regulært uttrykk.
  • Fil: Det er PDF -filen der søket må utføres.

Trinn 3
Vi starter med et enkelt søk, for eksempel vil vi lete etter ordet Solvetic i Solvetic.pdf -filen, for dette utfører vi følgende:

 pdfgrep Solvetic Solvetic.pdf

FORSTØRRE

Trinn 4
I dette tilfellet eksisterer dette begrepet bare en gang i filen, men nå vil vi se etter begrepet Windows i en offisiell Microsoft PDF -fil, og dette vil være resultatet som vi vil se:

FORSTØRRE

Trinn 5
Vi kan se at det søkte ordet er uthevet, noe som letter plasseringen. Nå, hvis vi legger til parameteren -i, Det vil være mulig å se resultatene med sidetallet der dette begrepet er oppdaget:

FORSTØRRE

Trinn 6
Et annet alternativ som vi kan bruke med pdfgrep er å liste opp PDF -filen (e) som inneholder et bestemt begrep, for dette utfører vi følgende:

 pdfgrep Solvetic * pdf
Trinn 7
På denne måten vil PDF -filen som inneholder begrepet Solvetic bli oppført:

FORSTØRRE

Trinn 8
Hvis vi vil åpne PDF -filen, kan vi utføre følgende kommando:

 xdg-open (File.PDF)

FORSTØRRE

Trinn 9
De generelle alternativene som pdfgrep tilbyr oss er:

-i, --ignore-caseIgnorer skilletegn mellom store og små bokstaver i både kilde- og inndatafiler.

-F, --fixed-stringsTolker MØNSTER som en liste over faste strenger atskilt med nye linjer.

--bufferBruk en hurtigbuffer for gjengitt tekst for å fremskynde driften på store filer.

-P, --perl-regexpTolker PATTERN som et Perl-kompatibelt regulært uttrykk (PCRE).

-H, --med filnavnSkriv ut filnavnet for hver kamp.

-h, --no-filnavnUndertrykker filnavnprefikset i utgangen.

-n, --sidnummerPrefiks hver kamp med nummeret på siden der søkeordet ble funnet.

-c, --tellingUndertrykker normal utskrift og skriver ut antall treff for hver inndatafil i stedet.

-p, --sideantallSkriv ut antall treff per side. Det innebærer -n.

--FargeDet gjør det mulig å markere filnavn, sidetall og matchende tekst med forskjellige sekvenser for å vise dem i farger i terminalen. Noen av alternativene er Alltid, nakke eller automatisk.

-o,-bare matchendeSkriv ut bare den matchende delen av en linje uten kontekst rundt.

-r, --rekursivDen lar oss rekursivt søke etter alle filer (begrenset av --include og --exclude) under hver katalog, bare ved å følge de symbolske koblingene hvis de er på kommandolinjen.

-R,-rekursiv-referanseSamme som -r, men følger alle symbolske lenker.

-stille eller -qDet lar oss avslutte programmet.

Med denne pdfgrep blir en ideell løsning når du arbeider med PDF -filer i Linux -miljøer.

Du vil bidra til utvikling av området, dele siden med vennene dine

wave wave wave wave wave