Databaser er et grunnleggende element når du arbeider med store datamengder takket være deres dynamikk, hierarki, parameterinnstillinger og enkel administrasjon.
I dag har vi muligheten til å velge forskjellige databaser som MySQL, MariaDB, etc., og hver har sine fordeler og innstillinger basert på antall brukere og parametere som skal fungere, men i dag vil vi snakke om en spesielt kalt Cassandra la som kan være veldig nyttig når du arbeider med en database, og for dette vil vi bruke CentOS 7.
Hva er CassandraCassandra er en åpen kildekode -database designet for skalerbarhet og høy tilgjengelighet uten at det går ut over systemytelsen.
Cassandra har faktorer som lineær skalerbarhet og feiltoleranse i grunnleggende maskinvare eller skyinfrastruktur som gjør den til den perfekte plattformen for misjonskritiske data. Cassandras støtte for replikering på tvers av flere datasentre er best i klassen, noe som sikrer lavere ventetid for brukerne samtidig som det generelle ytelsesnivået forbedres.
Cassandra er en database som støtter lokal replikering og replikering av flere datasenter for redundans, failover og katastrofegjenoppretting.
Har CassandraNoen av egenskapene er:
- Tilgjengelighet: Cassandra -databasen er anerkjent for sin pålitelighet til det punktet at den brukes av mer enn 1000 selskaper over hele verden, blant hvilke vi kan markere Instagram, GitHub, Netflix, som vi kan bruke Cassandra med full tillit.
- Feiltoleranse: Et kritisk punkt i en hvilken som helst database er tilgjengeligheten av informasjonen, og i dette aspektet har Cassandra en stor feiltoleranse, der vi alle utsettes for å lide, ved å la alle dataene som er lagret i den ha muligheten til å bli automatisk replikert i andre noder, og garanterer både deres integritet og tilgjengelighet. I tillegg, når en node viser en eller annen type feil, kan den byttes ut uten å måtte slå av databasen, noe som påvirker brukerens driftbarhet og produktivitet.
- Ytelse: Et punkt til fordel for Cassandra er dens høye ytelse som gjør det mulig å gå til et høyere nivå enn NoSQL -plattformene som allerede er kjent både på administrasjons- og applikasjonsnivå.
- Desentralisert: En annen funksjon som skiller seg ut i Cassandra er dens desentraliserte administrasjon, takket være at hver node som er involvert i databasen er unik, og dermed unngår massive feil.
- Skalerbar: Et poeng å vurdere i en database er dens skalerbarhetskapasitet siden dette tillater at etter hvert som selskapet vokser, er databasen ikke begrenset i handlingen, derfor er Cassandra et av de beste alternativene Siden det ifølge statistikken har kapasitet til å støtte opptil mer enn 2000 noder, mer enn 400 TB data og rundt 1 milliard eller mer forespørsler hver dag, noe som sikrer bred rekkevidde.
- Holdbar: Et annet aspekt å ta i betraktning når du velger databasen å jobbe med, er dens holdbarhetskapasitet, dette innebærer at databasen må ha muligheten til å la kritiske data alltid forbli tilgjengelige uavhengig av type feil. Dette oppstår, dette garanterer optimal og korrekt håndtering av hver data som er lagret der.
- Kontrollalternativer: Med Cassandra -databasen har vi forskjellige administrasjonsalternativer, for eksempel synkron eller asynkron replikering, hvis vi bruker det asynkrone administrasjonsalternativet, vil vi ha en database som støtter tilleggsfunksjoner som Hinted Handoff og Read Repair for å utvide brukervennligheten.
1. Oppdater systemet og installer Java på CentOS 7
Trinn 1
Det første trinnet å ta er å oppdatere operativsystemet, dette kan gjøres ved å utføre følgende kommando:
sudo yum oppdatering -ySteg 2
Cassandra er skrevet i Java, så det vil være nødvendig å installere Java på CentOS 7 ved å utføre følgende kommando:
sudo yum install java -y
Trinn 3
Vi kan kontrollere den installerte Java -versjonen ved å utføre følgende kommando:
sudo java -versjon
2. Installer Cassandra på CentOS 7
Trinn 1
Som standard er Cassandra -databasen ikke tilgjengelig i standardlageret til CentOS 7 av denne grunn, det vil være nødvendig å legge til de offisielle Apache Software Foundation -depotene til CentOS 7, og dette oppnås ved å opprette filen cassandra.repo inne i katalogen /etc/yum.repos.d som følger:
sudo nano /etc/yum.repos.d/cassandra.repoSteg 2
I denne nyopprettede filen vil vi legge til følgende:
[cassandra] name = DataStax Repo for Apache Cassandra baseurl = http://rpm.datastax.com/community enabled = 1 gpgcheck = 0
Trinn 3
Vi lagrer endringene ved hjelp av tastekombinasjonen
Ctrl + O.
og vi avslutter redaktøren ved hjelp av tastene
Ctrl + X
Trinn 4
Nå vil det være nødvendig å oppdatere pakkene i depotet ved å utføre følgende:
sudo yum oppdatering -yTrinn 5
Nå kan vi installere Cassandra ved å utføre følgende kommando:
sudo yum installer dsc20 -y
FORSTØRRE
Trinn 6
Når den er lastet ned og installert, ser vi følgende:
FORSTØRRE
Trinn 7
Når Cassandra er installert, fortsetter vi med å utføre følgende kommandoer:
sudo systemctl start cassandra (Start Cassandra -tjenesten) sudo systemctl aktiver cassandra (Aktiver Cassandra -tjenesten ved systemoppstart)
FORSTØRRE
Trinn 8
Til slutt kan vi se statusen til Cassandra ved å utføre følgende kommando:
sudo systemctl status cassandra
FORSTØRRE
3. Koble til og bekreft Cassandra Cluster på CenTOS 7
Trinn 1
På dette tidspunktet fungerer Cassandra, så vi skal verifisere og koble til Cassandra Cluster, for dette skal vi først og fremst kontrollere statusen til Cassandra Cluster med følgende kommando:
sudo nodetool status
Steg 2
Vi kan se at klyngetilkoblingsstatusen er korrekt. På dette tidspunktet ønsker Solvetic å legge til et løsningspunkt fordi mange ganger når denne kommandoen utføres, vises følgende feil:
Feil: Klarte ikke å koble til ‘127.0.0.1:7199’: Tilkobling nektet (Cassandra)Trinn 3
For å løse denne feilen og få tilgang til riktig må vi gå til følgende katalog ved hjelp av ønsket editor:
sudo nano /etc/cassandra/default.conf/cassandra-env.shTrinn 4
Der må vi finne følgende linje:
JVM_OPTS = "$ JVM_OPTS -Djava.rmi.server.hostname =Trinn 5
Utseendet skal være likt følgende tekst:
# legg til dette hvis du har problemer med å koble til: # JVM_OPTS = ”$ JVM_OPTS -Djava.rmi.server.hostname =”Trinn 6
Der må vi fjerne den andre linjen og erstatte den offentlige navnelinjen med IP -adressen 127.0.0.1:
Trinn 7
Vi lagrer endringene ved hjelp av følgende tastekombinasjon:
Ctrl + O.
Vi forlater redaktøren ved hjelp av:
Ctrl + X
Trinn 8
Vi fortsetter å starte tjenesten på nytt ved å utføre følgende:
systemctl starter Cassandra på nyttTrinn 9
I noen tilfeller anbefales det å starte datamaskinen på nytt, på denne måten vil vi rette opp denne feilen.
Nå kan vi koble til Cassandra -klyngen ved å utføre følgende kommando:
cqlsh
Trinn 10
Vi kan se den respektive tilkoblingen for å begynne å jobbe med denne databasen. For å gå ut vil vi bruke begrepet
exitPå denne måten har vi sett hvordan du installerer og får tilgang til Cassandra i CentOS 7.