Kako vizualizirati zapletene podatke v Linuxu

Kazalo:

Anonim

Verjetno ste že slišali za Elasticsearch - iskalnik, ki vam omogoča indeksiranje in nato hitro iskanje po vaših podatkih. Morda ste v Kibani, grafičnem uporabniškem vmesniku za Elasticsearch, ustvarili nekaj vizualizacij, ki kažejo in kličejo skozi eleganten vmesnik.

Morda niste uporabljali manj znanega vtičnika za vizualizacijo, imenovanega Timelion.

Timelion je fantastično orodje za ustvarjanje vizualizacije, ki omogoča zapisovanje vaših poizvedb v preprost in zmogljiv izrazni jezik za prikaz grafov. Uporablja se za prikaz podatkov časovnih vrst, kot so rast prebivalstva ali zadetki na vašem spletnem mestu.

  • Tu je seznam najboljših prenosnikov za razvijalce
  • Preverite te najboljše distribucije za razvijalce
  • Na teh najboljših delovnih postajah enostavno krčite številke
O tem članku

Ta članek je bil prvič objavljen v reviji Linux Format, številka 269, objavljeni novembra 2022-2023.

S programom Timelion lahko izračunamo drseča povprečja, prikažemo razliko med podatki za prejšnji teden in danes ter izvedemo nekaj osnovnih zaznav anomalij. To je koristno orodje, s katerim se zna delati. Začnimo.

Namestitev

Če ste redni bralnik formata Linux, obstajajo primeri za sestavljanje dockerjev za nastavitev gruče v LXF261.

V nasprotnem primeru je namestitev Elasticsearch in Kibana razmeroma preprosta. Edina zahteva je Java, ki ste jo morda že namestili.

Če ga preprost sudo apt install default-jre ne namesti na distribucijske sisteme, ki temeljijo na Debianu, ali naj sudo dnf install java stori enako za družino distrodov Red Hat.

Potem morate samo prenesti najnovejšo različico Elasticsearch in Kibana za želeni okus operacijskega sistema.

V času pisanja najnovejše različice je kibana-7.8.1-linux-x86_64.tar.gz.

Lahko ga izvlečete s tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, spremenite v izvlečeni imenik in zaženete ./bin/kibana &, da sprožite primerek Kibana.

Ko ste naredili popolnoma enake korake za nastavitev Elasticsearch in zamenjali 'kibana' za 'elasticsearch', bi morali imeti možnost, da se v svojem najljubšem brskalniku pomaknete do http: // localhost: 5601 in si ogledate nov bleščeč vmesnik Kibana za predvajanje okrog s.

Če raje nameščate pakete z upraviteljem paketov, ima ista povezava kot prej informacije o dodajanju repozitiva Elastic v vaš sistem in namestitvi paketov Kibana in Elasticsearch na ta način.

Grafe lahko naložite drug na drugega in uporabite oblikovanje, da grafi postanejo najboljši.

Pridobite nekaj podatkov

Najnovejše različice Kibane omogočajo samodejno vnašanje naborov podatkov v našo gručo z orodjem Visualizer za podatke, namesto da bi bilo treba ustvariti skript ali konfiguracijo Logstash. Lahko se ukvarja z nabori podatkov v obliki JSON ali CSV, pa tudi z nekaterimi standardnimi dnevnimi datotekami, kot so dnevniki Apache. Edina omejitev je, da imajo manj kot 100 MB. To je več kot dovolj za naše namene.

Uporabili bomo podatkovni niz primerov Covid-19 po vsem svetu s portala EU Open Data. Datoteko CSV smo prenesli iz razdelka Viri na strani.

Če imate težave, lahko namesto tega prenesete različico Excel .xlsx, odprete jo s programom LibreOffice Calc in jo shranite v obliki besedila CSV (.csv). Za prenos je na voljo tudi različica JSON, ki jo lahko uporabite kot alternativo.

Za dostop do Data Visualizerja v Kibani kliknite ikono hamburgerja zgoraj levo, nato Machine Learning in na koncu Data Visualizer. Ko v polju Uvozi podatke kliknite Naloži datoteko, nato izberite ali povlecite in spustite datoteko in izberite datoteko CSV, ki jo želite vnesti.

Po kratki analizi bo prikazano nekaj statističnih podatkov, ki jih je odkril iz prvih 1000 vrstic datoteke CSV. To bo oblika zapisa, za katero meni, da je vsako od polj, na primer besedilo, datum ali številka, in označi najvišje vrednosti v poljih.

Običajno se dobro znajde, ko to ugotovi za nas. Če ste potrebovali kakršne koli prilagoditve, lahko za spremembo kliknete Preglasi nastavitve - na primer ime polja, kot bo nastavljeno v Elasticsearch.

Eno ime polja, ki bi ga morali preglasiti, je dateRep, ki predstavlja datum izračunane številke v našem naboru podatkov. Timelion ne bo vedel, kako to privzeto uporabiti kot časovno polje, zato si lahko življenje poenostavimo pozneje, tako da ga zdaj preimenujemo v nekaj, kar bo prepoznal.

Dober kandidat je časovni žig. Kliknite Uporabi, da to nastavite. Ko ste zadovoljni z izgledom preostalega dela, na dnu kliknite Uvozi, indeksu poimenujte ime - izbrali smo covid - in nato znova kliknite Uvozi, da podatke prenesete v svojo gručo.