Apache-gris

Forfatter: Robert Simon
Oprettelsesdato: 16 Juni 2021
Opdateringsdato: 13 Kan 2024
Anonim
el Original Azteca HD part.1 de 2
Video.: el Original Azteca HD part.1 de 2

Indhold

Definition - Hvad betyder Apache Pig?

Apache Pig er en platform, der bruges til at analysere store datasæt. Det består af et sprog på højt niveau til at udtrykke dataanalyseprogrammer sammen med infrastrukturen til evaluering af disse programmer. Et af de mest markante træk ved svin er, at dens struktur reagerer på betydelig parallelisering.


Grisen opererer på Hadoop-platformen, skriver data til og læser data fra Hadoop Distribueret filsystem (HDFS) og udfører behandling ved hjælp af et eller flere MapReduce-job. Apache Pig er tilgængelig som open source.

Apache Pig er også kendt som Pig Programming Language eller Hadoop Pig.

En introduktion til Microsoft Azure og Microsoft Cloud | Gennem hele denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer Apache Pig

Apache Pig har to dele: Latin-sprog og svin-motor. Pig Latin-sproget er et scriptingsprog, der giver brugerne mulighed for at illustrere den måde, hvorpå dataflyt fra en eller flere input skal læses og behandles, og det sted, hvori der skal gemmes.

Nogle af de vigtigste egenskaber ved Gris Latin er som følger:


  • Let at programmere: Intrikate opgaver, der består af forskellige indbyrdes forbundne datatransformationer, kodes tydeligt som datastrømsekvenser. Dette gør dem enkle at skrive, forstå og vedligeholde.
  • Optimeringsmuligheder: Den måde, hvorpå opgaverne kodes, giver systemet mulighed for at optimere automatisk udførelse. Dette giver brugeren mulighed for at være opmærksom på semantik i stedet for effektivitet.
  • Udvidbarhed: Brugere har lov til at oprette deres egne funktioner til udførelse af specialformål. Svinmotoren er ansvarlig for udførelsen af ​​dataflow skrevet på svin-latin. Ligesom et standard-relationelt databasestyringssystem (RDBMS) design, består Apache Pig af en parser, optimizer og typechecker, ud over operatører, der udfører databehandling. Gris inkluderer ikke transaktioner, et datakatalog eller muligheden for direkte at håndtere datalagring eller anvende udførelsesrammer.