Logo nl.boatexistence.com

Heeft parketbestand een schema?

Inhoudsopgave:

Heeft parketbestand een schema?
Heeft parketbestand een schema?

Video: Heeft parketbestand een schema?

Video: Heeft parketbestand een schema?
Video: What is Apache Parquet file? 2024, Mei
Anonim

Parquet-bestand is een hdfs-bestand dat de metadata voor het bestand moet bevatten. Dit maakt het splitsen van kolommen in meerdere bestanden mogelijk, evenals het hebben van een enkel metadatabestand dat verwijst naar meerdere parketbestanden. De metagegevens omvatten het schema voor de gegevens die zijn opgeslagen in het bestand.

Hoe maak ik een schema voor een parketbestand?

Ga als volgt te werk om het schema van de parketvoorbeeldgegevens te genereren:

  1. Log in op de Haddop/Hive-box.
  2. Het genereert het schema in de stdout als volgt: -------------- [~] parket-tools schema abc.parquet. bericht hive_schema { …
  3. Kopieer dit schema naar een bestand met. parket/. par extensie.

Ondersteunt parket de evolutie van het schema?

Schema Merging

Net als Protocol Buffer, Avro en Thrift, Parquet ondersteunt ook schema-evolutie Gebruikers kunnen beginnen met een eenvoudig schema en geleidelijk meer kolommen toevoegen aan het schema indien nodig. Op deze manier kunnen gebruikers meerdere Parquet-bestanden krijgen met verschillende maar onderling compatibele schema's.

Hebben parketbestanden datatypes?

Parquet-bestandsgegevenstypen verwijzen naar transformatiegegevenstypen die de Data Integration Service gebruikt om gegevens over verschillende platforms te verplaatsen. Het Parquet-schema dat u opgeeft om een Parquet-bestand te lezen of te schrijven, moet kleiner zijn.

Wat is de structuur van het parketbestand?

Parketbestanden zijn samengesteld uit rijgroepen, kop- en voettekst Elke rijgroep bevat gegevens uit dezelfde kolommen. Dezelfde kolommen worden samen opgeslagen in elke rijgroep: deze structuur is goed geoptimaliseerd voor zowel snelle queryprestaties als lage I/O (het minimaliseren van de hoeveelheid gescande gegevens).

Aanbevolen: