Kod: EAS-016
Czas trwania: 8 godzin
Czas trwania: 8 godzin
Opis szkolenia
Szkolenie to jest skierowane do programistów i obejmuje pełen zestaw funkcji technicznych, architektury i dostrajania wydajności. Apache Hive obsługuje analizę dużych zestawów danych przechowywanych w systemie plików HDFS i zgodnych systemach plików Hadoop i zapewnia język podobny do języka SQL ze schematem w trybie odczytu i przezroczystym konwertowaniem zapytań na mapę/redukcję. Inne funkcje gałęzi to:- Indeksowanie w celu zapewnienia przyspieszenia
- Różne typy pamięci masowej, takie jak zwykły tekst, RCFile, HBase, ORC i inne.
- Przechowywanie metadanych w RDBMS
- Obsługa skompresowanych danych przechowywanych w ekosystemie Hadoop
- Wbudowane funkcje zdefiniowane przez użytkownika (UDF) do manipulowania datami, łańcuchami i innymi narzędziami do eksploracji danych
- Kwerendy podobne do SQL (HiveQL), które są niejawnie konwertowane na MapReduce
Plan szkolenia
- Co to jest Hive
- Architektura
- Opcje autoryzacji Hive
- Transakcje
- Kwestie "Select"
- DML/Eksport/Import
- Typy Hive UDF
- Indeksy
- Windowing i funkcje analityczne
- Podnoszenie wydajności
Cele
- Rozwijanie wiedzy w obszarze Big Data
- Projektowanie modalne danych w Hive
- Opracowywanie skryptów HSQL
- Praktyczne doświadczenie w zapytaniach HSQL i podnoszeniu wydajności
Grupa docelowa
- Programiści
- Inżynierowie QA
- Analitycy
Wymagania
- Podstawy Hadoop
- ANSI SQL 92