Kod: EAS-019
Czas trwania: 8 godzin
Czas trwania: 8 godzin
Opis szkolenia
Jest to szkolenie na temat Impala dla programistów obejmujące pełen zestaw funkcji technicznych, architektury i dostrajania wydajności. Impala obsługuje analizę dużych zbiorów danych przechowywanych w HDFS i zgodnych systemach plików, dostarczając język podobny do SQL. Inne funkcje Impala to:- Indeksowanie w celu zapewnienia przyśpieszenia
- Różne typy pamięci masowej, takie jak zwykły tekst, RCFile, HBase, ORC i inne.
- Przechowywanie metadanych w RDBMS
- Obsługa skompresowanych danych przechowywanych w ekosystemie Hadoop
- Zapytania podobne do SQL
Plan szkolenia
- Co to jest Impala
- Architektura
- Usługi Impala
- Impala DDL
- Typy Danych
- Kwestie "Select"
- DML/Load data
- Typy Hive UDF
- Indeksy
- Podnoszenie wydajności
- Hive vs Impala
Cele
- Rozwijanie wiedzy w obszarze Big Data
- Projektowanie modalne danych w Impala
- Opracowywanie skryptów SQL
- Praktyczne doświadczenie w zapytaniach i podnoszeniu wydajności
Grupa docelowa
- Programiści
- Inżynierowie QA
- Analitycy
Wymagania
- Podstawy Hadoop
- ANSI SQL 92