hive-0.9.0 다운로드 | Stal Holthausen

일반적으로 다운로드 폴더에서 다운로드 한 java 파일을 찾을 수 있습니다. 확인 하 고 다음 명령을 사용 하 여 jdk-7u71-linux-x64 파일을 추출 합니다. 이 자습서에서는 hive-0.14.0를 사용 합니다. 다음 링크 http://apache.petsads.us/hive/hive-0.14.0/를 방문 하 여 다운로드할 수 있습니다. 우리가/다운로드 디렉토리에 다운로드 되는 가정 하자. 여기서는이 튜토리얼에서 “apache-hive-0.14.0” 라는 하이브 아카이브를 다운로드 합니다. 다음 명령은 다운로드를 확인 하는 데 사용 됩니다. 시스템에 Hive를 설치 하려면 다음 단계가 필요 합니다. Hive 아카이브가/Pas 디렉토리에 다운로드 되었다고 가정해 봅시다. 다음 명령은 yarn 스크립트를 시작 하는 데 사용 됩니다. 이 명령을 실행 하면 yarn 데몬이 시작 됩니다. .

Tez의 Hive는 비공유 아키텍처입니다. 각 처리 장치는 자체 메모리 및 디스크 리소스와 독립적으로 작동 합니다. LLAP는 작업자 간의 메모리 공유를 허용 하는 다중 스레드 프로세스입니다. 맵 쪽 조인을 사용 하려면 해시 테이블을 각 맵 작업에 1:1으로 분산 해야 합니다. 노드에 24 개의 컨테이너가 있는 경우 해시 테이블의 24 개 복사본을 만들어 배포 해야 합니다. LLAP를 사용 하면 노드당 한 번씩 해시 테이블을 빌드하고 모든 워커에 대해 메모리 내에 캐시 합니다. 이는 지연 시간이 짧은 SQL에 특히 중요 합니다. 이유 3: 완전히 벡터화 된 파이프라인 하이브 2는 동적으로 분할 된 해시 조인을 사용 하 여 감소 측면에서 맵 조인 벡터화를 도입 하며 본질적으로 MapJoin 최적화의 축소 쪽 버전입니다. 이 최적화를 사용 하 여 감속 기 입력을 정렬 하 고 감소 측면에 유지 되는 해시 테이블을 통해 스트리밍됩니다. 최적화는 큰 차원 테이블을 여러 개의 작은 분리 된 차원 테이블로 나누고,이를 통해 이전 차원 테이블의 최적화를 크기에 맞게 조정할 수 있습니다.

. Hive 1과 Hive 2는 모두 Hive 서비스 아래에 있습니다. Hive 2를 사용 하도록 설정 하려면 “대화식 쿼리 사용 (기술 미리 보기)”을 선택 합니다. 또한 NameNode 및 JobTracker 단일 실패 지점을 제거 Hortonworks에서 사용할 HDP 높은 가용성 (HA) 키트도 있습니다. 초기 키트는 VMware의 vSphere (™) 플랫폼을 활용 하 여 네임 노드 및 JobTracker 서비스에 대 한 페일오버를 모니터링 하 고 자동화 하는 VM 기반 솔루션입니다. 당신이 볼 수 있듯이, LLAP는 극적인 성능 이득을 제공 합니다. Hive LLAP를 사용 하는 최소 쿼리 런타임은 Hive 1에서 9.58 초에 비해 단순한 1.3 초입니다. Hdfs-site 파일은 복제 데이터의 값, 네임 노드 경로 및 로컬 파일 시스템의 datanode 경로와 같은 정보를 포함 합니다.